我有一个在Centos 7上运行的Hadoop集群。我正在运行一个程序(坐在HDFS上)以提取推文,为此我需要导入tweepy。我在群集的所有节点上都将pip install tweepy
作为root
进行了操作,但是在运行该程序时仍然出现导入错误。
错误提示:ImportError: No module named tweepy
我确定已安装Tweepy,因为pip freeze | grep "tweepy"
返回tweepy==3.5.0
。
我在x.py
文件夹中仅创建了一行import tweepy
,创建了另一个文件/tmp
,该文件运行没有错误。仅在HDFS上发生错误。
另外,我的默认python是我使用Anaconda安装的Python 2.7.12。有人可以帮我解决这个问题吗?同一代码在Centos 6.6上运行的另一个群集上运行时没有任何此类错误。这是操作系统问题吗?还是我必须研究集群?
最佳答案
看起来您正在使用Anaconda的Python运行脚本,但是您使用tweepy
将pip
安装到了CentOS的Python系统安装中。使用conda
安装tweepy
,或使用Anaconda的pip
可执行文件将tweepy
安装到Hadoop集群上。
关于python-2.7 - 在Centos 7上运行的HDFS上的Tweepy导入错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39045825/