python-2.7 - 在Centos 7上运行的HDFS上的Tweepy导入错误

标签 python-2.7 hadoop hdfs tweepy centos7

我有一个在Centos 7上运行的Hadoop集群。我正在运行一个程序(坐在HDFS上)以提取推文,为此我需要导入tweepy。我在群集的所有节点上都将pip install tweepy作为root进行了操作,但是在运行该程序时仍然出现导入错误。

错误提示:ImportError: No module named tweepy
我确定已安装Tweepy,因为pip freeze | grep "tweepy"返回tweepy==3.5.0

我在x.py文件夹中仅创建了一行import tweepy,创建了另一个文件/tmp,该文件运行没有错误。仅在HDFS上发生错误。

另外,我的默认python是我使用Anaconda安装的Python 2.7.12。有人可以帮我解决这个问题吗?同一代码在Centos 6.6上运行的另一个群集上运行时没有任何此类错误。这是操作系统问题吗?还是我必须研究集群?

最佳答案

看起来您正在使用Anaconda的Python运行脚本,但是您使用tweepypip安装到了CentOS的Python系统安装中。使用conda安装tweepy,或使用Anaconda的pip可执行文件将tweepy安装到Hadoop集群上。

关于python-2.7 - 在Centos 7上运行的HDFS上的Tweepy导入错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39045825/

相关文章:

python - 仅使用数字 `matrix[:,mask]` 和 `matrix[mask,:]` 将 `0` 转置为 `1` ?

python - 将 Python DateTime 字符串转换为整数毫秒

hadoop - yarn Hadoop运行缓慢

hadoop - 执行start-dfs.sh未能启动hdfs守护程序

hadoop - crontab 作业未执行

django - Tweepy 速率限制/分页问题。

python - 在Python中导入外部模块的最佳实践

rest - WebHDFS在Hortonworks中给出错误

hdfs - Java HDFS 客户端在附加时收到 "is already the current lease holder"错误

python - 使用pyarrow时无法加载libhdfs