hadoop streaming 中跑python程序，自定义模块的导入

今天在做代码重构，以前将所有python文件放到一个文件夹下，上传到hadoop上跑，没有问题；不过随着任务的复杂性增加，感觉这样甚是不合理，于是做了个重构，建了好几个包存放不同功能的python文件，历程如下：

1. 刚开始的时候，在IDE里搞，点击运行，正确、非常赞；

2. 然后搬到服务器上搞，出现了这样的问题：

ImportError: no module named XXX

啊，看样子是包引用中路径不对，于是找文章解决：

　　python中，每个py文件被称之为模块，每个具有__init__.py文件的目录被称为包。只要模
块或者包所在的目录在sys.path中，就可以使用import 模块或import 包来使用
如果你要使用的模块（py文件）和当前模块在同一目录，只要import相应的文件名就好，比
如在a.py中使用b.py：
import b

但是如果要import一个不同目录的文件(例如b.py)该怎么做呢？
首先需要使用sys.path.append方法将b.py所在目录加入到搜素目录中。然后进行import即
可，例如

import sys
import os
curPath = os.path.abspath(os.path.dirname(__file__))
rootPath = os.path.split(curPath)[0]
sys.path.append(rootPath)

第一个问题解决，高兴！

3. 而后尝试在hadoop-streaming上跑程序，额，一直在报错：

ImportError: no module named XXX

心想也是因为这个路径问题，试了很多种方法：

　　后来在stackoverflow发现有人问了同样的问题，并且我使用其中一个方案解决了:

When Hadoop-Streaming starts the python scripts, your python script's path is where the script file really is. However, hadoop starts them at './', and your lib.py(it's a symlink) is at './', too. So, try to add 'sys.path.append("./")' before you import lib.py like this:

import sys

sys.path.append('./')

import lib
当Hadoop-Streaming启动python脚本时，您的python脚本的路径就是脚本文件的实际位置。 然而，hadoop以'./'开头，lib.py（它是一个符号链接）也在'./'。 因此，在导入lib.py之前，尝试添加“sys.path.append（”./“）”“。 import sys sys.path.append('./') import lib

并且导入模块和包时，不能用 from XXX import YYY的方式做了，必须要用 import XXX， 使用YYY的时候，要用XXX.YYY来调用；反复尝试终于发现了这点。也算没白费时间吧。

hadoop streaming 中跑python程序，自定义模块的导入的更多相关文章

【转】C++中嵌入python程序——参数传递
C++中嵌入python程序——参数传递前面两篇博客已经介绍如何在C++中嵌套使用 python,但是在实际使用中,我们需要向python传递各种各样的参数,这样的程序才具有更高的灵活性.下面简单介 ...
Windows系统中设置Python程序定时运行方法
Windows系统中设置Python程序定时运行方法一.环境 win7 + Python3.6 二.步骤 1,在Windows开始菜单中搜索“计划任务”,并且点击打开“计划任务”: 2.点击“创建基 ...
what's the python之自定义模块和包
模块自定义上节说了有关模块的知识,当时所说的模块都是内置模块,现在来看自己定制的模块,即模块也可以自定义. 模块的自定义就是指写一段python文件,一般情况下里面包含了可执行的语句和函数的定义,其 ...
python基础--自定义模块、import、from......import......
自定义模块.import.from......import...... 1)模块的定义和分类 1.模块是什么? 我们知道一个函数封装了一个功能,软件可能是有多个函数组成的.我们说一个函数就是一个功能, ...
Python 模块化自定义模块（四）
自定义模块一个.py文件就是一个模块创建以下三个文件: 运行test.py ,查看运行结果. #test.py print("this is test module") imp ...
python程序的模块与包
python的程序是由模块组成的,一个python文件就是一个模块,而模块一般由代码,函数,或者类组成.创建baiduHq.py模块(文件),在该模块中编写变量,函数,类,来说明在一个模块中,变量的输 ...
17.python自定义模块的导入方式
1.直接用import导入最后运行main.py可以看到命令行窗口输出了一句:你好,这样就完成了. 2.通过sys模块导入自定义模块的路径path 3.在环境变量中找到自定义模块这个方法原理就是利 ...
执行Python程序时模块报错
1. 在执行python程序时遇到 'ModuleNotFoundError: No module named 'xxxxx'' : 例如: 图片中以导入第三方的 'requests' 模块为例,此报 ...
【python之路2】CMD中执行python程序中文显示乱码
在IDLE中执行下面代码,中文显示正常: # -*- coding:utf-8 -*- st=raw_input("请输入内容")print st 但在CMD中执行e:\hello ...

随机推荐

imp 导入以及换用户报错
数据库导入操作:SQL> create user user identified by passwd; SQL> create tablespace user datafile '/dat ...
C# 广告
新建一个XML页面,设置属性选择架构,勾选下面的目标,确定即可添加广告广告模板: <?xml version="1.0" encoding="utf-8&quo ...
ssl握手数据结构
ssl握手 SSL记录头(5字节) 字节0:记录内容的类型 Content Type Hex Code Description Change_Cipher_Spec 0x14 指示加密方式的更改 Al ...
未来-区块链-Aliyun：阿里云IoT - 所知不止于感知
ylbtech-未来-区块链-Aliyun:阿里云IoT - 所知不止于感知 1.返回顶部 1. 基础产品接入设备接入设备管理数据分析应用开发网络管理边缘计算设备认证安全运营 AliO ...
php预定义常量
<?php echo "当前文件路径: ".__FILE__; echo "<br/>当前行数:".__LINE__; echo " ...
C#6.0新语法
.自动属性初始化的改进(有用) 原来的用法(声明时无法同时初始化),例如: class MyClass { public int Age { get; set; } public string Nam ...
mvcmovie sample 在window10 下的部署问题（HTTP Error 500.19 - Internal Server Error）
mvcmovie sample 在window10 下的部署问题使用VS2018配置好了mvcmovie sample,发布到IIS后,打开报错: HTTP Error 500.19 - Inter ...
web socket server code, 调用 shell exec child_process
var child_process = require('child_process'); var ws = require("nodejs-websocket"); consol ...
Exp5 MSF基础应用 20164313 杜桂鑫
1. 实践目标本实践目标是掌握metasploit的基本应用方式,重点常用的三种攻击方式的思路.具体需要完成: 1.1一个主动攻击实践,如ms08_067; (1分) 1.2 一个针对浏览器的攻击, ...
Akka详细介绍
AKKA NOTES - 介绍演员任何在过去做过多线程的人都不会否认管理多线程应用程序有多么困难和痛苦.我说管理因为它开始很简单,一旦你开始看到性能改进,它变得非常有趣.但是,当您发现没有更简单的方 ...

hadoop streaming 中跑python程序，自定义模块的导入

hadoop streaming 中跑python程序，自定义模块的导入的更多相关文章

随机推荐

热门专题