最近写python写的尤其不顺利,更多的debug,逐渐的深入,产出却比较少。应该是个瓶颈期,坚持坚持,厚着脸皮也要坚持下去。

0x00 拷贝问题

程序中涉及到多进程和协程,大致的模型是开了2+个进程,每个进程里再开协程(提高多核CPU利用率)。又因为Python的multiprocessing和gevent是对头,某些东西不兼容(比如gevent和multiprocessing.Manager不能同时出现),所以虽然每个进程中做的操作(弱口令扫描)类似,结果存储以及进度方面都是在各个进程里完成的。于是就有了这样的代码:

def process_run():
pool = Pool(3) for count in range(4):
pool.apply_async(gevent_run, args(,)) pool.close()
pool.join() def gevent_run():
num_count = 0
pool = Pool(150) for count in range(500):
pool.add(gevent.spawn(verify_and_count, num_count)) pool.join() def verify_and_count(count):
if poc.verify():
count += 1 if count % 100 == 0:
print"Progress: %d/%d" % (count, all_count)

可以看到我在gevent_run函数里声明了一个num_count变量用于计数(当前扫描进度),也就是为每个进程都申请了一个这样的变量。但是在实际运行的时候,发现并没有输出进度信息,排查后发现count始终为0。

之前在一篇文章里看过Python的拷贝问题,在List和dict的时候,直接传参或者赋值是不会改变对应的变量在内存中的位置的,比如:

>>> a = [1,2,4]
>>> id(a)
42176920
>>> b = a
>>> id(b)
42176920

但是理解有些错误,以为所有的赋值都不会改变。实际上,如果=的右侧是一个新的变量的话,也会创建全新的内存空间,无论是int还是list:

>>> a = [1,2,4]
>>> id(a)
42176920
>>> b = a
>>> id(b)
42176920
>>> a = a + [2,3]
>>> a
[1, 2, 4, 2, 3]
>>> id(a)
42214744

最后解决这个问题,还是用到了list局部赋值,不会改变list本身位置的特点:

>>> a = [0]
>>> id(a)
42214744
>>> id(a[0])
14514580
>>> a[0] += 1
>>> id(a)
42214744
>>> id(a[0])
14514568

0x10 多进程和类对象的问题

class test():
def bb(self, a):
print a def run(self):
pool = Pool(processes=2) for count in range(4):
pool.apply_async(self.bb, args=(count,)) pool.close()
pool.join()

程序看起来没什么问题,但是在实际执行的时候,并没有调用bb函数。但如果是调用非成员函数,就没什么问题。后来同事给出了解决方法:

class test():
def bb(self, a):
print a def run(self):
pool = Pool(processes=2) for count in range(4):
pool.apply_async(self.bb()) pool.close()
pool.join()

看起来是解决了问题,但实际上并没有用到multiprocessing,直接变成了循环函数。后来查了一下资料,得出的结论:

Python2.7 多进程multiprocessing使用的pipe传递方法,实现用的是C pickle_dumpsm,这种方式不支持 instance method 传递。
所以,最一开始的传递方式无效,实际是因传递失败:子进程不会进行检查即不会报错,母进程作为僵尸等待,而子进程无效停止造成母进程结束退出。

http://stackoverflow.com/questions/14169550/how-to-use-multiprocessing-with-class-instances-in-python

http://stackoverflow.com/questions/27318290/why-can-i-pass-an-instance-method-to-multiprocessing-process-but-not-a-multipro

最后的解决方法,是把多进程和协程的调度函数放在了类外,这也应该是多进程和类掺和到一块儿的时候,正确的解决办法了吧。

0x20 VMware虚拟机 网络失效 解决方案

今天NAT的网络上不去了,纠结了两个小时,试了很多方案,最后也不知道是哪个起作用了。干脆总结个方法:

1) 我的电脑 - 右键 - 管理 - windows服务 : 开启所有vmware相关的服务,已经开启的重新启动。另外还要开启windows installer。

2) 虚拟机 - 网络首选项 - 恢复默认设置

3) 对应的虚拟机 - 删除原有网卡 - 添加新网卡

4) 删除/etc/network/interfaces里的内容,重新启动网卡

Python拷贝及多进程与类的问题的更多相关文章

  1. Python中使用多进程来实现并行处理的方法小结

    进程和线程是计算机软件领域里很重要的概念,进程和线程有区别,也有着密切的联系,先来辨析一下这两个概念: 1.定义 进程是具有一定独立功能的程序关于某个数据集合上的一次运行活动,进程是系统进行资源分配和 ...

  2. python 多线程和多进程

    多线程与多进程 知识预览 一 进程与线程的概念 二 threading模块 三 multiprocessing模块 四 协程 五 IO模型 回到顶部 一 进程与线程的概念 1.1 进程 考虑一个场景: ...

  3. python高级之多进程

    python高级之多进程 本节内容 多进程概念 Process类 进程间通讯 进程同步 进程池 1.多进程概念 multiprocessing is a package that supports s ...

  4. 第八篇:python高级之多进程

    python高级之多进程   python高级之多进程 本节内容 多进程概念 Process类 进程间通讯 进程同步 进程池 1.多进程概念 multiprocessing is a package ...

  5. 搞定python多线程和多进程

    1 概念梳理: 1.1 线程 1.1.1 什么是线程 线程是操作系统能够进行运算调度的最小单位.它被包含在进程之中,是进程中的实际运作单位.一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发 ...

  6. python服务端多进程压测工具

    本文描述一个python实现的多进程压测工具,这个压测工具的特点如下: 多进程 在大多数情况下,压测一般适用于IO密集型场景(如访问接口并等待返回),在这种场景下多线程多进程的区分并不明显(详情请参见 ...

  7. python 面向对象进阶之元类metaclass

    一:知识储备 exec exec:三个参数 参数一:字符串形式的命令 参数二:全局作用域(字典形式),如果不指定,默认为globals() 参数三:局部作用域(字典形式),如果不指定,默认为local ...

  8. python多线程和多进程

    1 概念梳理: 1.1 线程 1.1.1 什么是线程 线程是操作系统能够进行运算调度的最小单位.它被包含在进程之中,是进程中的实际运作单位.一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发 ...

  9. python多线程与多进程--存活主机ping扫描以及爬取股票价格

    python多线程与多进程 多线程: 案例:扫描给定网络中存活的主机(通过ping来测试,有响应则说明主机存活) 普通版本: #扫描给定网络中存活的主机(通过ping来测试,有响应则说明主机存活)im ...

随机推荐

  1. #if...#endif的用法总结

    在写到  pwm音阶程序的时候,在代码中有#if...#endif的用法问题,相关音阶的代码如下: /************************************************* ...

  2. 【STL】全排列生成算法:next_permutation

    C++/STL中定义的next_permutation和prev_permutation函数是非常灵活且高效的一种方法,它被广泛的应用于为指定序列生成不同的排列. next_permutation函数 ...

  3. hdu 4604 动态规划

    思路:这题的感觉就是最长上升子序列的升级版.首先对于最长上升子序列要用n*log(n)的算法才行,这个复杂度的算法可以从hdu1025得到启发.然后就是什么情况下最优问题了.对于序列中某个数i,找出其 ...

  4. Android中更新视图的函数onDraw()和dispatchdraw()函数的区别

    Android的view组件显示主要经过mesure, layout和draw这三个过程.在mesure阶段里调用mesure(int widthSpec, int heightSpec)方法,这个方 ...

  5. Sublime Text3 包管理器、插件安装

    安装插件之前先要安装包管理器,包管理器的安装也很简单,复制粘贴对应版本命令代码回车即可 一.包管理器安装 1.打开Sublime3控制台,按ctrl+~ 2.输入安装包管理器命令行代码 3.注意需要联 ...

  6. 用VS2015打开cshtml识图文件的时候会报错 如指定的文件不存在

    用vs2015打开cshtml识图文件的时候会报错.百度后得到解决方法如下: 先关闭VS2015, 拷贝:%LocalAppData%\Microsoft\VisualStudio\14.0\Comp ...

  7. 如何更好的理解(pageX,pageY,clientX,clientY,eventX,eventY,scrollX,scrollY,screenX,screenY,event.offsetX,event.offsetY,offsetLeft,style.left)

    1 pageX,pageY:鼠标指针相对于当前窗口的X,Y坐标,计算区域包括窗口自身的控件和滚动条.(火狐特有) 2 event.clientX,event.clientY:鼠标指针相对于当前窗口的X ...

  8. windows下cmd命令行显示UTF8字符设置(CHCP命令)

    本文由 www.169it.com 收集整理 在中文Windows系统中,如果一个文本文件是UTF-8编码的,那么在CMD.exe命令行窗口(所谓的DOS窗口)中不能正确显示文件中的内容.在默认情况下 ...

  9. 个人实验记录之EIGRP基本配置

    一.EIGRP的基本配置 1(1).进入接口配置IP R1(config)#inter s1/0 R1(config-if)#ip address 200.1.1.1 255.255.255.0 R1 ...

  10. 基于MRG_MyISAM引擎的Mysql分表

    正常情况下的分表,都是直接创建多个相同结构的表,比如table_1.table_2...最近碰到一个特殊需求,需要创建一个主表,所有分表的数据增删改查,全部自动实时更新到主表,这个时候可以使用MRG_ ...