#通过zookpeer找到对应的hive from kazoo.client import KazooClient zkClient = KazooClient(hosts="ip1:2181,ip2:2181") zkClient.start() result = zkClient.get_children('/mynode') # znodename对应的值 zkClient.stop() print(result) # ['serverUri=IP1:10000;version=…
最近刚接触python,找点小任务来练练手,希望自己在实践中不断的锻炼自己解决问题的能力. 公司里会有这样的场景:有一张电子表格的内容由两三个部门或者更多的部门用到,这些员工会在维护这些表格中不定期的跟新一些自己部门的数据,时间久了,大家的数据就开始打架了,非常不利于管理.怎样快速找到两个或者多个电子表格中数据的差异呢? 解决办法: 1.Excel自带的方法(有兴趣的自行百度) 2.python 写一个小脚本 #!/usr/bin/env python # -*- coding: utf-8 -…
题目描述: 一个数组里,除了三个数是唯一出现的,其余的数都出现了偶数次,找出这三个数中任意一个.比如数组序列为[1,2,4,5,6,4,2],只有1.5.6这三个数字是唯一出现的,数字2.4均出现了偶数次,只需要输出数字1.5.6中的任意一个就行. 分析: 题目得出的信息: (1)数组中的元素一定为奇数个: (2)由于只有三个数字均出现过一次,显然这三个数字不相同,因此,这三个数字对应的二进制也不可能完全相同. 解题思路: 因此可知:必定能找到二进制数中的某一个bit来区分这三个数(这一个bit…
#接口返回值 list1 = ['张三', '李四', '王五', '老二'] #数据库返回值 list2 = ['张三', '李四', '老二', '王七'] a = [x for x in list1 if x in list2] #两个列表表都存在 b = [y for y in (list1 + list2) if y not in a] #两个列表中的不同元素 print('a的值为:',a) print('b的值为:',b) c = [x for x in list1 if x no…
在list列表中,max(list)可以得到list的最大值,list.index(max(list))可以得到最大值对应的索引 但在numpy中的array没有index方法,取而代之的是where,其又是list没有的 首先我们可以得到array在全局和每行每列的最大值(最小值同理) a = np.arange(9).reshape((3,3)) a array([[0, 1, 2], [9, 4, 5], [6, 7, 8]]) print(np.max(a)) #全局最大 8 print…
思路 一.把需要进行比较的元素取出来组装成一个list 二.利用python函数,从list中找出重复函数 python函数: from collections import Counter #引入Countera = [11233,11233,44444,32311]b = dict(Counter(a))print ({key:value for key,value in b.items()if value> 1}) #展现重复元素和重复次数 robot  robotframework: #…
阅读OReilly.Web.Scraping.with.Python.2015.6笔记---找出网页中所有的href 1.查找以<a>开头的所有文本,然后判断href是否在<a>里面,如果<a>里面有href,就像<a href=" " >,然后提取href的值. from urllib.request import urlopen from bs4 import BeautifulSoup html = urlopen("ht…
http://bbs.chinaunix.net/thread-1680208-1-1.html 如何找出 python list 中有重复的项 http://www.cnblogs.com/feisky/archive/2012/12/06/2805251.html 比较容易记忆的是用内置的setl1 = ['b','c','d','b','c','a','a']l2 = list(set(l1))print l2 还有一种据说速度更快的,没测试过两者的速度差别l1 = ['b','c','d…
用python连接zookeeper时,在终端里,一直会有zookeeper的日志冒出来,这样会很烦. -- ::,:(: Exceeded deadline by 11ms 解决方法是在连接后设置一下zookeeper的日志等级为ERROR,这样WARN的日志就不会弹出来了 import zookeeper zookeeper.set_debug_level(zookeeper.LOG_LEVEL_ERROR) #设置zookeeper的日志等级 因为zookeeper模块是一个编译好的c文件…
使用python找出nginx访问日志中访问次数最多的10个ip排序生成网页 方法1:linux下使用awk命令 # cat access1.log | awk '{print $1" "$7" "$9}'|sort -n|uniq -c |sort -n -r|head -10 方法2:通过python处理日志 #encoding=utf-8 # 找到日志中的top 10,日志格式如下 #txt = '''100.116.167.9 - - [22/Oct/201…