利用python获取自己的qq群成员信息! 首先说明一下需要使用的工具以及技术:python3 + selenium selenium安装方法:pip install selenium 前提:获取自己的qq群成员信息,自己必须是群主或者管理员,然后通过管理页面进入到成员高级管理网页端,就可以对数据进行爬取了! 步骤: ①:首先安装环境 selenium库,selenium是一个自动化库,但是使用它必须用到浏览器驱动,不同的浏览器有不同的驱动,所以需自行下载,我这里是chrome浏览器. ②:运行…
利用python获取自己的qq群成员信息! 首先说明一下需要使用的工具以及技术:python3 + selenium selenium安装方法:pip install selenium 前提:获取自己的qq群成员信息,自己必须是群主或者管理员,然后通过管理页面进入到成员高级管理网页端,就可以对数据进行爬取了! 步骤: ①:首先安装环境 selenium库,selenium是一个自动化库,但是使用它必须用到浏览器驱动,不同的浏览器有不同的驱动,所以需自行下载,我这里是chrome浏览器. ②:运行…
# 1.获取到自己qq里面所有的群,并且保存每个群里面的群成员信息到mongodb里面# 下载每个群的群成员的头像# 1.抓包,抓到获取自己所有qq群的接口 requests模块 https://qun.qq.com/cgi-bin/qun_mgr/get_group_list bkn:1502099538 cookie:... # 2.拿到所有的群号,然后调用获取群信息的接口https://qun.qq.com/cgi-bin/qun_mgr/search_group_membersgc:57…
问题情境 昨天晚上回宿舍看到舍友在吐槽:天哪,我要把70多个人的QQ号全统计出来,只能一个一个地在咱们学院的学院群里找.吐了. 当时我第一反应是用python写个脚本之类的去做,因此查阅了一下资料,找到了提取群成员信息的途径. 方法 腾讯有一个QQ群管理功能(https://qun.qq.com/) 在该页面登录 按F12 点击console 在该页面下可以用js提取网页中的成员信息: var n=$('#groupMember .list tr.mb');var t='QQ\t\t\t昵称\t…
所用数据来自于之前的一篇博客: <QQ群成员发言次数统计(正则表达式版)> 链接:http://www.cnblogs.com/liyongzhao/p/3324026.html 1.首先导出数据到Y盘,存为demo.csv SAS程序如下: proc export data=rtf outfile="Y:\demo.csv" dbms=csv replace; putnames=yes; run; 2.将数据读入R R程序如下: demo<-data.frame(r…
昨天看到一条微博:「22 行 JavaScript 代码实现 QQ 群成员提取器」. 本着好奇心点击进去,发现没有达到效果,一是 QQ 版本升级了,二是博客里面的代码也有些繁琐. 于是自己试着写了一个,算上空行才 9 行,麻雀虽小,五脏俱全. var ids = document.querySelectorAll(".member_id"); var names = document.querySelectorAll(".member_name"); var out…
1.先将QQ群的消息记录以.txt文件格式导出来,保存路径及名称自己定义(在本文我导出到Y盘,命名为test.txt) 2.程序如下: data statistics1; if _n_=1 then do; patternid1=prxparse("/\s\w*-*\w*-*\w*\(\d+\)/"); patternid2=prxparse("/\(\d+\)/"); end; retain patternid1 patternid2; infile 'Y:\te…
有时我们在做精准营销时,需要从社群里提取群成员的QQ号,群发邮件,常规的做法是手工一个个复制粘贴,这样的效率无疑是很低的,下面我来分享一个批量获取社群的QQ号方法. 需要具备以下工具: 1.大量精准QQ群 2.Fiddler抓包工具 3.QQ号批量提取工具 1.大量精准的QQ群 QQ群,大家可以根据自己的营销行业去搜索目标群.随便加几个2000人的群就过万了.例如:我要查找“家具”行业的,一搜索一大堆. 2.Fiddler抓包工具 下载地址:https://www.telerik.com/dow…
#!/usr/bin/python #coding=utf8 log_file = "/usr/local/nginx/logs/access.log" with open(log_file) as f: contexts = f.readlines() # define ip dict### ip = {} # key为ip信息,value为ip数量(若重复则只增加数量) flow = {} # key为ip信息,value为流量总和 sum = 0 for line in cont…
最近一直在看KDD的论文,不过,由于老师并没有什么合理的方向性,所以考虑把kdd中的大部分内容都利用python将所有标题.摘要获取下来. 还有一个原因在于,看acm上的摘要,都只显示了两行,再看多点儿,就需要点击expand,觉得非常不爽,所以就用python脚本把html标签删掉.. 想到的方法自然是通过python利用正则表达式对ACM的KDD网页进行字符串匹配,获得相应的网页字符串,然后将所有html的标签删除(例如<div></div>等), 将这些标签删除之后,就能够得…
最近在学习 python 突然想要试试能不能把微信里面的微信群和好友取出来 结果百度了一下 找到了 wxpy 这怎么能不试一下呢 用到 wxpy.threading.os.time 四个库 第一步 判断文件夹是否存在 不存在则创建 if not os.path.exists('./info/' + wechat.myself.name): filepath = os.getcwd() os.makedirs(filepath + '/info/' + wechat.myself.name + '…
.加入某个群 .进入群空间http://qun.qzone.qq.com/group#!/25998059/member 备注:25998059为群号码 .进入群成员列表 .使用浏览,在某个群成员头像上面右击->审查元素,打开如下图所示的html代码 .如上图拷贝 .提取qq号码,以PHP为例 核心代码: $fileStr = file_get_contents(‘qqnumber.txt’); $qqNumberA = array(); preg_match_all(‘/\((.*)\)/iU…
#coding: utf-8 import itchat,datetime from itchat.content import TEXT itchat.auto_login(hotReload=True)#不需要重复扫码登录 class WeChat(object): def get_all_info_from_wechat(self): # itchat.auto_login(enableCmdQR = False) #获取群 roomslist = itchat.get_chatrooms…
相信小伙伴们都知道今冬以来范围最广.持续时间最长.影响最重的一场低温雨雪冰冻天气过程正在进行中.预计,今天安徽.江苏.浙江.湖北.湖南等地有暴雪,局地大暴雪,新增积雪深度4-8厘米,局地可达10-20厘米.此外,贵州中东部.湖南中北部.湖北东南部.江西西北部有冻雨.言归正传,天气无时无刻都在陪伴着我们,今天小编带大家利用Python网络爬虫来实现天气情况的实时采集. 此次的目标网站是绿色呼吸网.绿色呼吸网站免费提供中国环境监测总站发布的PM2.5实时数据查询,更收集分析关于PM2.5有关的一切报…
首先,你需要有一个CHROME浏览器其实,你要装一个叫REGEX SCRAPER的插件 在qun.qzone.qq.com打开你的QQ群页面-查看群成员 点击REGEX 插件, 粘贴上这个代码 text_overflow">([\S\s]*?)</a>[\S\s]*?class="member_id">\((\d+)\) 点击确定!当当当当,你看到啥了? 没错, 所有的群友昵称和Q号都赤果果地展示在你的面前了,还等什么? 点copy...然后爱粘贴到哪…
如何采集QQ群群员QQ号,采集QQ号,批量采集QQ号 众所周知,QQ群群员QQ号无法导出,即使会员也不可以,那我们只能通过三方工具来实现我们的要求,那今天我们讲讲如何通过火车采集器来采集QQ群群员QQ号. 使用工具 火车采集器 抓包工具 Fiddler QQ (轻聊版) 隐藏内容 采集准备 1.开启Fiddler代理 打开Fiddler软件,依次点击Tools – Options – Connections 设置代理端口:Fiddler listens on port : 8888 勾选:All…
一个集群包含若干成员,要对这些成员进行管理就必须要有一张包含所有成员的列表,当要对某个节点做操作时通过这个列表可以准确找到该节点的地址进而对该节点发送操作消息.如何维护这张包含所有成员的列表是本节要讨论的主题. 成员维护是集群的基础功能,一般划分一个独立模块或层完成此功能,它提供成员列表查询.成员维护.成员列表改变事件通知等能力.由于tribes定位于基于同等节点之间的通信,所以并不存在主节点选举的问题,它所要具备的功能是自动发现节点,即新节点加入要通知集群其他成员更新成员列表,让每个节点都能及…
一个集群包括若干成员,要对这些成员进行管理就必需要有一张包括全部成员的列表.当要对某个节点做操作时通过这个列表能够准确找到该节点的地址进而对该节点发送操作消息.怎样维护这张包括全部成员的列表是本节要讨论的主题. 成员维护是集群的基础功能,一般划分一个独立模块或层完毕此功能,它提供成员列表查询.成员维护.成员列表改变事件通知等能力. 因为tribes定位于基于同等节点之间的通信,所以并不存在主节点选举的问题,它所要具备的功能是自己主动发现节点,即新节点增加要通知集群其它成员更新成员列表,让每一个节…
1.通过urllib库,是python的标准库,不需要另外引入,直接看代码,注意代码的缩进: # coding=UTF-8import cookielibimport urllib2 class RyLogin(): """ 方法用于获取cookie: url:请求地址 data:请求参数 headers:需要设置的头部信息 cookieKey:需要获取的cookie的key """ def GetCookie(self, url, data,…
工作中有时候会有这种需求: 1. 自动配置组策略的安全基线,这个东西不用你自己写了,微软有这个工具,Microsoft Security Compliance Manager,你可以在下面的地址去下载和学习使用. technet.microsoft.com/library/cc677002.aspx 2. 但是有时候你可能需要自动化的获取服务器上的某些信息,如cpu啊,disk等,以及组策略中的相关设定,这个应该怎么去获取呢,是不是可以完全去访问注册表的值呢,但是貌似有些审核策略是没有注册表值的…
# coding=gbk import urllib.request import re import os import urllib def getHtml(url): #指定网址获取函数 page = urllib.request.urlopen(url) html = page.read() return html.decode('UTF-8') def getImg(html): #定义获取图片函数 reg = r'src="(.+?\.jpg)" pic_ext' imgr…
这里选择使用使用filetype获取文件的类型. 使用filetype之前,先用pip安装filetype. #!/usr/bin/python3 import filetype import argparse import sys def get_parameter(): parser=argparse.ArgumentParser(description='该脚本用于获取文件的类型') parser.add_argument('-f',dest='inputFile',type=str,de…
先贴出代码,行数比较少,仅仅用正则表达式分析出题目Title所在的标签并把题目Title提取出来 import urllib.request import re import dbm #定义URL,其中%d用于替换页码 url = 'http://acm.zju.edu.cn/onlinejudge/showProblems.do?contestId=1&pageNumber=%d' #连接持久化字典,这里用创建的方法'c'来创建写入 db = dbm.open('zoj_list', 'c')…
主题已迁移至:http://atiblogs.com/ ITO-神奇的程序员…
import sys funcName = sys._getframe().f_back.f_code.co_name #获取调用函数名 lineNumber = sys._getframe().f_back.f_lineno #获取行号 print sys._getframe().f_code.co_name # 获取当前函数名 import inspect def get_current_function_name(): return inspect.stack()[1][3] class…
在android上,我们可以使用QPython来编写.执行Python脚本.它对很多android 系统函数进行了方便的封装,使用QPython编写功能简单的小程序异常方便. 这个示例是我之前用来读取手机位置信息并作为进一步处理数据的基础脚本. # -*- coding: utf-8 -*- import androidhelper import time from math import radians droid = androidhelper.Android() droid.startSe…
#!/bin/bash mysqladmin -uroot -p'123456' extended-status -i1|awk 'BEGIN{local_switch=0;print "QPS Commit Rollback TPS Threads_con Threads_run \n------------------------------------------------------- "} $2 ~ /Queries$/ {q=$4-lq;lq=$4;} $2 ~ /Com…
var ids = document.querySelectorAll(".member_id"); var names = document.querySelectorAll(".member_name"); var output = "", length = ids.length; for(var i=0; i<length; i++){output += ids[i].innerHTML.slice(1,-1) + ":&q…
主题已迁移至:http://atiblogs.com/ ITO-神奇的程序员…
主题已迁移至:http://atiblogs.com/ ITO-神奇的程序员…