所用数据来自于之前的一篇博客: <QQ群成员发言次数统计(正则表达式版)> 链接:http://www.cnblogs.com/liyongzhao/p/3324026.html 1.首先导出数据到Y盘,存为demo.csv SAS程序如下: proc export data=rtf outfile="Y:\demo.csv" dbms=csv replace; putnames=yes; run; 2.将数据读入R R程序如下: demo<-data.frame(r…
1.先将QQ群的消息记录以.txt文件格式导出来,保存路径及名称自己定义(在本文我导出到Y盘,命名为test.txt) 2.程序如下: data statistics1; if _n_=1 then do; patternid1=prxparse("/\s\w*-*\w*-*\w*\(\d+\)/"); patternid2=prxparse("/\(\d+\)/"); end; retain patternid1 patternid2; infile 'Y:\te…
利用python获取自己的qq群成员信息! 首先说明一下需要使用的工具以及技术:python3 + selenium selenium安装方法:pip install selenium 前提:获取自己的qq群成员信息,自己必须是群主或者管理员,然后通过管理页面进入到成员高级管理网页端,就可以对数据进行爬取了! 步骤: ①:首先安装环境 selenium库,selenium是一个自动化库,但是使用它必须用到浏览器驱动,不同的浏览器有不同的驱动,所以需自行下载,我这里是chrome浏览器. ②:运行…
昨天看到一条微博:「22 行 JavaScript 代码实现 QQ 群成员提取器」. 本着好奇心点击进去,发现没有达到效果,一是 QQ 版本升级了,二是博客里面的代码也有些繁琐. 于是自己试着写了一个,算上空行才 9 行,麻雀虽小,五脏俱全. var ids = document.querySelectorAll(".member_id"); var names = document.querySelectorAll(".member_name"); var out…
有时我们在做精准营销时,需要从社群里提取群成员的QQ号,群发邮件,常规的做法是手工一个个复制粘贴,这样的效率无疑是很低的,下面我来分享一个批量获取社群的QQ号方法. 需要具备以下工具: 1.大量精准QQ群 2.Fiddler抓包工具 3.QQ号批量提取工具 1.大量精准的QQ群 QQ群,大家可以根据自己的营销行业去搜索目标群.随便加几个2000人的群就过万了.例如:我要查找“家具”行业的,一搜索一大堆. 2.Fiddler抓包工具 下载地址:https://www.telerik.com/dow…
利用python获取自己的qq群成员信息! 首先说明一下需要使用的工具以及技术:python3 + selenium selenium安装方法:pip install selenium 前提:获取自己的qq群成员信息,自己必须是群主或者管理员,然后通过管理页面进入到成员高级管理网页端,就可以对数据进行爬取了! 步骤: ①:首先安装环境 selenium库,selenium是一个自动化库,但是使用它必须用到浏览器驱动,不同的浏览器有不同的驱动,所以需自行下载,我这里是chrome浏览器. ②:运行…
如何采集QQ群群员QQ号,采集QQ号,批量采集QQ号 众所周知,QQ群群员QQ号无法导出,即使会员也不可以,那我们只能通过三方工具来实现我们的要求,那今天我们讲讲如何通过火车采集器来采集QQ群群员QQ号. 使用工具 火车采集器 抓包工具 Fiddler QQ (轻聊版) 隐藏内容 采集准备 1.开启Fiddler代理 打开Fiddler软件,依次点击Tools – Options – Connections 设置代理端口:Fiddler listens on port : 8888 勾选:All…
问题情境 昨天晚上回宿舍看到舍友在吐槽:天哪,我要把70多个人的QQ号全统计出来,只能一个一个地在咱们学院的学院群里找.吐了. 当时我第一反应是用python写个脚本之类的去做,因此查阅了一下资料,找到了提取群成员信息的途径. 方法 腾讯有一个QQ群管理功能(https://qun.qq.com/) 在该页面登录 按F12 点击console 在该页面下可以用js提取网页中的成员信息: var n=$('#groupMember .list tr.mb');var t='QQ\t\t\t昵称\t…
首先,你需要有一个CHROME浏览器其实,你要装一个叫REGEX SCRAPER的插件 在qun.qzone.qq.com打开你的QQ群页面-查看群成员 点击REGEX 插件, 粘贴上这个代码 text_overflow">([\S\s]*?)</a>[\S\s]*?class="member_id">\((\d+)\) 点击确定!当当当当,你看到啥了? 没错, 所有的群友昵称和Q号都赤果果地展示在你的面前了,还等什么? 点copy...然后爱粘贴到哪…
# 1.获取到自己qq里面所有的群,并且保存每个群里面的群成员信息到mongodb里面# 下载每个群的群成员的头像# 1.抓包,抓到获取自己所有qq群的接口 requests模块 https://qun.qq.com/cgi-bin/qun_mgr/get_group_list bkn:1502099538 cookie:... # 2.拿到所有的群号,然后调用获取群信息的接口https://qun.qq.com/cgi-bin/qun_mgr/search_group_membersgc:57…
.加入某个群 .进入群空间http://qun.qzone.qq.com/group#!/25998059/member 备注:25998059为群号码 .进入群成员列表 .使用浏览,在某个群成员头像上面右击->审查元素,打开如下图所示的html代码 .如上图拷贝 .提取qq号码,以PHP为例 核心代码: $fileStr = file_get_contents(‘qqnumber.txt’); $qqNumberA = array(); preg_match_all(‘/\((.*)\)/iU…
var ids = document.querySelectorAll(".member_id"); var names = document.querySelectorAll(".member_name"); var output = "", length = ids.length; for(var i=0; i<length; i++){output += ids[i].innerHTML.slice(1,-1) + ":&q…
主题已迁移至:http://atiblogs.com/ ITO-神奇的程序员…
主题已迁移至:http://atiblogs.com/ ITO-神奇的程序员…
主题已迁移至:http://atiblogs.com/ ITO-神奇的程序员…
主题已迁移至:http://atiblogs.com/ ITO-神奇的程序员…
本文结构: 一.那些年我们加过的QQ群 二.数据读入和整理(一)--来自蓝翔的挖掘机 二.数据读入和整理(二)--你不知道的事 三.聊天宏观(1)--寤寐思服 三.聊天宏观(2)日月篇 三.聊天宏观(3)七曜篇 四.聊天微观(1)--黄金档和午夜频道 四.聊天微观(2)--充电两小时聊天五分钟 四.聊天微观(3)--幸存者偏差和沉默的羔羊 五.昵称(1)--我们曾经的非主流 五.昵称(2)--所爱隔山海 六.内容分词--爱在心口难开,你我之间隔了正无穷个表情包 好吧,我的来捣乱的,原谅我瞎取名字…
首先安装pip install uiautomation, 运行本文代码.或者下载https://github.com/yinkaisheng/Python-UIAutomation-for-Windows代码(包含了uiautomation module),直接运行demos目录里的脚本get_qq_group_members.py uiautomation.py是我写的一个python封装微软UIAutomation API的一个module,使用非常简单运行automation.py -h…
一,分析 1,群数据获取 当访问http://qun.qq.com/air/#mygroup我们通过Fiddler可以查看到QQ群列表是从http://qun.qq.com/air/group/mine?w=a这个URL获取到的群列表信息 其中返回的json数据,json构成如下 从上面我们可以看出c包含的是群列表信息,r包含的是服务器的信息,其中c的某一项构成如下图所示…
2018年3月21日  课题组管理就如qq的群是一样的,课题组有课题组组长:qq群有群主:课题组有组员:qq群有群人员 对于一个课题组来说,组长可以对课题组进行修改,组员只能看得见,但是不能修改.所以对于表间关系应该是什么样的呢? 下面是我创建的课题组信息表的结构 课题组这块共有两大功能 1.对课题组的管理 2.对课题组成员的管理 下面给出课题组管理功能展现 如图所示,任何一个人现在都可以创建课题组,但肯定会有创建课题组数目的限制. 对于课题组成员管理,我们应该把这个课题组成员以什么方式存储呢?…
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: python小爬虫 PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 http://note.youdao.com/noteshare?id=3054cce4add8a909e784ad934f956cef 效果图,其中涉及一些真名我就打码了,还有qq号我也打码了,见谅 分析登陆的元素,下图一目了然,怎么获取这个登陆元素应该都知道了 代码奉上…
准备工作: 将运行Scala-Eclipse的机器节点(CloudDeskTop)内存调整至4G,因为需要在该节点上跑本地(local)Spark程序,本地Spark程序会启动Worker进程耗用大量内存资源 其余准备工作可参考:scala程序开发之单词出现次数统计(本地运行模式) 1.启动Spark集群 [hadoop@master01 install]$ cat start-total.sh #!/bin/bash echo "请首先确认你已经切换到hadoop用户" #启动zoo…
安装Google Chrome浏览器 安装Google插件:Regex Scraper 在群成员页面点击Regex 插件, 粘贴上这个代码 text_overflow">([\S\s]*?)</a>[\S\s]*?class="member_id">\((\d+)\) 点击应用即可获取 text_overflow">([\S\s]*?)</a>[\S\s]*?class="member_id">\(…
1.获取数据 从 QQ 消息管理器中导出消息记录,保存的文本类型选择 txt 文件.这里获取的是某群从 2016-04-18 到 2016-05-07 期间的聊天记录,记录样本如下所示. 消息记录(此消息记录为文本格式,不支持重新导入) ================================================================ 消息分组:我的QQ群 =======================================================…
标题:第一次QQ群视频教育有感 作者:丁又专, 时间:2014.08.16     教育的目的:启示学生心智,发现个人优势,激发探索欲望.     今天早上看到 中国大学MOOC<文献管理与信息分析>(http://www.icourse163.org/course/ustc-9002#/info) 课程团队的邮件,下午与明天有一次课程在线分享.一直非常想尝试一下QQ群视频的功能,这次恰好是一个机会,也让自己第一次近距离的接触了多人在线视频交流.     在一个半小时的交流中,发现QQ群视频有…
分享一下SQLSERVER技术交流QQ群里的群共享资源 SQLSERVER技术交流QQ群已经开了一段时间了,人数已经有了100多号人, 而群里面很多SQLSERVER爱好者上传了他们宝贵的SQLSERVER学习资料给QQ群里面的每个成员, 不过我个人觉得这些宝贵的学习资源应该让更多人享受得到,不应该只留在QQ群里的群成员, 所以我特意把这些资源全部下载下来,然后放到金山快盘,共享这些资源让大家去下载,有好东西当然是大家一起分享啦o(∩_∩)o !! 里面有一些非常好的SQLSERVER pdf格…
接口一: 1:QQ群信息统计 地址:http://localhost:8080/webServices/messageSort 注意:连接地址提交的是一个txt文件,返回是一个list的json字符串,解释json字符串网上例子很多,请自行解释. 2:接口实例: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-tr…
转:https://github.com/jsfront/src/blob/master/qq.md 这本来是我QQ群内部的一份公共约定的日常交流规则,后来得到大伙的一致认可,并用实际行动来捍卫它,使我倍受感动. 后来想:传播使爱更有力量,阅读使内心更为坚强,沉淀使生活更为醇香,分享使人更为谦卑或快乐.因为快乐,所以分享. 知识资源来源于互联网,应该返回给互联网,使看到的每一个人受益,也可以供其它各个行业的群主参考. 规则会不断的修改调整,你不在是一个受益者,更是一个项目参与者内容规则的创造者,…
工具: Mac/Linux 系统 Chrome Linux命令:vi.cat. wc. grep. awk. sed.sort. uniq 步骤: 1.微信网页版登陆: https://wx.qq.com/ 2.选择群成员的HTML code区域: alt + command + i  进入 编辑所有群成员的区域 Edit as HTML 拷贝内容 3.粘贴到vi 里面,使用三剑客进行处理: 将粘贴的文件创建文件名为1: vi 1 cat 1 | wc -l 这个文件行数,一般是群成员*4 去掉…
在文本分类任务中,语料的特性千差万别,我们需要找到适合模型并抓住数据的特性,最终才能得到较好的model.最近在文本类别标注任务,就是给文本打标签确定该文本的类别.这是一个很费人工的过程,需要认真仔细,因为我们都知道有多少人工就有多少智能. 微信.QQ短文本: (1)如何分段 聊天文本的边界是无法确定的,那我们如何截取一个群聊的文本作为我们的一个训练样本呢.目前初步的做法是:首先约定字数,达到多少文字我们就认定可以是一个样本段落:同时加入聊天时间作为辅助标准,某一时间间隔的数据可以作为一个样本.…