摘要:分享个​ Python 神工具.​ 长时间使用浏览器会积累大量浏览器历史记录,这些是很隐私的数据,里面甚至可能有一些不可描述的网站或者搜索记录不想让别人知道. 不过,我们自己可能会感兴趣,天天上网是都在摸鱼还是有认真工作.其次,了解下自己每天打开多少次网页.哪些网站上的最多.常搜哪些关键词,这些也很有趣. 下面就来给大家介绍一款 Python 编写的神工具,可以一键分析你的上网行为.我用了后发现了很多不可思议的结论. 比如访问次数最多的网站居然是微信公众号,7000 多次,看来弄自媒体占了…
Python分析离散心率信号(下) 如何使用动态阈值,信号过滤和离群值检测来改善峰值检测. 一些理论和背景 到目前为止,一直在研究如何分析心率信号并从中提取最广泛使用的时域和频域度量.但是,使用的信号是理想的.现在考虑这个信号: 一个挑战!这是遇到的信号质量的另一个极端.老实说,当将传感器连接到手指上时(在0到4000之间),通过测量产生了该信号.在此之后,手指中的血管需要立即适应传感器的压缩(大约4​​000-5000),此后信号变得稳定.在大约7500.9000和12000时,用力将传感器移…
写在前面:圣诞刚过,弥留者节日气息的大家是否还在继续学习呐~在匆忙之际也不忘给自己找几首好听的歌曲放松一下,缠绕着音乐一起来看看关于2019年流行音乐趋势是如何用Python分析的吧! 昨天下午没事儿,随便听了下音乐,结果搜到了一份数据比较好玩,所以拿了来做个数据分享案例. 这份数据是由国外比较火的音乐软件spotify提供的,很有代表意义. 不过涉及到的指标都比较专业,我不是太懂,只能根据自己的理解去做分析,有懂音乐的朋友可以提出专业的看法. 这次的数据分析工具是Python,当然如果你Pyt…
1.爬虫基本原理 我们爬取中国电影最受欢迎的影片<红海行动>的相关信息.其实,爬虫获取网页信息和人工获取信息,原理基本是一致的. 人工操作步骤: 1. 获取电影信息的页面 2. 定位(找到)到评分信息的位置 3. 复制.保存我们想要的评分数据 爬虫操作步骤: 1. 请求并下载电影页面信息 2. 解析并定位评分信息 3. 保存评分数据 综合言之,原理图如下: 2.爬虫的基本流程 简单来说,我们向服务器发送请求后,会得到返回的页面:通过解析页面之后,我们可以抽取我们想要的那部分信息,并存储在指定的…
先是搜索了一下,在manifest里添加 <uses-permission android:name="com.android.browser.permission.READ_HISTORY_BOOKMARKS"/> 有了这个权限就可以读取上网记录和书签了.开始时我以为只有上网记录,但是明显bookmarks是表示书签啊.而书签一般是没有时间这个内容的.所以对query语句进行了修改,添加搜索限制条件. contentResolver.query(Uri.parse(&qu…
C# 程序A发送Log记录给程序B,程序B处理和分析Log记录 关键字:C# ;Log记录 ;在线Log记录;Socket:httplistener 一.常用场景 1. APP开发,在真机或者虚拟机上面运行由H5或者ApiCloud的程序,或者调试别人写的程序的时候,往往不能看到一段代码执行后的输出结果是什么.作为一个天天跟后台打交道的人,浏览器尤其是习惯了Google的F12的console.log,更是希望APP调试也能够实时查看输出. 2.开发一个.Net的网站,或者Java的网站,在调试…
这此教程可能会比较简洁,具体细节可参考我的第一篇教程: Python爬虫个人记录(一)豆瓣250 Python爬虫个人记录(二)fishc爬虫 一.目的分析 获取煎蛋妹子图并下载 http://jandan.net/ooxx 大概就是这么个样子了^_^ 心动了吗,那就行动吧. 二.步骤分析 1.访问http://jandan.net/ooxx 获得当前妹子图的页码 2. 获得http://jandan.net/ooxx前十页地址 3.分析前十页地址并获得图片真实下载地址 4.下载前十页的妹子图并…
参考: Python爬虫个人记录(一)豆瓣250 (2017.9.6更新,通过cookie模拟登陆方法,已成功实现下载文件功能!!) 一.目的分析 获取http://bbs.fishc.com/forum-246-1.html 中小甲鱼零基础入门学习python课件以及源代码 即这玩意 二.步骤分析 1.进入http://bbs.fishc.com/forum-246-1.html 2.通过xpath()分析出一级连接 http://bbs.fishc.com/thread-36353-1-1.…
注:本人参考“裸睡的猪”公众号同名文章,学习使用. 一.目标 使用Python分析出国庆哪些旅游景点:好玩.便宜.人还少的地方,不然拍照都要抢着拍! 二.获取数据 爬取出行网站的旅游景点售票数据,反映出旅游景点的热度.这里选择爬取“去哪儿”网. 1.爬取单页数据 我们可以在哪去儿的门票页(http://piao.qunar.com/ticket/list.htm?keyword=)搜索:**国庆旅游景点**,就可以看到推荐的景点的一些信息,如:名称.地区.热度.销量.价格.等级.地理信息等等,信…
python分析Mysql慢查询.通过Python调用开源分析工具pt-query-digest生成json结果,Python脚本解析json生成html报告. #!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/10/12 下午3:00 # @Author : Kionf # @Site : https://kionf.com # @Software: Sublime import subprocess import jso…
用python分析数据难吗?某科技大学的教授这样说,很难,但要讲方法,主要是因为并不是掌握了基础,就能用python来做数据分析的. 所谓python的基础,也就是刚入门的python学习者,学习的基础语法,比如Python环境搭建.常量变量.运算符等等,对于大多数人来说,入门并掌握基础就已经是比较困难的了,还要用来做数据分析,到底如何才能真正学到自己想学的,并且应用呢? 第一:掌握python基础的内容 Python分析数据难吗?对于小白来说,Python在入门方面比其他语言要简单很多,即使没…
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:CDA数据分析师 豆瓣9.4分!这场线上演唱会到底多好看? 首先让我们看到豆瓣上的数据:截止到目前为止,五月天的这次线上演唱会共有10万余人进行了评价,目前豆瓣评分为9.4分,是非常高的成绩了. 豆瓣评分分布 进一步分析可以看到,评论中有68.4%的人给出了满分5星,其次24.2%的人给出了4星. 豆瓣评论词云图 豆瓣评论中大家都在说些什么呢?可以看到"太短&quo…
前言 毕业找工作,在职人员换工作,离职人员找工作……不管什么人群,应聘求职,都需要先分析对应的招聘岗位,岗位需求是否和自己匹配,常见的招聘平台有:BOSS直聘.拉钩招聘.智联招聘等,我们通常的方法都是,打开招聘网站,搜索职位关键字,然后一页一页的逐个查看,觉得还不错的岗位就投递一下简历,或者和招聘负责人聊一下,那么有没有办法,能一次性把相关的招聘岗位列出来,方便快速的分析,答案当然有的…… 很多人学习python,不知道从何学起.很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上…
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理 近期,蛋壳公寓"爆雷"事件持续发酵,期间因拖欠房东房租与租客退款,蛋壳公寓陷入讨债风波,全国多地蛋壳公寓办公区域出现大规模解约事件,而作为蛋壳公寓总部所在地北京,自然首当其冲. 为了应对大规模的解约,北京在全市已经设立了100多个蛋壳公寓矛盾纠纷接待点,包含了蛋壳公寓涉及到的12个区,这些接待点下沉到了街道甚至社区,以方便涉及蛋壳公寓事件的房东和租客咨询和处理纠纷. 长租公寓暴雷,不少年…
Python分析离散心率信号(中) 一些理论和背景 心率信号不仅包含有关心脏的信息,还包含有关呼吸,短期血压调节,体温调节和荷尔蒙血压调节(长期)的信息.也(尽管不总是始终如一)与精神努力相关联,这并不奇怪,因为大脑是一个非常饥饿的器官,因此消耗了总葡萄糖的25%和氧气消耗的20%.如果活动增加,心脏需要更加努力地工作以保持其供应. 感兴趣的是这些措施可以被分为时间序列数据连接频域数据.如果熟悉傅立叶变换,则频率部分会很有意义.如果不是,请参阅维基百科页面具有很好的解释,并且对过程也非常直观.基…
最近做的一个项目,系统log下会生成如下的log(部分): [-- ::] Processing File transfer configured from ship to shore.... [-- ::] File Limit [-- ::] Done processing File transfer configured from ship to shore.... [-- ::] Connection starts now [-- ::] Connected Via FB [-- ::]…
Python分析离散心率信号(上) 一些理论和背景 心率包含许多有关信息.如果拥有心率传感器和一些数据,那么当然可以购买分析包或尝试一些可用的开源产品,但是并非所有产品都可以满足需求.也是这种情况.那么,为什么不尝试自己做一个人呢?如果正在阅读本文,那么可能想尝试一下.本文适合那些有兴趣了解更多关于心率分析以及如何使用一些基本模块用Python编写简单但有效的分析算法的人.在谈论心率信号的形状时,每个搏动都具有QRS复数的特征,如a.,I-III(QRS)所示.还有一个P波(IV)和一个T波(V…
一 前言 Django是如何通过网络socket层接收数据并将请求转发给Django的urls层? 有的人张口就来:就是通过wsgi(Web Server Gateway Interface)啊! Django框架完全遵循wsgi协议,底层采用socket.socketserver.select网络模型实现,可以利用操作系统的非堵塞和线程池等特性. Django本身是用python代码实现的wsgi服务,并发非常低,默认6个,而线上部署Django项目时一般采用C语言实现的uwsgi. 二 顺藤…
大家好,前面入门已经说了那么多基础知识了,下面我们做几个实战项目来挑战一下吧.那么这次为大家带来,Python爬取糗事百科的小段子的例子. 首先,糗事百科大家都听说过吧?糗友们发的搞笑的段子一抓一大把,这次我们尝试一下用爬虫把他们抓取下来. 友情提示 糗事百科在前一段时间进行了改版,导致之前的代码没法用了,会导致无法输出和CPU占用过高的情况,是因为正则表达式没有匹配到的缘故. 现在,博主已经对程序进行了重新修改,代码亲测可用,包括截图和说明,之前一直在忙所以没有及时更新,望大家海涵! 更新时间…
静觅 » Python爬虫实战一之爬取糗事百科段子 首先,糗事百科大家都听说过吧?糗友们发的搞笑的段子一抓一大把,这次我们尝试一下用爬虫把他们抓取下来. 友情提示 糗事百科在前一段时间进行了改版,导致之前的代码没法用了,会导致无法输出和CPU占用过高的情况,是因为正则表达式没有匹配到的缘故. 现在,博主已经对程序进行了重新修改,代码亲测可用,包括截图和说明,之前一直在忙所以没有及时更新,望大家海涵! 更新时间:2015/8/2 糗事百科又又又又改版了,博主已经没心再去一次次匹配它了,如果大家遇到…
原文:教大家一招用Python实时监控自己的女朋友每天上网都在做什么! 参考这个思路,尝试自己实现一下 读取Chrome历史记录文件 1.文件可在以下路径找到,这是个sqllite数据库文件 C:\Users\自己的用户名\AppData\Local\Google\Chrome\User Data\Default\History 2.使用DB Browser把这个文件加进来,打开后可以看到表信息,这里用到的urls表中的url和last_visit_time字段 3.使用sqlite3模块,读取…
昨天跟喜欢的妹子表白了. 失败了!.下面是表白的聊天记录: (跟妹子已经认识一段时间) 我:灭嘤嘤,我喜欢你. 妹子:你干嘛? 我:今天520,跟你表白鸭. 妹子:那....有多喜欢? 我: 有很多很多喜欢. 有海鸥喜欢大海那么多喜欢. 有春娇喜欢志明那么多喜欢. 有猫咪喜欢鱼那么多喜欢. 有灭霸喜欢打响指那么多喜欢. 但这些都是骗人的. 因为喜欢是复杂的感情,文字表达不好. 你不要问我有多喜欢你. 因为喜欢就是喜欢,因为我就是喜欢. 不是数量,不是重量,也不是距离. 后来,妹子就不理我了.我又…
咪蒙 文学硕士,驾驭文字能力极强.并且是一个拥有一千多万粉丝,每篇文章阅读量都   100W+,头条发个软文都能赚 80 万,永远都能抓住粉丝G点的那个女人. 1月份因为某篇文章,在网络上被一大批网友炮轰.我也因此关注了她.一开始发现她的文章非常接地气,基本都是和生活紧密相连,但看的多了,发现经常在文中非常平滑的挑起某种关系之间的矛盾.很大一部分文章都是围绕女性展开话题.而且每天更新时间都在晚上十一点左右,几乎从来不间断.包括春节. 2015年9月15日,公众号第一篇文章<女友对你作?你应该谢天…
1.IP流量将何去何从?——用Python回答: 使用PyGeoIP关联IP地址和物理地址: 需要下载安装pygeoip,可以pip install pygeoip 或者到Github上下载安装https://github.com/appliedsec/pygeoip 同时需要下载用pygeoip操作的GeoLiteCity数据库来解压获得GeoLiteCity.dat数据库文件: http://dev.maxmind.com/geoip/legacy/geolite/ 将GeoLiteCity…
引言: 昨天在网易云课堂自学了<Python网络爬虫实战>,视频链接 老师讲的很清晰,跟着实践一遍就能掌握爬虫基础了,强烈推荐! 另外,在网上看到一位学友整理的课程记录,非常详细,可以优先参考学习.传送门:请点击 本篇文章是自己同步跟着视频学习的记录,欢迎阅读~~~ 实验:新浪新闻首页爬虫实践 http://news.sina.com.cn/china/ 一.准备 浏览器内建的开发人员工具(以Chrome为例) Python3 requests 库 Python3 BeautifulSoup4…
USB流量分析 USB接口是目前最为通用的外设接口之一,通过监听该接口的流量,可以得到很多有意思的东西,例如键盘击键,鼠标移动与点击,存储设备的明文传输通信.USB无线网卡网络传输内容等. 1.USB流量的捕获 USB流量的捕获可以使用wireshark自带的工具usbpcap来进行 安装wirshark时勾选上安装usbpcap即可 1.鼠标流量 抓包 鼠标移动的轨迹,右键,左键的行为都能捕捉到 (这里有个坑,有的鼠标可能协议不标准.抓到的数据分析不了) 保存为pacp文件 USB协议的数据部…
2018年,火热的世界杯即将拉开序幕.在比赛开始之前,我们不妨用 Python 来对参赛队伍的实力情况进行分析,并大胆的预测下本届世界杯的夺冠热门球队. 通过数据分析,可以发现很多有趣的结果,比如: 找出哪些队伍是首次进入世界杯的黑马队伍 找出2018年32强中之前已经进入过世界杯,但在世界杯上没有赢得过一场比赛的队伍 当然,我们本次的主要任务是要通过数据分析来预测2018年世界杯的夺冠热门队伍. 本次分析的数据来源于 Kaggle, 包含从 1872 年到今年的数据,包括世界杯比赛.世界杯预选…
1 引言 刚接触python与大数据不久,这个是学长给出的练习题目.知识积累太少,学习用了不少的时间.尽量详细的写,希望对各位的学习有所帮助. 2 背景 2.1 Kaggle 本次数据集来自于Kaggle.Kaggle是一个数据分析建模的应用竞赛平台.想要了解详细资料的小伙伴请自行百度. 2.2 泰坦尼克号 本次问题页面 请到Data页面下载数据集 数据集的各属性在Data页面下有详细介绍. 问题就是以大家熟悉的泰坦尼克号为背景展开的,本次任务的目的就是构建一个可以根据乘客个人信息推测乘客是否生…
前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:刘早起早起 PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取http://t.cn/A6Zvjdun 北京时间4月3日凌晨,全球新冠病毒感染人数突破100万,死亡人数超过5万.而这一切都在2020年刚开始的三个月内发生.可能你觉得这三个月很快,有些事情已经逐渐忘记,而互联网的记忆不会消失,数据也会说话.因此作者抓取了2020年1月1日至4月2日的每…
对于记录的数据,如何用 Python 进行分析.或图形化呢? 本文将介绍 numpy, matplotlib, pandas, scipy 几个包,进行数据分析.与图形化. 准备环境 Python 环境建议用 Anaconda 发行版,下载地址: 官方: https://www.anaconda.com/products/individual#Downloads 清华源: https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ Anacond…