/* 版权声明:可以任意转载,转载时请务必标明文章原始出处和作者信息 .*/                  CopyMiddle: 张俊林 TimeStamp:2012年3 月 在微博环境下,如何自动挖掘某个微博用户的社交圈子或者兴趣圈子是个很基础且重要的问题.如果能够对于某个用户在微博上体现的社交关系进行准确的挖掘,对于很多具体应用来说都有很好的作用,比如可以更好的对用户的兴趣进行挖掘或者能够推荐用户还未关注的社交圈子成员等,或者根据其社交圈子更准确的对用户进行个性化建模,为其它基于用户个…
http://www.wocaoseo.com/thread-130-1-1.html       我们知道做SEO就是用人的思维来模仿搜索引擎的习惯,尽量适应seo的规则,并按照搜索引擎的规则和习惯来做网站,只有这样做了,你的站才会有好的排名和好的收录,比如克拉玛依seo,每天都写原创文章,到昨天终于把克拉玛依seo做到了baidu和google的第一名.搜索引擎的功能主要就是帮助用户寻找到有用的信息!        在网上做seo营销以及用SEO赚钱,一般上都是通过一定的技术手段把个别自己想…
微博模拟登录获取cookis,配置采集深度,采集一条微博转发关系页面,同时解析页面,生成一条微博的传播图,数据集可做微博影响力分析和传播分析 gitthub:https://github.com/chzeze/WeiboCrawlZEZE package main; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutput…
利用 sqlalchemy 实现关系表查询功能 下面的例子将完成一个通过关系表进行查询的功能,示例中的数据表均在MySQL中建立,建立过程可以使用 SQL 命令或编写 Python 适配器完成. 示例中用到的表主要有3张,一张personInfo个人信息表,一张account_store账号信息表,以及一张person_account_rel的个人信息与账号关系表. 示例中将会通过已知的人物年龄和id通过个人信息表查出个人姓名(仅为参考示例,请忽略怪异的查找逻辑 :) ),随后根据关系表得到的人…
小生今年研二,目前主要从事软件工程数据挖掘与分析.之前一直苦于找不到一个从数据预处理.数据分析.数据可视化和软件建模的统一平台.因此,小生辗转反辙学习了java,R语言,python,scala等等.最后忽然发现python正是小生苦苦寻觅的“稀世珍宝”.在这里主要总结利用python分析数据的一些工具包和相关资料,还望各位指正共同进步. 主要的工具包: numpy: http://www.numpy.org/                                           …
想通过图形化的方式显示社交网络特定用户的好友关系,上网找了一下这方面的图形库有networkx.graphviz等,找了好久我选择了iGraph这个图形库. igraph在Windows下的安装稍微有点麻烦,详情参见:https://my.oschina.net/stu51/blog/335455 fans.txt 和 concern.txt分别保存了粉丝昵称以及关注人昵称. #coding=utf-8 from igraph import * count_fans=0 #粉丝数 count_f…
分别打印二项式(a+b)^n展开项的系数,在程序中利用了一个队列,在输出上一行系数时,将下一行的系数预先放入队列中.在各行系数间插入0. void YANGVI(int n){ Queue q(n+); //建立队列对象q并初始化. int i=,j,s=,t,u; q.EnQueue();q.EnQueue(); //插入第一行元素 for(i=; i<=n; i++){ cout<<endl; //换行 q.EnQueue(); //每行刚开始打印的时候,先在队列尾部插入一个0 fo…
在平常开发中,treeview的节点显示checkbox,若节点存在几级时,往往希望,选中父节点后,其子节点都要选中,如何实现勒,请看 using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Text; using System.Windows.Forms; namespace SmartHo…
摘要 随着信息技术的不断发展,人类可以很容易地收集和储存大量的数据,然而,如何在海量的数据中提取对用户有用的信息逐渐地成为巨大挑战.为了应对这种挑战,数据挖掘技术应运而生,成为了最近一段时期数据科学的和人工智能领域内的研究热点.数据集中的频繁模式作为一种有价值的信息,受到了人们的广泛关注,成为了数据挖掘技术研究领域内的热门话题和研究重点. 传统的频繁模式挖掘技术被用来在事务数据集中发现频繁项集,然而随着数据挖掘技术应用到非传统领域,单纯的事务数据结构很难对新的领域的数据进行有效的建模.因此,频繁…
推文<阿里凑单算法首次公开!基于Graph Embedding的打包购商品挖掘系统解析>笔记 从17年5月份开始接触Graph Embedding,学术论文读了很多,但是一直不清楚这技术是否真的能应用于工业界? 最近导师转发给我一篇文章,名为<阿里凑单算法首次公开!基于Graph Embedding的打包购商品挖掘系统解析>,眼界大开! 今天就阅读这篇推文,做一些摘录和笔记...侵删! 传送门:http://mp.weixin.qq.com/s/diIzbc0tpCW4xhbIQu…