CSDN泄漏数据完整分析

2011-12-22 08:59:26 53391 次阅读 0 条评论

感谢mayee的投递

昨天CSDN的用户数据库被人在网上公布。我下载分析了下里面的数据,得出了一些很有意思的现象。泄漏出来的数据只有三列:用户名、密码和邮箱。先来看看密码:

1.最常用的前50个密码

数量           密码

235037    123456789 

212761    12345678 

76349    11111111 

46054    dearbook 

34953    00000000 

20010    123123123 

17794    1234567890 

15033    88888888 

6995    111111111 

5966    147258369 

5890    aaaaaaaa 

5555    987654321 

5145    1111111111 

5026    66666666 

4686    a123456789 

4096    11223344 

3968    1qaz2wsx 

3650    password 

3649    xiazhili 

3610    789456123 

3505    qwertyuiop 

3491    qqqqqqqq 

3297    iloveyou 

3287    qq123456 

3282    87654321 

3175    000000000 

3100    asdfghjkl 

3063    31415926 

2985    12344321 

2943    1q2w3e4r 

2886    0000000000 

2770    QAZWSXEDC 

2752    123456abc 

2613    abcd1234 

2578    0123456789 

2573    123654789 

2540    12121212 

2437    asdasdasd 

2380    12341234 

2348    110110110 

2338    abc123456 

2298    aa123456 

2245    a12345678 

2243    22222222 

2219    a1234567 

2218    1234qwer 

2178    123456 

2166    123321123 

2165    qwertyui 

2113    123456123

看看里面有没有你常用的?

2.密码类型

我按 全部是数字;全部是字母;字母和数字;含特殊符号 为密码归了下类:

纯数字密码:2894567  (1)

纯字母密码:795778    (2)

字母和数字:2506714  (3)

含特殊符号:231572    (4)

另外还有一条数据密码是空

密码越复杂就越安全,但是采用字母数字加特殊符号高强度密码的只有231572,约占总共6428632个用户的 三十分之一

3.密码长度

数量         长度

2337895    8 

1550730    9 

929948    10 

627736    11 

368567    12 

167302    13 

154473    14 

84292    6 

74882    15 

49085    16 

33951    5 

18952    7 

7448    4 

6981    17 

5852    18 

5014    20 

2278    19 

1350    2 

1336    3 

559    1 

1    0

程序员的安全意识还是比较强的,密码普遍长度在8-14位。但是奈何不了明文存储,也奈何不了数据库泄漏哇

4.有多少程序员用手机号做密码

大约有189307个密码是以手机号形式存在的,按照号码前三位分类:

号码前三位 数量     

139    21171 

138    20996 

135    20248 

136    18444 

137    15876 

159    14347 

158    12455 

134    11076 

130    11004 

131    9441 

150    8074 

151    6737 

133    6068 

132    5880 

152    3356 

189    1102 

155    1082 

187    544 

153    528 

156    422 

186    238 

147    77 

157    45 

188    43 

145    24 

180    18 

185    9 

1349    2

看来程序员们还是最钟爱中国移动啊

5.有多少程序员用纪念日做密码

大约有437296个密码是以日期形式存在的,按数量排序如下

时间     数量

1987    43307 

1986    38670 

1988    37917 

1985    33117 

1984    32219 

1989    30284 

1983    28630 

1982    28432 

1981    18052 

1990    14514 

1980    12691 

1979    10528 

1978    9251 

1991    6391 

1977    6343 

1976    5186 

1975    4083 

2008    3923 

1974    3523 

1992    3260 

2006    3158 

2005    2978 

2004    2909 

2002    2815 

1973    2815 

2009    2691 

2003    2539 

1972    2504 

1993    2373 

2007    2290

如果认为密码就是该用户的生日,那么可以看出一些有意思的事情:80后是程序员的主力,85后已经崛起。

以200X为年份的,有可能是有了宝宝的程序员,以宝宝的生日为密码。

6.程序员们都用什么邮箱

下面是排名前30的邮箱提供商:

邮箱后缀    数量

qq.com    1976001 

163.com    1766935 

126.com    807818 

sina.com    351750 

yahoo.com.cn    205486 

hotmail.com    202965 

gmail.com    186809 

sohu.com    104756 

yahoo.cn    87040 

tom.com    72353 

yeah.net    53312 

21cn.com    50795 

vip.qq.com    35115 

139.com    29201 

263.net    24830 

sina.com.cn    19169 

live.cn    18918 

sina.cn    18599 

yahoo.com    18454 

foxmail.com    16430 

163.net    15279 

msn.com    14217 

eyou.com    13387 

yahoo.com.tw    10809 

huiseo.cn    8492 

csoftmail.cn    7121 

citiz.net    6617 

vip.sina.com    5379 

189.cn    5004 

etang.com    4261

网易邮箱 依旧是国内邮箱的老大,QQ正在快马追上。

CSDN泄漏数据完整分析的更多相关文章

  1. Springboot学习05-自定义错误页面完整分析

    Springboot学习06-自定义错误页面完整分析 前言 接着上一篇博客,继续分析Springboot错误页面问题 正文 1-自定义浏览器错误页面(只要将自己的错误页面放在指定的路径下即可) 1-1 ...

  2. 学机器学习,不会数据分析怎么行——数据可视化分析(matplotlib)

    前言 前面两篇文章介绍了 python 中两大模块 pandas 和 numpy 的一些基本使用方法,然而,仅仅会处理数据还是不够的,我们需要学会怎么分析,毫无疑问,利用图表对数据进行分析是最容易的, ...

  3. 基于Python项目的Redis缓存消耗内存数据简单分析(附详细操作步骤)

    目录 1 准备工作 2 具体实施   1 准备工作 什么是Redis? Redis:一个高性能的key-value数据库.支持数据的持久化,可以将内存中的数据保存在磁盘中,重启的时候可以再次加载进行使 ...

  4. KDD Cup 99网络入侵检测数据的分析

    看论文 该数据集是从一个模拟的美国空军局域网上采集来的 9 个星期的网络连接数据, 分成具有标识的训练数据和未加标识的测试数据.测试数据和训练数据有着不同的概率分布, 测试数据包含了一些未出现在训练数 ...

  5. SEM竞价数据基本分析方法

    今天我们从账户数据表现来看一看怎样通过数据分析,判断账户出现的问题及解决思路.也欢迎大家提出意见,共同讨论进步. 首先我们从关键词报告来分析数据: 以上图数据为例.(设定该行业CPC均价为8) 先说下 ...

  6. 在HDInsight中从Hadoop的兼容BLOB存储查询大数据的分析

    在HDInsight中从Hadoop的兼容BLOB存储查询大数据的分析 低成本的Blob存储是一个强大的.通用的Hadoop兼容Azure存储解决方式无缝集成HDInsight.通过Hadoop分布式 ...

  7. Xshell高级后门完整分析报告

    Xshell高级后门完整分析报告 from:https://security.tencent.com/index.php/blog/msg/120 1. 前言 近日,Xshell官方发布公告称其软件中 ...

  8. mapReduce 大数据离线分析

    数据分析一般分为两种,一种是在线一种是离线 流程: 一般都是对于日志文件的采集和分析 场景实例(某个电商网站产生的用户访问日志(access.log)进行离线处理与分析的过程) 1.需求: 基于Map ...

  9. 气象netCDF数据可视化分析

    气象netCDF数据可视化分析 2019-09-19 15:34:22 自走棋 阅读数 162更多 分类专栏: web前端   版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载 ...

随机推荐

  1. 转 当当网资深DBA:DB运维四大现代化的实现

    位好,今天我的主题是 <DB运维的四个现代化> ,看标题就能明白,是关于DBA自动化运维平台的事情.http://dbaplus.cn/news-21-855-1.html 主要是分享下我 ...

  2. Android OpenGL ES(四)关于EGL .

    OpenGL ES的javax.microedition.khronos.opengles 包定义了平台无关的GL绘图指令,EGL(javax.microedition.khronos.egl ) 则 ...

  3. Newly Setting up a CentOS-7 system

    yum install -y epel-release glibc.i686 libtools vim clang git autoconf automake w3m glibc screen the ...

  4. PHP DES加密

    public function encrypt($str) { //$str = "hh"; $key = "key:123";//密钥 $cipher = M ...

  5. AsyncTask异步加载和HttpURLConnection网络请求数据

    //获得网络数据    private void huodeshuju() { //这里是使用线程,已注释掉        /*new Thread(){            public void ...

  6. UVA - 1347 Tour(DP + 双调旅行商问题)

    题意:给出按照x坐标排序的n个点,让我们求出从最左端点到最右短点然后再回来,并且经过所有点且只经过一次的最短路径. 分析:这个题目刘汝佳的算法书上也有详解(就在基础dp那一段),具体思路如下:按照题目 ...

  7. panel 绑定鼠标滚轮事件

    void formsample_mousewheel(object sender, MouseEventArgs e) { //获取光标位置 Point mousepoint = new Point( ...

  8. 报错:error C2229: class ' ' has an illegal zero-sized array 引发的思考

    问题:

  9. Chapter 1 First Sight——15

    The red-haired woman looked up. "Can I help you?" 红头发的女人抬头看了一眼说,有什么我能帮助你的吗? "I'm Isab ...

  10. ListView使用的时候遇到的一些问题

    昨天在做项目时,请求服务器的好友动态后,将好友动态和评论显示到界面上,用ListView显示,发现一进这个界面时,listView的适配器的getVIew()方法就会执行6次,后来发现原来是ListV ...