我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。

案情介绍

“我啥也妹干呐,那家伙上来就给我哐哐哐撞了一千三百万下警察同志,您一定要给我主持公道,不法分子必须严惩!”

——帝都某公司在警局里如是哭诉到

大家好,我是K哥!

今天给大家讲一个关于数据泄露的故事,故事很新,就发生在不久前。

事情是这样的,前阵子北京的警察叔叔们接到了自己辖区里边一家公司的报案,互联网公司,做招聘平台的。

该公司称自家 App 的短信验证码接口遭受了1300 余万次恶意攻击,而且被成功匹配了30 余万个注册账号 。

(这意味着30多万份的求职者信息遭到泄露)

接警之后,警察叔叔们迅速受理,并定性了这是一起黑客违法案件

本案男一号喻某,2022 年 10 月 18 日的时候在该招聘平台注册账号,并多次尝试了验证接口,当时他就寻思,这个网站的签名算法比较单一,不复杂。

而喻某是懂这个的,刚好这兄弟手上又有点儿技术,就动了歪脑筋,针对这个网站的弱点写了套程序,专门用来撞人家库。

这里给小白同学解释一下”撞库“

通俗一点讲,“撞库”就是黑客通过收集互联网上用户的账号和密码信息,生成对应的字典表,再尝试批量登录其他网站。以“撞运气”的形式“试”出可登录的用户名、密码。

-使用Python就可以轻松写出撞库攻击脚本,实现自动批量验证账户,技术门槛不高。

-撞库攻击只依赖已泄露的账号,不需要自行获取,所以攻击的成本很低。
-恰恰是这种比较笨的方式,让很多网站都防不胜防。

有兄弟就要问了:K哥K哥,黑客是怎么拿到这些账号密码的呀??

要知道,现如今的信息泄露情况是很严重的,私人信息数据的贩卖,在*网论坛早就有了成熟的灰色产业链,既然都当黑客了,自然有渠道能搞到。

至于怎么泄露出去的,花样就太多了,随便给大家列举几个场景:

  • 在公共网络环境下输入了自己的账号密码,例如去网吧上网,而计算机里本身就有病毒程序,那你的账号自然就泄露了。

  • 以前注册的一些网站,一是数据库本身有泄露风险,二是很多网站倒闭跑路时直接把用户信息打包卖了。

  • 网传某输入法,在用户输入账号密码时,会自动记录并上传,至于做什么用,大家可以想一想。

    ……

而妙就妙在,很多人的账号密码是N年不换的,且多个平台通用一套账号密码,顶多调整下大小写。

因此黑客可以通过获取用户在A网站的账户去而尝试登录B网址,这就可以理解为撞库攻击。

(图片来源:央视网视频截图)

而撞库成功之后,还有对应的“拖库”“洗库”

拖库是指黑客入撞库成功过后,把注册用户的资料数据库全部导(dao)出(qie)的行为,因为谐音,也称作“脱裤”

(之前360为了奖励提交漏洞的白帽子兄弟,专门搞了个“裤带计划”,名字出处就在这儿)

但拿到数据不是目的,赚米才是目的,那么黑客在拿到大量的用户数据之后,通过一些非法渠道将数据售卖变现,就叫做“洗库”

                                撞库→拖库→洗库

(图片来源:百度百科)

法网恢恢

说回案件本身,本案男一号喻某通过黑客手段以及自己制作的黑客程序,恶意攻击了该求职招聘平台的 App 短信验证码接口,在该公司报警后不久便在成都被抓获。

(据喻某招供,他还利用类似方式对其他各大网站进行渗透,并伺机查询网站漏洞,以此为诱饵向他人兜售自己编写的恶意程序、黑客工具,从中牟利。)

另有一枚倒霉蛋,男二号焦某也于成都被警方逮捕,现场起获各类公司、人员数据 330 余万条。

(据焦某招供,自己花3000块钱买了喻某的黑客程序,用于撞库攻击其他网,而且还通过非法渠道在境外网站出售牟利。)

抓捕过程K哥没有找到什么详细报道,但估计警方也没遇到什么阻力,敲门,外卖,按住!一气呵成!

毕竟只是黑客,不是凤凰战士,网络重拳出击,现实一推就倒。

(以上猜测基于K哥平时看警匪片的个人爱好,并非经验之谈,请广大读者朋友切勿妄自对K哥进行揣摩)

目前犯罪嫌疑人喻某、焦某因破坏计算机信息系统罪被依法刑事拘留,案件正进一步办理中!

这俩哥们儿的牢饭是免不了了,估计还不会轻判,毕竟情节比较恶劣,涉及到300万条国内公民和公司的信息,而且还向境外倒卖!K哥只能说是咎由自取,抓得好!

以案为鉴

北京市公安局网安总队侦查员对用户设置密码提出如下建议:

  • 密码避免过于简单易猜;

  • 公共设备登录个人账号不要勾选“记住密码”“默认登录”等选项,尽可能选择匿名登录;

  • 使用需填写重要账号密码的第三方 App 或不知名应用时,要持谨慎态度,尽量减少透露个人的详实信息。

NordPass发布了2023年全球使用最多的密码榜单。像什么123456789;qwerty;asd123456都是国内很多人在用的。

如果你也是其中之一,K哥这边给出专家建议,能改就改哈。

(图片来源:NordPass)

K言K语

最后再说点儿题外话,很多人对爬虫有误解,特别是一些对行业一知半解的人,认为爬虫就是一种黑客技术,但K哥必须再次为咱们爬虫工程师正名,爬虫er≠黑客

爬虫技术的诞生是为了高效的获取一些公开的信息,提高工作效率,而不是去入侵,攻击人家的服务器。

只不过掌握了爬虫技术的人,确实离黑灰产很近,但技术无罪,有罪的是人,一念天堂一念地狱。

最后K哥提醒大家要对数据,对法律有敬畏之心,不该碰的信息坚决不碰,不该接的业务千万别接!

更多爬虫相关文章,公众号搜索关注——K哥爬虫

【K哥爬虫普法】北京某公司惨遭黑客攻击13000000余次,连夜报警……的更多相关文章

  1. VR外包 虚拟现实外包 北京软件公司

    我们制作各类型VR全景虚拟现实,增强现实视频制作.录制等项目.品质保证,售后完备,可签合同.contectus: 13911652504(技术经理tommy) 承揽VR外包 虚拟现实外包 U3D外包( ...

  2. C基础 北京大公司面试简单总结

    作者有话说 这是关于程序员面试的一篇文章, 希望对你有帮助. 干了快3年了. 可以简单参考, 对比总结.虽然本人很水. 很喜欢当前做的手游项目.做的很认真.后端每个人技术都很好.但是结果都不如意.在死 ...

  3. 承接VR外包,虚拟现实外包,北京正规公司

    我们制作各类型VR全景虚拟现实,增强现实视频制作.录制等项目.品质保证,售后完备,可签合同.contectus: 13911652504(技术经理tommy) 承揽VR外包 虚拟现实外包 U3D外包( ...

  4. 承接Unreal4外包虚幻外包,北京正规公司

    VR产业链的现状 去年Facebook 20亿美元收购虚拟现实技术Oculus VR,提高了大家对VR设备.而国内,红杉资本投资蚁视,更是引爆了资本市场对VR/AR 的关注.其中有四块是我们较为常见且 ...

  5. Unity3d外包(北京)公司(长年承接U3D外包)

    我们制作各类型严肃游戏,虚拟现实,增强现实项目! 品质保证,售后完备. 联系请加QQ:372900288  电话:13911652504 我们团队成立于2011年10月,是一个专业从事严肃游戏研发的团 ...

  6. 北京大公司:你是熟悉Map集合吗?

    <对线面试官>系列目前已经连载30篇啦,这是一个讲人话面试系列 [对线面试官]Java注解 [对线面试官]Java泛型 [对线面试官] Java NIO [对线面试官]Java反射 &am ...

  7. 北京大公司二面:了解Redis持久化机制吗?

    今日总结 Redis持久化机制:RDB和AOF RDB持久化:定时任务,BGSAVE命令 fork一个子进程生成RDB文件(二进制) AOF持久化:根据配置将写命令存储至日志文件中,顺序写&& ...

  8. 美国知名Cloudflare网络公司遭中国顶尖黑客攻击

    最近中美贸易战愈演愈烈,美国知名Cloudflare网络公司的客户的分布式拒绝服务攻击今天在恶意流量方面达到了新的高度,黑客并袭击了该公司在欧洲和美国的数据中心.根据Cloudflare首席执行官马修 ...

  9. 爬虫逆向基础,理解 JavaScript 模块化编程 webpack

    关注微信公众号:K哥爬虫,QQ交流群:808574309,持续分享爬虫进阶.JS/安卓逆向等技术干货! 简介 在分析一些站点的 JavaScript 代码时,比较简单的代码,函数通常都是一个一个的,例 ...

  10. RPC 技术及其框架 Sekiro 在爬虫逆向中的应用,加密数据一把梭!

    什么是 RPC RPC,英文 RangPaCong,中文让爬虫,旨在为爬虫开路,秒杀一切,让爬虫畅通无阻! 开个玩笑,实际上 RPC 为远程过程调用,全称 Remote Procedure Call, ...

随机推荐

  1. 专注提升用户体验,Superset 1.3发布!

    近期Superset发布了新的版本1.3.0,此版本专注于提升用户体验.并进行了大量的改进与错误修复. 用户体验 此版本的一个主要目标是改进仪表盘原生过滤器.这些过滤器的级别为仪表盘级别,而不是图表级 ...

  2. ByteHouse技术白皮书正式发布,云数仓核心技术能力首次全面解读(内附下载链接)

    更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 近日,<火山引擎云原生数据仓库 ByteHouse 技术白皮书>正式发布. 在数字化浪潮下,伴随着公有 ...

  3. SpringBoot Kafka SSL接入点PLAIN机制收发消息

    applycation.yml spring: # https://developer.aliyun.com/article/784990 kafka: bootstrap-servers: XXXX ...

  4. 编码器-解码器 | 基于 Transformers 的编码器-解码器模型

    基于 transformer 的编码器-解码器模型是 表征学习 和 模型架构 这两个领域多年研究成果的结晶.本文简要介绍了神经编码器-解码器模型的历史,更多背景知识,建议读者阅读由 Sebastion ...

  5. 解决ttrss(Tiny Tiny RSS)中fever无法使用的问题

    问题描述 在ttrss刚搭建好的时候,进行了如下操作: 随后键入了密码(fever密码) 最后,按照官方给的提示,在Fluent Reader中测试,弹出如下错误信息: 解决方案 复制官方给的链接,删 ...

  6. 可用性库存(CO09)排除库存地点增强

    1.业务需求 1.1.业务背景 1.2.对应方案: 2.测试BAPI 首先运行事务代码CO09,查看结果 运行BAPI_MATERIAL_AVAILABILITY 3.增强实现 3.1.增强思路 3. ...

  7. DS | 折半查找二叉判定树的画法

    以下给出我在学习中总结的一种比较简便的 构造折半二叉判定树 的思路以及方法: 思路分析: 在计算 \(mid\) 值时,使用的时 \(mid=(low+high)/2\) .这里由于 \(mid\) ...

  8. Codeforces Round #730 (Div. 2) A~D题个人题解

    比赛链接:Here 1543A. Exciting Bets math, 给定两个数字 \(a,b (a,b \le 1e18)\) 和以下两种操作: \(a + 1,b+1\) \(a-1,b-1\ ...

  9. 电缆厂 3D 可视化管控系统 | 图扑数字孪生

    近年来,我国各类器材制造业已经开始向数字化生产转型,使得生产流程变得更加精准高效.通过应用智能设备.物联网和大数据分析等技术,企业可以更好地监控生产线上的运行和质量情况,及时发现和解决问题,从而提高生 ...

  10. LeetCode-Go:一个使用 Go 语言题解 LeetCode 的开源项目

    在中国的 IT 环境里,大多数场景下,学习算法的目的在于通过笔试算法题. 但算法书林林总总,有时候乱花渐欲迷人眼. 杜甫有诗云:读书破万卷,下笔如有神.不管选择哪本书,只要深入学习,分层次,逐层进阶, ...