我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。

案情介绍

据魔蝎科技官网(现已无法打开)介绍,魔蝎科技成立于2016年,是国内领先的大数据智能风控服务供应商,其将人工智能、大数据、区块链、云计算等前沿技术,深度应用于反欺诈、智能决策、信用分析等多个金融风险管理服务领域,对外提供风险分析、反欺诈、多维度用户画像、授信评分等多维度风险管理服务。曾为上千家金融机构、网贷平台等提供大数据风控服务,曾系金融科技行业头部企业。

2019年之前,魔蝎公司等大数据风控公司一度野蛮生长,其运营模式通常为通过网络爬虫技术获取数据信息,而后对数据进行分析使用,用于为下游提供大数据风控服务。

2019年9月6日,据爆料,杭州西湖分局集结200余名警力,对涉嫌侵犯公民个人信息的魔蝎科技进行统一抓捕。抓获涉案人员120余名,冻结资金2300余万元,勘验固定服务器1000余台,扣押电脑100多台,手机200余部。

从事金融科技行业多年的资深人士透露,被查原因很可能与违规使用爬虫数据以及暴力催收有关。

网络爬虫原本是指平台按照一定规则,自动从互联网上提取网络信息的程序或脚本。但近年来,由于一些爬虫技术被应用于“套路贷”的暴力催收上,而被推向风口浪尖。

据金融科技领域人士称,彼时现金贷行业流行一个“风控奇招”——用一款被称为"同业爬虫"的产品,直接将其他现金贷平台的放款额和风控数据扒出来,相当于别家代为做了风控。

比如魔蝎科技员工介绍,只需提供其他现金贷平台的用户名和密码,"同业爬虫"就可以爬取用户的基本信息、银行卡信息、职业、联系人、贷款记录、理财信息等,成功率在85%以上。

曾有大数据公司的相关负责人表示,“我们本身不生产数据,也不买卖数据。所有的数据都是由客户授权,我们收的只是技术服务费用。”

但在征信行业从业者看来,用户授权并非就为爬虫业务披上了合法的外衣,过度爬取和不明使用信息的现象仍十分普遍。一些第三方数据公司会把爬取的信息存储或缓存下来,再对外提供数据服务,就已经违法了;如果涉及到买卖数据,更是触犯刑法。

法院审理查明,魔蝎科技会将其开发的前端插件嵌入网贷平台APP中。网贷平台用户使用网贷平台的App借款时,需要在魔蝎科技提供的前端插件上输入其通讯运营商、社保、公积金、淘宝京东、学信网、征信中心等网站的账号、密码。

经过用户授权后,魔蝎科技的爬虫程序即代替用户进入其个人账户,利用各类爬虫技术,爬取(复制)上述企、事业单位网站上贷款用户本人账户内的通话记录、社保、公积金等各类数据,并按与用户的约定提供给网贷平台用于判断用户的资信情况,并从网贷平台获取每笔0.1元至0.3元不等的费用。

尽管魔蝎科技在和个人贷款用户签订的《数据采集服务协议》中明确告知,“不会保存用户账号密码,仅在用户每次单独授权的情况下采集信息”,但其仍在服务器上采用技术手段长期保存用户各类账号和密码。截至2019年9月案发时,以明文形式非法保存的个人贷款用户各类账号和密码条数多达2000万余条。

根据两高《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》,非法获取、出售或者提供行踪轨迹信息、通信内容、征信信息、财产信息50条以上即可入罪。

判决情况

  • 魔蝎科技以其他方法非法获取公民个人信息,情节特别严重,其行为已构成侵犯公民个人信息罪,判处罚金人民币三千万元;
  • 被告人周某某犯侵犯公民个人信息罪,判处有期徒刑三年,缓刑四年,并处罚金人民币50万元;
  • 被告人袁某犯侵犯公民个人信息罪,判处有期徒刑三年,缓刑三年,并处罚金人民币30万元;
  • 扣押于公安机关的作案工具电脑等予以没收,被告单位杭州魔蝎数据科技有限公司退缴至本院的违法所得款人民币三千万元予以没收,并上缴国库。

案例分析

魔蝎科技的入罪原因,是在数据收集环节未经社保、公积金、运营商等平台授权爬取个人信息,同时未经用户授权的情况下非法长期保存用户各类账号和密码在自己租用的阿里云服务器上,还为套路贷系统平台提供风险控制及催收支撑服务,还将非法获取的公民个人信息出售给其他多个套路贷犯罪团伙,为其提供风控服务和催收支持,非法牟利,爬虫本无罪,罪在用途。

魔蝎科技依据《数据采集服务协议》获取贷款用户的账号密码,在未经被爬取方同意的情况下,利用爬虫技术手段,采取“模拟登陆”方式,获取服务器中所存储贷款用户数据的行为,可能构成未经授权进入被爬取方的计算机信息系统,从而触犯"非法获取计算机信息系统罪"或"侵犯公民个人信息罪",不过在本案中法院对此未做出否定性评价。

近年来魔蝎科技、新颜科技、公信宝、聚信立、天翼征信、同盾科技等多家头部大数据风控公司,相继被查,均因涉嫌侵犯公民个人信息罪被刑事立案,相关公司高管被采取刑事强制措施,多家知名公司都已经主动或被动地停止了相关爬虫业务,前车之鉴,企业应当审视自身爬虫相关业务的商业模式存在的违法可能,关系到用户个人敏感信息,一旦被盗取或滥用,很可能流入非法金融借贷团伙手中,极易引发黑灰产风险。

对于侵犯公民个人信息罪的罚金数额,《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》第十二条明确规定,“一般在违法所得的一倍以上五倍以下” ,从上述判决情况中可以看到,魔蝎科技被追缴的违法所得为三千万元,同时还被判处同等数额的罚金,这意味着,公司一旦触犯此罪名,所退赔的违法所得和罚金的总额,至少为违法产品营业收入的两倍,上述多家互联网公司、大数据公司,由于对自身数据处理的商业模式违法性认识错误,触犯法律红线而最终无法经营,与公民个人信息相关,一定要做好合法性及风险评估,切忌抱有侥幸心理!



【K哥爬虫普法】大数据风控第一案:从魔蝎科技案件判决,看爬虫技术刑事边界的更多相关文章

  1. BAT、网易、京东等如何做大数据风控的?

    大数据风控目前应该是前沿技术在金融领域的最成熟应用,相对于智能投顾.区块链等还在初期的金融科技应用,大数据风控目前已经在业界逐步普及,从BATJ这样的大企业,到交易规模比较大的网贷平台,再到做现金贷. ...

  2. CentOS6安装各种大数据软件 第一章:各个软件版本介绍

    相关文章链接 CentOS6安装各种大数据软件 第一章:各个软件版本介绍 CentOS6安装各种大数据软件 第二章:Linux各个软件启动命令 CentOS6安装各种大数据软件 第三章:Linux基础 ...

  3. Tech 助力Fin ,大数据风控系统赋能掌众金服!

    胡亚海 首席技术官  CTO 北京航空航天大学  博士 深耕互联网领域近20年,先后任职于普天信息技术研究院.摩托罗拉.宇龙酷派.百度等知名企业,曾主导宇龙酷派公司全员从WinCE向Android转型 ...

  4. 人物传记Kyle Tedford:数据环境生变,银行大数据风控怎么办?

    数据是金融业务的基石,监管集中清查大数据公司,很多东西在发生根本性改变,资金方做"甩手掌柜"的好日子不会重现.那些缺乏自主风控能力的金融机构,在未来的行业竞争中,恐无以立足了.近日 ...

  5. 解决大数据难题 阿里云MaxCompute获科技大奖

    摘要: 据介绍,MaxCompute(大规模分布式的数据计算平台)是国内最早自研的大数据计算平台之一,主要应用于大规模数据处理场景.目前,这项源自浙江.解决世界级难题的成果已拥有EB(百京)级别的数据 ...

  6. 量化派基于Hadoop、Spark、Storm的大数据风控架构--转

    原文地址:http://www.csdn.net/article/2015-10-06/2825849 量化派是一家金融大数据公司,为金融机构提供数据服务和技术支持,也通过旗下产品“信用钱包”帮助个人 ...

  7. 一个大数据方案:基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎

    网络爬虫架构在Nutch+Hadoop之上,是一个典型的分布式离线批量处理架构,有非常优异的吞吐量和抓取性能并提供了大量的配置定制选项.由于网络爬虫只负责网络资源的抓取,所以,需要一个分布式搜索引擎, ...

  8. python 金融大数据风控建模实战--基于机器学习

    王青天 孔越编著, 2020年6月第一版 第一章介绍,介绍金融科技fintech是指使用技术提供财务解决方案.人工智能和机器学习技术可以帮助包括欺诈预防.风险管理.客户服务和营销等多个环节的智能化.个 ...

  9. 云计算大数据:Xen、KVM、VMware、hyper-v等虚拟化技术的比较

    1.Xen.KVM.VMware.hyper-v等虚拟化技术的比较,xen和kvm,是开源免费的虚拟化软件. vmware是付费的虚拟化软件. hyper-v比较特别,是微软windows 2008 ...

  10. 医院大数据平台建设_构建医院智能BI平台的关键技术

    在新技术层出不穷的当下,世界各地的组织正在以闪电般的速度变化和进化,以便在新技术可用时加以利用.其中目前最具活力的一个领域是商业智能(BI).想一想,你可能已经习惯以每周或每月IT或数据科学家交付给你 ...

随机推荐

  1. 火山引擎DataLeap基于Apache Atlas自研异步消息处理框架

    更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 字节数据中台DataLeap的Data Catalog系统通过接收MQ中的近实时消息来同步部分元数据.Apache ...

  2. 基于AIO架构smarthttp开发的完整MVC框架

    基于AIO架构smarthttp开发的完整MVC框架 写了篇<基于jdk自带httpserver开发的最小完整MVC框架>,就再写篇AIO的MVC DEMO启动时间:0.1s(应该算少的吧 ...

  3. Solon 小技巧收集 - 页面跳转(重定向)

    @XMapping("/") public void jump(XContext ctx){ ctx.redirect("http://www.noear.org&quo ...

  4. 【flask】flask请求上下文分析 threading.local对象 偏函数 flask1.1.4生命执行流程 wtforms

    目录 上节回顾 今日内容 1 请求上下文分析(源码:request原理) 1.1 导出项目的依赖 1.2 函数和方法 1.3 threading.local对象 1.4 偏函数 1.5 flask 整 ...

  5. AI 视频云 VS 窄带高清,谁是视频时代的宠儿

    随着网络技术的逐渐改善,各类视频消息成为媒体传播的主要选择手段.但其实支撑着视频传播的并不单单是网络技术,还有视频转码与压缩技术.这类技术下分很多,比如曾经被频繁提到的 H.265,比如时下热门的窄带 ...

  6. P1525 关押罪犯 (并查集 / 二分图)| 二分图伪码

    原题链接:https://www.luogu.com.cn/problem/P1525 题目概括: 给你m对关系,每对关系分别涉及到x,y两人,矛盾值为w 请你判断分配x和y到两个集合中,能否避免冲突 ...

  7. 启动vue项目失败,报错Failed at the node-sass@4.14.1 postinstall script.

    https://www.cnblogs.com/xiaodangshan/p/13061618.html

  8. 简易机器学习笔记(八)关于经典的图像分类问题-常见经典神经网络LeNet

    前言 图像分类是根据图像的语义信息对不同类别图像进行区分,是计算机视觉的核心,是物体检测.图像分割.物体跟踪.行为分析.人脸识别等其他高层次视觉任务的基础.图像分类在许多领域都有着广泛的应用,如:安防 ...

  9. C#设计模式17——责任链模式的写法

    是什么: 责任链模式是一种行为型设计模式,它允许对象组成一个链并依次检查另一个对象是否可以处理请求.如果一个对象可以处理请求,它处理请求,并且负责将请求传递给下一个对象,直到请求被处理为止. 为什么: ...

  10. md文件的基本常用编写语法

    md简介 .md即markdown文件的基本常用编写语法,是一种快速标记.快速排版语言,现在很多前段项目中的说明文件readme等都是用.md文件编写的,而且很多企业也在在鼓励使用这种编辑方式.下面就 ...