【K哥爬虫普法】房产数据刑吗?爬虫多年没踩过缝纫机,劝你找找自己原因!
我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。
案情简介
被告单位厦门房麦网络科技有限公司(以下简称房麦公司)于 2018 年至 2020 年间,利用网络爬虫程序,采用破解验证码等手段非法获取北京某信息技术有限公司(以下简称某公司)经营的某网站房产数据,经解密、加工、整理后供房麦公司的房产 APP 使用,造成某公司网络资费、人力成本等经济损失人民币 10 万余元,并造成某公司相关费用受损共计人民币 300 余万元。
房麦公司于 2015 年 6 月成立,法定代表人为被告人林镇平,公司成立后研发“推房神器”等 APP。从 2018 年开始,被告单位房麦公司使用网络爬虫技术爬取某网站房产数据。在某公司增加反爬取策略后,2019 年 10 月至 2020 年 7 月间,被告单位房麦公司使用破解验证码、绕开登录验证等方式破解某公司的反爬取措施,非法获取房源数据,并将非法获取的房产数据存放在自己的服务器中供“推房神器” APP 调用,并向该 APP 用户收取会员费盈利。
被告人林镇平作为被告单位房麦公司法定代表人,全面管理公司工作。
被告人程华东作为被告单位房麦公司技术部技术总监,在林镇平的指挥下具体安排非法获取房产数据的各项工作。
被告人林裕森作为被告单位房麦公司技术部工程师,其主要职责之一就是购买破解某公司验证码的程序,负责日常服务器上爬虫程序的维护。
在案其他涉案人员申某、林轩、董某等人均为被告单位房麦公司技术部工程师,在被告人程华东的指挥下,维护、使用爬虫技术非法获取某公司房产数据。
法院观点
被告单位厦门房麦网络科技有限公司违法国家规定,非法获取某公司计算机信息系统中的数据,情节特别严重,依法应予惩处。
被告人林镇平作为被告单位直接负责的主管人员,被告人程华东、林裕森作为被告单位其他直接责任人员,亦应予以惩处。
北京市朝阳区人民检察院指控被告单位厦门房麦网络科技有限公司、被告人林镇平、程华东、林裕森犯非法获取计算机信息系统数据罪的事实清楚,证据确实、充分,指控罪名成立。
判决情况
一、被告单位厦门房麦网络科技有限公司犯非法获取计算机信息系统数据罪,判处罚金人民币二十万元。
二、被告人林镇平犯非法获取计算机信息系统数据罪,判处有期徒刑一年六个月,罚金人民币二万元。
三、被告人程华东犯非法获取计算机信息系统数据罪,判处有期徒刑一年二个月,罚金人民币一万元。
四、被告人林裕森犯非法获取计算机信息系统数据罪,判处有期徒刑八个月,罚金人民币一万元。
五、扣押在案,手机十部、计算机主机七台、笔记本电脑二台、服务器一个,依法予以没收。
裁判文书
(2020)京0105刑初2594号
案例分析
本案中,被告单位厦门房麦网络科技有限公司,爬取了某网站的房产数据,并将数据直接转移到自己公司的产品中,并因此获利,在网站增设验证码、相关接口关键参数加密等反爬策略之后,通过技术手段,绕过这些反爬策略,照常进行相关数据采集,时间长达两年半。
大部分网站存在各类反爬策略以及相关行为风控手段,自然是不想数据被爬虫及其他手段获取到的,由本案可知,在不被许可的情况下,爬取他人网站数据,并因此获利,只要被对方收集到足够的证据,是很容易被判为非法获取计算机信息系统数据罪的。想通过采集网站数据获利,一定要提前做好充分的准备,最好请法务评估一下法律风险,尽量规避一些违法的可能。
结合本案与之前的普法案例,不难看出,就算是领导下派的任务,只要公司行为违法,每一个参与者都难辞其咎。因此不论是公司,还是个人,都应该对所做项目有充分的评估,不要抱有侥幸心理,觉得自己会是那条“漏网之鱼”。
虽然本案中,个人罚金最高的才 20 克花西子,但是别忘了,一旦判刑至少影响三代人,三思而后行!
【K哥爬虫普法】房产数据刑吗?爬虫多年没踩过缝纫机,劝你找找自己原因!的更多相关文章
- Python爬取房产数据,在地图上展现!
小伙伴,我又来了,这次我们写的是用python爬虫爬取乌鲁木齐的房产数据并展示在地图上,地图工具我用的是 BDP个人版-免费在线数据分析软件,数据可视化软件 ,这个可以导入csv或者excel数据. ...
- 【爬虫】把抓到数据存起来——爬虫绝配mongodb
[爬虫]把抓到数据存起来——爬虫绝配mongodb 视频地址 抓取数据的方法,前面的课程该讲的都已经讲了,爬取下来数据只是第一步,第二步就是要先存起来.我们最容易想到的就是存文件里喽,python写文 ...
- python爬虫(一)_爬虫原理和数据抓取
本篇将开始介绍Python原理,更多内容请参考:Python学习指南 为什么要做爬虫 著名的革命家.思想家.政治家.战略家.社会改革的主要领导人物马云曾经在2015年提到由IT转到DT,何谓DT,DT ...
- Python多线程爬虫与多种数据存储方式实现(Python爬虫实战2)
1. 多进程爬虫 对于数据量较大的爬虫,对数据的处理要求较高时,可以采用python多进程或多线程的机制完成,多进程是指分配多个CPU处理程序,同一时刻只有一个CPU在工作,多线程是指进程内部有多个类 ...
- 爬虫(二)Python网络爬虫相关基础概念、爬取get请求的页面数据
什么是爬虫 爬虫就是通过编写程序模拟浏览器上网,然后让其去互联网上抓取数据的过程. 哪些语言可以实现爬虫 1.php:可以实现爬虫.php被号称是全世界最优美的语言(当然是其自己号称的,就是王婆 ...
- 05.Python网络爬虫之三种数据解析方式
引入 回顾requests实现数据爬取的流程 指定url 基于requests模块发起请求 获取响应对象中的数据 进行持久化存储 其实,在上述流程中还需要较为重要的一步,就是在持久化存储之前需要进行指 ...
- 第三百四十二节,Python分布式爬虫打造搜索引擎Scrapy精讲—爬虫数据保存
第三百四十二节,Python分布式爬虫打造搜索引擎Scrapy精讲—爬虫数据保存 注意:数据保存的操作都是在pipelines.py文件里操作的 将数据保存为json文件 spider是一个信号检测 ...
- python爬虫的页面数据解析和提取/xpath/bs4/jsonpath/正则(1)
一.数据类型及解析方式 一般来讲对我们而言,需要抓取的是某个网站或者某个应用的内容,提取有用的价值.内容一般分为两部分,非结构化的数据 和 结构化的数据. 非结构化数据:先有数据,再有结构, 结构化数 ...
- Python爬虫之三种数据解析方式
一.引入 二.回顾requests实现数据爬取的流程 指定url 基于requests模块发起请求 获取响应对象中的数据 进行持久化存储 其实,在上述流程中还需要较为重要的一步,就是在持久化存储之前需 ...
- 基于Thinkphp5+phpQuery 网络爬虫抓取数据接口,统一输出接口数据api
TP5_Splider 一个基于Thinkphp5+phpQuery 网络爬虫抓取数据接口 统一输出接口数据api.适合正在学习Vue,AngularJs框架学习 开发demo,需要接口并保证接口不跨 ...
随机推荐
- GIS拓扑讲解点线面几何体的拓扑关系判断及运算分析_turf案例
Turf.js简介 Turf.js是JavaScript 空间分析库,由Mapbox 提供,Turf 实现了 空间分析操作,例如生成缓冲区.计算等高线,建立 TIN 等: 空间几何对象关系的计算,点 ...
- 电商流量分析怎么做?试试这款数据工具 DataLeap!
更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 作为成熟的电商模式,货架场景可以让商家以更低的门槛入驻,让消费者完成更高销量的购买和复购. 在这一场景下,运营人员 ...
- 火山引擎数智平台拆解 APP改版场景中蕴含的数据思维
更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 你有没有遇到过,打开一款经常使用的 APP,它却跳出一条需要你升级版本的提示? 大多数情况下,用户可能会直接点击「 ...
- 1个案例读懂——游戏产品如何用 A/B 测试做增长
更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 随着国内游戏用户数量趋于饱和,中国游戏产业也从高速成长期逐渐转型,市场成熟度提升,竞争趋于精细化. 随着游戏出海以 ...
- Java 全新生态的框架,Solon v1.10.12 发布
一个更现代感的 Java 应用开发框架:更快.更小.更自由.没有 Spring,也没有 Servlet,独立的生态.主框架仅 0.1 MB.Helloworld: @Controller public ...
- 小姐姐跳舞,AI 视频生成太酷了
大家好,我是章北海 最近AI视频领域的研究进展神速,看得眼花缭乱. 这里老章就把最近几天看过印象深刻的四个项目介绍给大家,同时附上项目相关简介.论文.代码等资料,感兴趣的同学可以深度研究一下. < ...
- PS 创建网络去掉反冲增强
一.当物料为反冲物料时,创建网络数据,希望去掉反冲标识 二.增强实施 在BAPI中传入反冲标识为空 在标准代码中发现反冲标识的赋值位置 判断当不传入反冲标识,将物料自带的反冲标识清空 定期更文,欢迎关 ...
- AtCoder Beginner Contest 175 (AB水,C数学,D思维+前缀和处理+进价思考,E方阵+条件DP,F新回文字符串处理 GJ)
补题链接:Here A - Rainy Season 如果不是 RSR 型的话直接计算 R 的数量即可 B - Making Triangle 给定 \(N\) 根长度分别为 \(L_i\) 的棍子, ...
- 你有一份Rx编程秘籍请签收
一.背景 在学习Rx编程的过程中,理解Observable这个概念至关重要,常规学习过程中,通常需要进行多次"碰壁"才能逐渐"开悟".这个有点像小时候学骑自行车 ...
- 你想怎么使用 Serverless 函数计算?(评测赢好礼 )
随着云计算发展,云原生热度攀升,Serverless 架构崭露头角且发展势头迅猛.不仅被更多开发者所关注,市场占有率也逐年提高.阿里云函数计算(Function Compute)是一个事件驱动的全托管 ...