我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。

案情介绍

2015年,被告人肖某开发了一款免费看小说 APP,为了牟利,肖某从腾讯广告联盟下载广告包并插入该 APP 应用程序,用户在通过该 APP 阅读小说时点击其中的广告,广告联盟会自动以点击量计算广告推广费。之后肖某注册成立“某网络技术工作室”公司,并以公司名义将 APP 陆续上架到应用商城。为通过著作权资质的审查,肖某伪造相应作品转让授权证明上传至各应用商城。

2019年,肖某成立公司开发“悦读免费小说”手机 APP 软件并上架,提供网络小说在线阅读服务。后为获取更多利益,肖某将网络爬虫程序植入 APP 应用中,自动爬取互联网上各小说网站的网页链接、小说名称、小说作者、小说简介、小说图片等信息,并分类存放于腾讯云服务器当中,且不间断更新爬取内容。用户在 APP 中搜索或点击相关信息后,APP 将自动爬取到的小说信息提取出来,发送并缓存在上述服务器中,再通过第三方网页重新排版,并插入广告公司提供的广告供用户阅读。

腾讯公司每月根据该程序中的点击量按每次单价 0.2 元至 1 元不等的价格结算广告推广费,费用转到长沙畅想网络技术工作室的银行账户。为了规避风险,肖某分别于2020年5月26日、7月17日以其父亲肖某、母亲王某的身份注册上海昶悠网络技术工作室和上海毓璃网络技术工作室,并用该两个公司的对公银行账户接收腾讯公司结算的广告推广费用。

2021年6月,北京腾飞克科技有限公司发现“悦读免费小说” APP 在未经其许可的情况下,大量非法复制了该公司享有著作权的作品。经广东甄明司法鉴定所鉴定:固定至“悦读免费小说” APP 中 576 部小说作品与永丰舸渡网络科技有限公司提供的拥有著作权的小说作品具有相同名称,其中 551 部小说作品相似度大于70%。

公诉机关变更起诉为:经广东甄明司法鉴定所于2022年2月25日鉴定,固定到“悦读免费小说” APK 文件并通过程序获得“悦读免费小说侵权书单.xlsx”同名小说 4547 本,经检验,与版权方提供的版权小说相似度大于70%的共计 3968 本。上述相似度大于70%的小说合计 4519 本。

2020年1月至2021年8月期间,长沙畅想网络技术工作室广告收益 9167638.55 元,上海毓璃网络技术工作室广告收益 10863914.2 元,上海昶悠网络技术工作室广告收益 286828.46 元。肖某共获取广告推广费 2000 余万元。

法院观点

《最高人民法院关于审理侵害信息网络传播权民事纠纷案件适用法律若干问题的规定》第三条规定“网络用户、网络服务提供者未经许可,通过信息网络提供权利人享有信息网络传播权的作品、表演、录音录像制品,除法律、行政法规另有规定外,人民法院应当认定其构成侵害信息网络传播权行为。通过上传到网络服务器、设置共享文件或者利用文件分享软件等方式,将作品、表演、录音录像制品置于信息网络中,使公众能够在个人选定的时间和地点以下载、浏览或者其他方式获得的,人民法院应当认定其实施了前款规定的提供行为”。

本案中被告人肖某开发的“悦读免费小说” APP 中设置了爬虫程序从其他网站扒取小说书名、封面、网站链接等,并把小说链接、小说简介、小说名字等信息存储到其服务器里,并且进行了增减、排版和过滤,插入广告,读者可以六种方式通过“阅读免费小说” APP 进行阅读,其中“立即阅读”模式读者可以在该 APP 页面直接阅读小说,“全书缓存”模式可以下载小说供读者在选定的时间和地点阅读,“悦读免费小说”中扒取的小说均未经过著作权或其授权人的许可,侵害了著作权权利人的信息网络传播权。

被告人肖某辩护其服务器中并未存储小说,但存储了小说链接、小说简介、小说名字,虽然“悦读免费小说” APP 中确实有链接服务,但是其提供的不是普通链接服务,用户点击后并不直接跳转到第三方网页首页,而是直接在该 APP 中显示相关页面,被告人亦供述“悦读免费小说” APP 默认是全屏阅读,读者都是在 APP 的界面中进行阅读,在全屏阅读时分辨不出在哪个网站进行观看小说的,因为软件自动进行了转码阅读,只有读者自己退出全屏阅读点击菜单才能看到是在哪个网站看到的,也就是说读者完全感觉是在“悦读免费小说” APP 中进行阅读,而不是在其他网站进行阅读,故应当认定属于复制发行和传播行为。“悦读免费小说” APP 中扒取的小说经司法鉴定与被害人北京腾飞克科技有限公司享有著作权包括信息网络传播权的小说相似度大于70%的有 4519 部,因此被告人的行为构成侵犯著作权权利人信息网络传播权的行为

法院认为,被告人肖俊以营利为目的,未经著作权权利人许可,擅自在其开发的“悦读免费小说” APP 中复制发行他人享有著作权权利的文字作品,其行为构成侵犯著作权罪。被告人肖俊非-法-经营数额达 2000 余万元,非法复制发行他人作品的数量众多,属于情节特别严重,依法应在三年以上十年以下有期徒刑幅度内量刑,并处罚金。

2021年12月24日,永丰县人民检察院以肖某犯侵犯著作权罪提起公诉。2022年8月15日,法院作出一审判决,以犯侵犯著作权罪,判处肖某有期徒刑五年,并处相应罚金。肖某不服判决,提出上诉。2022年10月25日,中级人民法院裁定驳回上诉,维持原判。

判决情况

  • 被告人肖某犯侵犯著作权罪,判处有期徒刑五年,并处罚金人民币 100 万元;

  • 追缴被告人肖某违法所得 20318381.21 元及其产生的收益,上缴国库;。

  • 没收扣押在案的作案工具苹果 macbookpro 电脑一台。

判决文书

(2022)赣0825刑初2号

案例分析

根据案情介绍,肖某通过网络爬虫技术爬取电子小说信息,为用户提供直接阅读、下载功能,使公众可以在选定的时间和地点阅读,符合信息网络传播行为的实质性要件,侵犯了权利人的信息网络传播权,并依此获取了巨额的利益,这种行为明显是触犯了法律法规的。这种小说侵犯著作权案屡见不鲜,早在2011年,盛大文学就告了“小说5200”网站的侵权行为,后者的相关负责人最终也都被判刑了。在网络上爬取喜欢的小说,供自己或朋友阅读,见仁见智,但是切莫大量的爬取小说、文章等,然后借此获利,这是缺乏道德,且违反法律的行为。

通过爬虫侵犯著作权来获取作品并以盈利的方式使用,将著作权人的劳动成果无偿占为己有,对著作权人造成经济损失。同时,这种行为也扭曲了正常的市场竞争,给那些合法获得授权并按照规定使用作品的人带来不公平的竞争环境。一旦大众缺乏版权意识,都抱着白嫖的心理,使得盗版抄袭行为猖獗,形成一种恶性的市场环境,必然会打击原创者的积极性,好的作品将会越来越少。

随着网络技术的发展,通过信息网络向公众提供作品的获利方式不再局限于收取会员注册费或者作品下载费、阅读费等直接、传统的收益方式,而是逐渐转向收取第三方高额广告费等间接方式,利用海量用户在使用软件时的巨大广告点击量牟取暴利。这不失为一种好的策略,但切记提供的产品一定不能是侵权所得,不然获利再多,也迟早有吐出来的那一天,谁都想赚钱,不过一定要通过合法合规的渠道

还是老话长谈,技术本身是无罪的,但谨记不要利用技术来实施可能违法犯罪的行为。不要心怀侥幸,若一直游走于刀尖,出事是迟早的事情,一定不要为一时的利益蒙蔽了双眼。在此劝谏各位爬虫工程师们,切莫触碰灰黑地带,越过了法律的红线!

【K哥爬虫普法】一个人、一年半、挣了2000万!的更多相关文章

  1. (转)Python网络爬虫实战:世纪佳缘爬取近6万条数据

    又是一年双十一了,不知道从什么时候开始,双十一从“光棍节”变成了“双十一购物狂欢节”,最后一个属于单身狗的节日也成功被攻陷,成为了情侣们送礼物秀恩爱的节日. 翻着安静到死寂的聊天列表,我忽然惊醒,不行 ...

  2. 爬虫逆向基础,理解 JavaScript 模块化编程 webpack

    关注微信公众号:K哥爬虫,QQ交流群:808574309,持续分享爬虫进阶.JS/安卓逆向等技术干货! 简介 在分析一些站点的 JavaScript 代码时,比较简单的代码,函数通常都是一个一个的,例 ...

  3. RPC 技术及其框架 Sekiro 在爬虫逆向中的应用,加密数据一把梭!

    什么是 RPC RPC,英文 RangPaCong,中文让爬虫,旨在为爬虫开路,秒杀一切,让爬虫畅通无阻! 开个玩笑,实际上 RPC 为远程过程调用,全称 Remote Procedure Call, ...

  4. Python 3.10 正式发布,新增模式匹配,同事用了直呼真香!

    关注微信公众号:K哥爬虫,QQ交流群:808574309,持续分享爬虫进阶.JS/安卓逆向等技术干货! 前几天,也就是 10 月 4 日,Python 发布了 3.10.0 版本,什么?3.9 之后居 ...

  5. 逆向进阶,利用 AST 技术还原 JavaScript 混淆代码

    什么是 AST AST(Abstract Syntax Tree),中文抽象语法树,简称语法树(Syntax Tree),是源代码的抽象语法结构的树状表现形式,树上的每个节点都表示源代码中的一种结构. ...

  6. 关于 K米 —— 的案例分析

    第一部分 调研,评测 评测 下载并使用,描述最简单直观的个人第一次上手体验. 我觉得ktv遥控软件设计的很好,给我带来了很多方便,点歌也不用那么麻烦了跑到台子那里点,调各种音量灯光也是,所以第一次上手 ...

  7. 终于等到你: 图形化开源爬虫Hawk 3发布!

    超级图形化爬虫Hawk已经发布两年半时间了,2015年升级到第二版,收到上千条用户反馈(tucao),100多个红包,总共666块五毛~一直想攒着这笔钱,去北境之王天通苑的龙德商场买最心爱的阿迪王! ...

  8. 剑指Offer面试题15(Java版):链表中倒数第K个结点

    题目: 输入一个链表.输出该链表中倒数第k哥结点.  为了符合大多数人的习惯,本题从1開始计数.即链表的尾结点是倒数第1个结点. 比如一个链表有6个结点.从头结点開始它们的值依次是1.2.3,4,5, ...

  9. Java [leetcode 23]Merge k Sorted Lists

    题目描述: Merge k sorted linked lists and return it as one sorted list. Analyze and describe its complex ...

  10. 《机器学习实战》读书笔记—k近邻算法c语言实现(win下)

    #include <stdio.h> #include <io.h> #include <math.h> #include <stdlib.h> #de ...

随机推荐

  1. 物联网企业该如何与华为云合作,这份FAQ值得一看

    摘要:关于华为云DevRun智联生活行业加速器,梳理出伙伴和企业最关心的问题,并逐一解答. 自华为云DevRun智联生活行业加速器发布以来,一直在为产业链上下游的企业提供技术.生态建设.商业变现等资源 ...

  2. Solon Aop 特色开发(2)注入或手动获取Bean

    Solon,更小.更快.更自由!本系列专门介绍Solon Aop方面的特色: <Solon Aop 特色开发(1)注入或手动获取配置> <Solon Aop 特色开发(2)注入或手动 ...

  3. Python 网络舆情分析系统,舆论可视化界面

    1 简介 舆情管理系统,这不仅仅可以帮助当地的管理人员迅速的排查跟本地有关的负面言论,还可以避免网民因为本身意识不到位而评论或发布一些不好的观点的情况,最终的目的就是帮助社会更好的发展. 2 技术栈 ...

  4. 【HZERO】数据导入

    #数据导入 ##文档整理 通用导入客户端 https://open.hand-china.com/hzero-docs/v1.3/zh/docs/service/import/import/ 开放平台 ...

  5. 解决SUM函数返回为NULL

    解决SUM函数返回为NULL SUM函数的作用:计算某一字段中所有行的数值和, 使用SUM函数进行对符合条件的结果行数进行求和. 问题产生: sum 求和时会对 null 进行过滤,不计算,但如果没有 ...

  6. 供应链安全情报 | 恶意py包伪装代理SDK进行后门攻击,目标锁定python开发者

    概述 2023年11月28号,悬镜供应链安全实验室在Pypi官方仓库(https://pypi.org)监测到两起伪装成http和socks5代理SDK的开源组件投毒事件.python开发者一旦下载安 ...

  7. Vue3使用vue-video-player组件

    1.安装依赖(亲测5.0.1版本可用,最新版本会找不到'vue-video-player/src/custom-theme.css'这个样式) yarn add  vue-video-player@5 ...

  8. Go语言安装(Windows10)

    一. 官网下载 https://golang.google.cn/dl/   二. 软件包安装 选择对应的路径进行安装   三. 环境变量设置 1.path 检查系统环境变量Path内已经添加Go的安 ...

  9. Visual Studio Code如何校验yaml格式文件

    1.yaml格式校验快捷键:Shift+Alt+F默认没有安装,这时候点击安装: 2.选择YAML Language Support by Red Hat   3.安装完成后,自动开启校验,当格式错误 ...

  10. 每天学五分钟 Liunx 0110 | 服务篇:守护进程 systemd

    有些进程会在系统上运行较长时间,如前面的 Hello World 程序运行时产生的进程.有些进程运行瞬间就结束了,如执行 ps 命令产生的进程,也有的进程会常驻在内存中,提供相应的服务,这样的进程称为 ...