《2015内容安全年报》

阿里移动安全

第一章 2015年内容安全形势

随着互联网业务的迅速发展,互联网上的信息内容带来了爆炸式的增长。由于缺乏对网络活动进行有效监督和管理的措施,致使互联网内容安全风险增加,在网络上传播赌博、色 情、暴力等内容的事件层出不穷,严重污染了整个互联网的环境。2015年,国家对非法信息整治的法制不断完善,各行业也越来越重视。

1.1 随着互联网发展,各类渠道产生的UGC信息越来越多

不同行业,对信息安全的要求和重点也有不同,信息内容的展示途径也有所不同,当下的途径可分为以下四类:

(1)平台服务商

(2)UGC类网站或移动应用

(3)非交互网站

(4)非交互移动应用

图1 信息内容展示途径的分类
 

随着互联网的逐渐普及和网络技术的不断发展成熟,用户与渠道的交互无处不在。UGC类交互网站、移动应用在互联网中的占比也越来越重,它们逐渐成为人们生活中获取信息的主要工具。但与此同时,信息内容安全风险也在迅速增大,如何保障信息安全、快速、准确传递,如何建立信息安全联动机制,共同维护互联网行业健康发展,迫在眉睫。

1.2 2015年,国家在法律法规层面加强了对网络信息内容安全的管理

《中华人民共和国刑法修正案(九)》开始施行,该法案于2015年11月1日起施行,其中有不少条文针对高发、多发的网络违法行为增补新罪。如《刑法修正案(九)》第二十九条,新设刑法第二百八十七条之一,将当前借助互联网实施危害社会的一些网络行为予以入刑。该规定的范围涉及设立网站、通讯群组、发布消息的上网行为,还包括在网络空间传授犯罪方法的行为,与网络用户都息息相关。

《网络安全法》和《反恐法》草案也已逐步向社会各界公开征求了意见,立法机关正在按程序推进。

1.3 近年来,执 法机关对互联网违规内容的管控和处罚不断趋严

忽视内容安全有可能会面临严重后果,2015年扫黄打非办组织了“净网2015”专项行动,深入整治网上淫秽色 情等有害信息,严厉打击制售传播淫秽色 情信息的违法犯罪分子,对违法违规的互联网企业和相关责任人进行严肃处理,坚决斩断传播链和利益链,有效净化了网络空间。

通过“净网2015”专项活动,在互联网战场共处理59起网络淫秽色 情重点案件,如江苏张家港“1·26”微信传播淫秽物品案、天津“3·10”贩卖传播淫秽物品案等。截至11月份,已宣判13起,行政处罚结案11起。同时各地有关部门共查办此类案件1215起,关闭淫秽色 情网站20650个,删除各类有害信息100余万条。

在2015年5月底至7月底、8月初至9月底的两次重拳整治“微领域”行动中,国家扫黄打非办先后公布了34起微领域传播淫秽色 情信息案。一批违法违规企业被依法处罚,一批违法犯罪人员被严厉惩处,其中广东省相关部门关闭违法空间、微博主页12万余个,解散违法通讯群组3100个,关闭微信账号293个、微信公共账号36个;浙江查办嘉兴平湖金某利用微信群传播淫秽物品案等7起利用微云盘、微信平台传播淫秽色 情信息的重点案件,形成震慑;江苏健全技术监控平台,对全省粉丝量5万以上的1100多个微博账号逐一排查,形成全网监测体系。

图2 2015年全国扫黄打非专项活动

未来,国家执 法机关将会持续开展相关专项整治行动,深入排查“利益链”,依法追责,严加整治,维护社会和谐稳定,确保绿色网络。

1.4. 2015年内容安全事件频发

回顾2015年内容安全热点事件,无一例外都发生在具有交互性质的平台上。其特点在于交互信息的来源不确定、传播速度快,对传统纯粹依靠人力审核、规则判断的内容安全管控带来了极大的挑战。

7.15北京三里屯优衣库不雅视频事件

2015年7月14日晚,一段拍摄于北京优衣库三里屯店的不雅视频在微信朋友圈被大量转发。随后该视频被转发至微博平台,开始大规模传播发酵,2小时内转发量过亿。

图3 优衣库不雅视频事件发展流程

“17”APP涉黄下架事件

2015年9月29日,“17”APP被Apple Store和Google Play相继强制下架。据报道,下架的原因是因为8月28日和9月3日的两次严重直播涉黄事件。2015年8月28日,一男童在“17”APP上直播妹妹洗澡过程; 2015年9月3 日,一对男女在“17”APP上直播性 爱过程。

在下架前,用户总量已经达到700万人,日活跃用户数达70万人。

图4 “17” APP涉黄下架事件发展流程

快播公司涉黄事件

2015年2月6日,深圳快播科技有限公司王欣、吴铭等人因快播平台涉嫌传播淫秽物品牟利罪已被海淀区人民检 察院提起公诉。北京市海淀区人民检 察院认为,快播公司及其主管人员王欣、吴铭、牛文举、张克东的行为均已触犯了《中华人民共和国刑法》第三百六十三条、第三百六十六条、第三十条、第三十一条之规定,构成传播淫秽物品牟利罪。

图5 快播涉黄事件流程 
 

第二章 内容安全的管控难点及解决方案

2.1.内容安全管控的主要难点

近年来,随着快播等重大信息内容安全事件的不断发生、新法规的不断出台以及社会关注度的不断提升,信息内容安全管控已不仅是各政企事业单位的重点,也逐渐演变成社会热点问题和国家信息安全层面的问题。然而管控好信息安全,也存在以下难点。

不了解国家信息安全管控标准

国家已先后出台《互联网信息服务管理办法》、《计算机信息网络国际联网安全保护管理办法》等多部法律法规要求,如何解读这些相关法律规定,如何定义违规信息,如何把握管控尺度等,需要有与政府及监管单位的沟通渠道,以及时掌握国家管控的‘风向标’。

无完整的情报运营体系

违规信息管控的关键还在于如何从庞大的信息中收集相关情报,并做出快速响应。当今社会信息布点广泛,传播有多重途径,每个分散的传播节点都可能成为信息爆发的节点,若无爬虫相关技术或专门舆情收集系统,仅单纯依靠人工进行单点信息收集,运营成本较大的同时还有可能造成信息遗漏;将繁冗并且错综复杂的信息提炼成可运用可部署的信息安全情报也需要专业人员的支持。面临“无渠道”、“无数据”、“无系统”、“无专家”的多重境地,信息安全的管控耗费大多数企业的运营成本与精力。

图6 完整的情报运营体系

无完整的信息安全运营体系,无法及时应对违规事件

如果要做到违规信息的全覆盖,并对违规事件能够实现快速响应,则需要完整的信息安全运营体系,包括情报、风险运营、规则优化、算法迭代等各个链条,是一套完整的运营体系,而一般的企事业单位无内容安全的管控经验并且无相关能力,以优衣库事件为例,如果拥有完整的运营体系,则在紧急事件的应对上会更从容。

图7 优衣库不雅视频事件的信息管控处理流程

无专业算法或技术能力

处在互联网飞速发展的时代,很多企业迅速崛起,但是信息安全检测却跟不上业务前进的步伐。仅依靠人工进行信息审核过滤,人力成本巨大,随着审核团队不断扩大,团队的人员管理也是管理者需要面对的问题。

依靠智能机器识别内容是必然的选择,但是从技术角度上看,想要做好机器智能识别内容并不容易,首先,要有专业的算法团队去支撑产出算法模型。其次,为了保证算法模型的高准确率、高召回率需要海量的样本及机器资源去学习和训练,而海量的样本又需要做打标之后才能投入训练,临时性人力投入巨大,无法做好人员管理。再次,如何获得丰富的样本,迅速的进行样本分类打标,以供算法训练迭代也是痛点。

信息安全投入精力多、成本大

1、精力多:除资金和人力的成本投入外,信息安全管控还需要企业投入大量时间、运营、审核、计算等多方面精力,而且即使投入也未必在短时间内能有显著效果。

2、成本大:传统的信息安全管理手段主要依靠全量的人工审核,然而随着人力成本的增加及人力的局限性,不仅无法保证违规信息的全量覆盖,还在成本上对企业造成巨大的负担,而且随着业务的快速增长,依靠人工的管控模式扩展能力差,无法跟上业务发展的节奏。

2.2 阿里聚安全信息安全解决方案

针对于这些难点,阿里聚安全推出了内容安全产品,为用户提供一站式的内容安全服务体验,帮助企业、开发者在复杂多变的互联网环境下快速发现文本、图片、视频内的违规内容,保障业务的信息内容安全。

图8 阿里聚安全–内容安全产品功能

推出全链路的信息安全服务

阿里聚安全-内容安全以“服务体验”为核心,从业务实践、舆情情报分析、数据样本收集、业务场景细分、众包打标、算法迭代6个环节打造全链路的内容安全服务体验。

图9 阿里聚安全-内容安全全链路的信息安全服务体系

助力“爱唱”,建立智能化内容安全运营模式

以前主要依靠人工方式对公开信息进行内容审核,但由于无相关技术或算法能力可能会造成风险的遗漏,另外随着业务的快速增长,

无法及时找到熟悉业务的审核人员,另外也可能带来人力成本的大幅度增长,阿里聚安全能有效解决以上问题,并且通过阿里聚安全提供的人工智能内容安全识别服务,本来需要1天审核的数据半天就能审核完毕,大大提升了人员的审核效率,降低了人力审核成本,而且通过api方式进行调用不需担心做活动等可能带来信息量的突增问题,阿里聚安全-内容安全是现代内容安全的新型产品的代表,非常实用!

第三章 未来内容安全管控的新趋势

近年来互联网的发展呈现社区化的趋势,尤其是随着智能手机和移动互联网的飞速发展,在无数的网络社区和圈子中发布和接收信息,已经成为人们生活不可或缺的一部分。据阿里聚安全监测数据显示,当前互联网上近75%的网站或应用属于UGC分类,UGC网站和应用的平均流量相比非UGC类高出60%以上。

相较以往,当前互联网上信息的产生更加实时、内容形式更加多样、事件传播更加迅速和广泛、内容的分类也随社区不同而呈现出垂直化特征,这也对内容安全管理提出了新的挑战。

3.1.信息产生的实时性带来了内容安全事件预警的挑战

随着4G技术和WIFI覆盖面的不断扩大,以及智能手机普及率不断提升,任何人都可以随时随地、花样百出地在互联网上发布和传播信息。这使得内容风险难以把控,人工监管难度大、成效小。面对海量多变的内容,单靠人工筛查,解决不了内容风险的问题。

安全管理者几乎需要对其平台上的信息内容进行全天候的监测。以2015年底发生的斗鱼平台“飙车车祸直播”事件为例,网络主播在平台上直播自己的飙车过程,却不料发生车祸,大量网友实时目睹了该事件。对于该类突发事件,信息内容安全管理者几乎无法事先预知。

3.2.内容展现方式的多样性带来了违规内容识别的挑战

多媒体技术的发展,使网络用户可以发布包括文字、图片、音频、视频等多种形式的信息。同时,在信息传播的渠道上,也出现了平台分享、评论、头像、弹幕等多种方式。传统的依赖关键字和人力审核的内容安全管理方式将无法应对如此丰富的展现方式。

3.3.事件传播的爆炸性带来了违规事件应急处理的挑战

互联网信息的传播是瞬间的,对于某些热点事件,甚至会在极短时间内在各个互联网信息平台大规模、爆炸性地发酵和传播。以“优衣库事件”为例,视频首先出现在微信平台后,迅速被转发至微博等其他社交平台,在短短2小时内,该事件被传播超亿次。

如此迅猛的蒸发效应,对每个内容安全管理者的响应速度都提出了巨大的挑战。同时,这也意味着内容安全管理不再是各个平台自扫门前雪的工作,发生在任何一个平台上的内容安全事件,都会瞬间传播至几乎所有平台。

3.4.社区分类的垂直性提升了对内容安全管理专业化的要求

当前,互联网社区呈现垂直化特征,由于不同的兴趣爱好、人群特点、地域特征,用户汇聚成不同的圈子。以社交平台为例,当前社交平台按照人群特征出现了母婴社区、单身交友社区、同志社区等,按照兴趣爱好不同出现了如健身社区、摄影社区等。

如此多样化和垂直化的业务场景,意味着以往全包围式的内容安全运营模式将不再适用。内容安全管理者需要更深入了解不同的业务场景所带来的内容表现形式的差异。


阿里聚安全《2015内容安全年报》完整PDF版下载,请点击这里 

解读2015年互联网UGC内容发展态势,安全事件频发的更多相关文章

  1. 网易发起“疾风”智造IoT联盟,深化“互联网+先进制造业”发展

    7月26日,2019网易云创峰会在杭州拉开序幕,本次峰会以“连接•洞察•进化”为主题,汇聚行业领袖.技术大咖及业界代表,探讨技术演进与行业应用趋势,研商生态合作升级.共赢未来的道路.上午的主论坛中,网 ...

  2. web前端的发展态势

     以前 作为一个java程序员写的代码主要还是后台的代码,虽然开始的时候前后端都写,但是也是用别人造好的轮子来用,学学html,css,js,jquery,再找一个前端ui框架学学,上手之后我们就可以 ...

  3. web前端的发展态势 浅识

    以前 作为一个java程序员写的代码主要还是后台的代码,虽然开始的时候前后端都写,但是也是用别人造好的轮子来用,学学html,css,js,jquery,再找一个前端ui框架学学,上手之后我们就可以写 ...

  4. 专家谈国产CPU最新发展态势:需强化标准建设(很全面)

    一.国产CPU发展现状与成就 国内已开启多技术路线并行的CPU技术产业新格局.在国家科技重大专项和国家级集成电路产业投资资金的推动之下,我国CPU产品技术研发已进入多技术路线同步推进的高速发展阶段,并 ...

  5. RIA(富客户端)发展态势

    在过去的两到三年中,Web开发人员一直是想构建一种比传统HTML更丰富的客户端:这是一个用户接口,它比用HTML能实现的接口更加健壮.反应更加灵敏和更具有令人感兴趣的可视化特性.RIA技术的出现允许我 ...

  6. 【总结整理】UGC内容

    除了内容了产品,还有什么适合引入UGC? :引发讨论,诱导参与,然后促成销售. User Generated Content,也就是用户生成内容的意思. 购买类产品,内容催生购买 1.为用户购买提供思 ...

  7. 前端发展态势 && 前端工作流程个人浅析

    于在未开启cleartype的情况下,一些中文字体在非偶数字号下的显示效果欠佳,所以一般建议使用12.14.16.18.22px等偶数字号.也就 是对某个分辨率选择离它最近的偶数字号.例如:屏幕横向分 ...

  8. 【Social listening实操】作为一个合格的“增长黑客”,你还得重视外部数据的分析!

    本文转自知乎 作者:苏格兰折耳喵 ----------------------------------------------------- 在本文中,作者引出了"外部数据"这一概 ...

  9. 以虎嗅网4W+文章的文本挖掘为例,展现数据分析的一整套流程

    本文转自知乎 作者:苏格兰折耳喵 ----------------------------------------------------- 本文作者将结合自身经验,并以实际案例的形式进行呈现,涉及从 ...

随机推荐

  1. SecureCRT在远程主机和本地之间传输文件

    概述 Linux系统不像Window系统有清晰的操作页面,数据能Copy下来,远程Linux的数据,就牵扯到本地数据与远程服务器数据交换的问题.Linux远程攻击SecureCrt提供了2种方式,可以 ...

  2. .NET 缓存模块设计

    上一篇谈了我对缓存的概念,框架上的理解和看法,这篇承接上篇讲讲我自己的缓存模块设计实践. 基本的缓存模块设计 最基础的缓存模块一定有一个统一的CacheHelper,如下: public interf ...

  3. Andriod学习笔记3:Mac 平台下搭建 CLion 集成开发环境

    1. 安装Xcode 通过App store或者下载安装Xcode. 安装完成之后,最好启动一下Xcode,否则可能会报"Error:The C compiler "/usr/bi ...

  4. Chrome 中的彩蛋,一款小游戏,你知道吗?

    今天看到一篇文章,介绍chrome中的彩蛋,带着好奇心进去看了一眼,没想到发现了一款小游戏,个人觉得还不错,偶尔可以玩一下,放松放松心情!^_^ 当 Chrome 无法连接到互联网时, 或者上着网突然 ...

  5. [原创] Go语言在Centos上的部署

    序言 Golang是个好东西啊.部署非常简单,对于运维人员来说太爽了. 传统的Nginx啊Apache啊,外加PHP以及各个插件啊搞得头晕. 用了Go之后就什么都不需要了.只要把生成好的文件向服务器上 ...

  6. [NHibernate]查看NHibernate生成的SQL语句

    最近接触到一个用Spring.Net结合NHIbernate的项目,第一次使用,有很多配置,数据操作一旦出问题,很难找到原因,那么如何查看NHibernate发送给数据库的SQL语句呢? 当然我们可以 ...

  7. 《DSP using MATLAB》示例Example5.21

  8. CentOS6.5的vsftp搭建流程(一)

    前几次搭建FTP都失败了,不是登陆不了,就是目录没有权限.现在终于摸索出了靠谱的操作流程,分享之~ 1. 查看是否安装了vsftpd,未安装则安装 [root@iZ283tian2dZ /]# rpm ...

  9. 51Nod 1010 只包含因子2 3 5的数 Label:None

    K的因子中只包含2 3 5.满足条件的前10个数是:2,3,4,5,6,8,9,10,12,15. 所有这样的K组成了一个序列S,现在给出一个数n,求S中 >= 给定数的最小的数. 例如:n = ...

  10. 深入理解JavaScript中 fn() 和 return fn() 的区别

    在js中,经常会遇到在函数里调用其它函数的情况,这时候会有 fn() 这种调用方式,还有一种是 return fn() 这种调用方式,一些初学者经常会一脸萌逼地被这两种方式给绕晕了.这里用一个优雅的面 ...