简评:还有其他公司比 Facebook 更能收集我们的数据么?大概,可能,没准是谷歌。(文末彩蛋)

  最近 Facebook 已经因为收集个人数据而站在了聚光灯前,它收集用户数据并因此获利。

  但是要知道,Facebook 不是单独一家「在用户毫不知情」的情况下收集数据的公司,Google 可能更甚:它的信息搜集量,追踪范围,以及用户在 Google 相应网站和应用上花费更多的时间。

  但是尽管如此,仍然有很多用户不了解自己的信息被收集和使用的程度。

  欧洲正在拟定新法规[1],推动谷歌等公司公开更多信息,让用户自主选择数据权限。普林斯顿大学的助理教授 Arvind Narayanan 说:「这是系统性问题,它不仅限于 Facebook。他认为,更大的问题是这些公司的商业模式是面向公众隐私而获利。」

  我们需要了解 Google 在这方面的角色。

在这里还是要推荐下我自己建的大数据学习交流群:784557197,群里都是学大数据开发的,如果你正在学习大数据 ,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有大数据软件开发相关的),包括我自己整理的一份2018最新的大数据进阶资料和高级开发教程,欢迎进阶中和进想深入大数据的小伙伴加入。

Google CEO: Sundar Pichai

  Google 是如何收集数据?

  Google 允许所有人(无论是否有 Google 账号)都可以关闭广告定位权限[2],然而就像 Facebook 一样,它仍然会继续收集数据。

Google Analytics 已成为网络最主要的数据分析平台。在美国大约一半的大公司网站都在使用,总共有 3000 万到 5000 万个网站数据在其中。Google Analytics 会跟踪用户是否登录。

  与此同时,Google 可以用多种方式跟踪数十亿的 Google 账号。2016年,Google 改变了服务条款[3],允许 Google 追踪广告数据和 Google 账户数据合并的信息。

  Google 获取我们的浏览和搜索历史记录,我们安装的应用程序,年龄和性别等人口统计数据,以及我们在现实世界中购物等其他数据来源。谷歌表示,它不会使用来自种族,宗教,性取向或健康等「敏感信息」。因为 Google 依赖于跨平台、跨设备追踪,所以无论用户使用哪种设备,Google 都可以获取到数据。

  这就是 Google 和 Facebook 在网络广告中独占鳌头的主要原因,通过将我们的数据与最新的 AI 技术整合以获取利益最大化。

  Google 在美国拥有 4000 个数据代理(data brokers),他们知道我们的一切,我们是否怀孕,是否离婚或者试图减肥。Google 直接与代理公司合作,代理公司会把数据打包整合,卖给下家,包括保险公司、雇主、和其他对数据变现感兴趣的人。

  Android 如何导入数据

Android 在世界移动大会的展馆(巴塞罗那)

  全球有 20 亿活跃的 Android 设备,Google 从中收集超大量的数据。因此,每当数据被不当使用事件爆发后,Google 总是难逃其责。

  一个很好的例子:Facebook 的 Android 版本可以持续收集用户通话和文字记录,但是在 iOS 版本就不能获取这个权限。Android 系统经常要求用户 XXX 的权限,这些应用经常告诉用户这个权限是用于地理位置、拍照、通话等,但是其他隐含的意义和危害只字不提。

  GMail Android 版,一次又一次要求用户开放摄像头和麦克风权限,直到用户给他们权限为止。Google 地图要求用户启用位置服务,当然着很合理,但同时也会用于地理位置广告。

  这些表面上都会问你一下,是否允许使用,但是即使专家都很难搞清楚其背后的含义,更别说大众了。

  Google 会承担责任么?

  Google 并不了解其业务模式的固有问题,或者说认识的并不够清晰。Google 反对加利福尼亚消费者隐私法,理由是这份法案含糊不清。加利福尼亚消费者隐私法主要涉及三点:

  消费者拥有自己的个人信息所有权,可以要求企业不得出售自己的个人信息

  消费者有权知道自己的信息出售到了哪里

  消费者有权知道服务提供商是否正在保护自己的个人信息

  即使是 Facebook 也是最开始反对这份法案,但是后来也妥协了(他敢反对?)。

  关于个人信息安全,解决的方案可能也很简单:更好地工具,清楚让用户知道他们正做的选择,给出的权限意味着什么;很多公司可能会收集自己的信息,但自己拥有拒绝的权利。

  有个东西叫做底线。

Google 是如何收集我们的个人数据的的更多相关文章

  1. seo之google rich-snippets丰富网页摘要结构化数据(微数据)实例代码

    seo之google rich-snippets丰富网页摘要结构化数据(微数据)实例代码 网页摘要是搜索引擎搜索结果下的几行字,用户能通过网页摘要迅速了解到网页的大概内容,传统的摘要是纯文字摘要,而结 ...

  2. 如何用 Python 和 API 收集与分析网络数据?

    摘自 https://www.jianshu.com/p/d52020f0c247 本文以一款阿里云市场历史天气查询产品为例,为你逐步介绍如何用 Python 调用 API 收集.分析与可视化数据.希 ...

  3. SQL Server自动化运维系列——关于数据收集(多服务器数据收集和性能监控)

    需求描述 在生产环境中,很多情况下需要采集数据,用以定位问题或者形成基线. 关于SQL Server中的数据采集有着很多种的解决思路,可以采用Trace.Profile.SQLdiag.扩展事件等诸多 ...

  4. 日志收集之--将Kafka数据导入elasticsearch

    最近需要搭建一套日志监控平台,结合系统本身的特性总结一句话也就是:需要将Kafka中的数据导入到elasticsearch中.那么如何将Kafka中的数据导入到elasticsearch中去呢,总结起 ...

  5. Linux:监测收集linux服务器性能数据工具Sysstat的使用与安装

    Sysstat是一个工具集,包括sar.pidstat.iostat.mpstat.sadf.sadc.其中sar是其中最强大,也是最能符合我们测试要求的工具,同时pidstat也是非常有用的东东,因 ...

  6. 用TCGA收集的mRNA表达数据作差异表达

    做差异表达的软件DEseq和edgeR所需要的数据格式必须是原始counts,经过normalization和log2后的数据都不适合,所以对于做差异表达计算的童鞋可以使用ExperimentHub下 ...

  7. 使用Google API 下拉刷新或者增加数据 SwipeRefreshLayout

    贴出布局代码: <android.support.v4.widget.SwipeRefreshLayout android:id="@+id/id_swipe_ly" and ...

  8. Google 常用镜像收集

    1`下面列出几个目前常用的 公共DNS 服务器地址: 名称 DNS 服务器 IP 地址 OpenerDNS 42.120.21.30   百度 DuDNS 180.76.76.76   阿里 AliD ...

  9. Google中Gson的使用解析json数据-------学习篇

    之前写过一篇Gson解析json数据的基本应用,这里不多说,直接上例子. 有兴趣的可以先阅读下之前那篇,这里附上链接: http://www.cnblogs.com/Ant-soldier/p/632 ...

随机推荐

  1. MySQL and Sql Server:Getting metadata using sql script (SQL-92 standard)

    MySQL: use sakila; -- show fields from table_name; -- show keys from table_name; SELECT `REFERENCED_ ...

  2. Python中元组相关知识

    下面给大家介绍以下元组的相关知识: ·元组可以看成是一个不可更改的list 1.元组的创建 # 创建空元祖 t = () print(type(t)) # 创建只有一个值的元组 # 观察可知元组中如果 ...

  3. React 入门学习笔记整理(九)——路由

    (1)安装路由 React-router React-router提供了一些router的核心api,包括Router, Route, Switch等,但是它没有提供dom操作进行跳转的api. Re ...

  4. Jenkins报错'Gradle build daemon disappeared unexpectedly'的问题解决

    在将项目集成到 Jenkins 后,经常会出现不稳定的构建,Jenkins 控制台输出的错误信息为:Gradle build daemon disappeared unexpectedly (it m ...

  5. 爬虫 scrapy 笔记

    scrapy 基础 1.  创建一个spider项目 a)         Scrapy startproject project_name [project_dir] b)         Cd p ...

  6. Java并发编程--总结

    1.并发优势 2.并发安全性 3.并发优化 4.并发内存模型 https://pan.baidu.com/s/1J4S2tC7YDgdOwtAg1970sg

  7. HttpClient与浏览器调用服务接口差异

    我用httpclient访问接口,统计图有些不均匀,差距较大 ,有时只有几十毫秒,下图看到这种情况占多数,600-800毫秒之间的算是浏览器正常的产生调用接口的时间耗时 然后用jmeter跑时都是均值 ...

  8. 结对项目-四则运算"软件"之升级版

    本次作业要求来自:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2213 github地址为:https://github.com/L ...

  9. sqlserver 2017 docker安装(启动代理)

    从 Docker Hub 中拉出 SQL Server 2017 Linux 容器映像. docker pull microsoft/mssql-server-linux:2017-latest 运行 ...

  10. BSOJ 3899 -- 【CQOI2014】 数三角形

    Description 给定一个n*m的网格,请计算三个点都在格点上的三角形共有多少个.下图为4*4的网格上的一个三角形.  注意三角形的三点不能共线. Input 输入一行,包含两个空格分隔的正整数 ...