Yahoo浮沉录
Yahoo这一路曾经出过很多好技术
然而,任何人如果只是把 Yahoo 当作一家缺乏聚焦的企业来看也许忽视了公司内部的那些创新—偶尔甚至还有一些很好的产品创意。就拿搜索来说吧,我们说的不是付费搜索,而是指代表实际搜索结果的蓝色链接。Stata 在担任 CTO 之前曾做了很多年的搜索,他说 Google 曾告诉他,Google 对 Yahoo 相对小的团队(且人员大都不需要斯坦福的学位)能够跟住 Google,甚至在某些领域挑战极限是如何的吃惊。
大部分工作都是在他 2004 年到 Yahoo 之前完成的,是收购 Inktomi 的成果,但最令他感到自豪的时刻之一发生在他到 Yahoo 之后:Google 停止显示其索引的 URL 数量的那一刻,因为他宣称 Google 意识到在这方面自己无法拉开 Yahoo。跟微软的交易里面有一件事是大家都没注意到的,即 Yahoo 几乎也跟 Google 也达成了类似的交易,直到政府出面阻止。Stata 认为,要说 Google 交易有可能的话,其唯一的理由是 Yahoo 对搜索的态度是如此的无情。(他还指出,如果你看看现在 Yahoo 的搜索引擎就会发现,它仍然负责页面设计以及在侧栏展示的所有附加信息)
早在 2005 年的时候 Yahoo 就试图要成为社会化搜索的领导者,因此才收购了 Flickr 和 Delicio.us,并发布了像 Yahoo Answers 那样的新服务。该公司甚至还考虑过按照用户的社交网络来进行搜索结果排名,Stata 说,但最终还是无法摆脱内容,因为它从来都未能产生足够庞大的社交图谱来启动这项排名。(尽管要是 Yahoo 360 不是独立于搜索团队而建,并且能利用流行的 Yahoo Messenger 服务的话将会是另一个故事)
“如果没有维基百科的话,我们可能会过得更好,尤其是 Answers,”他补充说。
Yahoo 为用户对首页内容进行个性化的努力相当令人印象深刻—至少从理论上来说如此—哪怕是在他们低估了自己的媒体公司心态的情况下。那时候 Yahoo 已经收集了大量有关用户的数据,以及 Yahoo 上面哪些类型的文章受欢迎的数据。该公司的搜索专家推断 Yahoo 可以通过开发机器学习算法来预测哪些文章会受到哪一类读者的欢迎,然后定向针对这些来对首页内容进行自动定制。
然而,Stata 解释说,该公司最终不得不选定一种办法来让人类编辑及定向算法进行协作,一起来选出 Yahoo 首页的最佳页面,然后将其呈现给合适的读者。有时候,他们会对文章进行简单的 A/B 测试,然后让被测试受众点击的内容分发到更广的范围。
“我们对圣诞节试了 6 种办法,然后想创建内容分类器,但还是失败了,”Stata 说:“……流行的就是流行的(没有类别之分)。”
David Ku 认为内容优化的随意性结果是 Yahoo 在搜索方面的相对失败。内容个性化已经有一些已知的技术,但就像广告一样,这些技术有助于了解谁在特定时间在找什么,或者是带着目的的个性化,如 Facebook 关注于你的朋友那里流行些什么游戏。
“如果是针对我的话,”Ku 说:“那么个性化最好要好点。”
不管怎样,一切以Hadoop为轴心
Yahoo 最成功,也是最出名的的一项技术努力也许要数 Hadoop,正是 Yahoo 帮助培育了这个开源大数据平台并让它在 2011 年时成长为成熟的企业平台。
Yahoo 投入了成百上千万美元(也可能高达数十亿)到 Hadoop 的开发当中,而后者也赢得了从定向内容到搜索的 Yahoo“每个点击背后”的使能者之荣誉,可以说基本上是这样的,至少从这些点击涉及到分析、定向内容或搜索结果这些方面来说是正确的。Yahoo 是在 2006 年引进 Hadoop 的,为的是帮助对页面进行索引,以便能与 Google 在搜索上进行竞争(Hadoop 终于在几年之后为搜索提供支撑),但后来它证明自己在 Panama(Yahoo 为广告商、内容优化、定向广告及许多其他用户提供的分析工具)的后期迭代升级方面也能提供足够的支持。
Hadoop 刺激了 Yahoo 基础设施的若干变化,引导打造富含数据和设计的在线体验的新方式,Ku 说。在整个公司范围内,有一个提供内容与分析数据之间的连续循环,从而能为用户、广告商及 Yahoo 带来更好的结果。
尽管如此,这并不保证得到广泛采用,因为 Yahoo 的部门之间往往是独立运作的,对于相同的技术会有不同的想法,Stata 说。实际上,他承认,搜索团队对此跟其他任何人一样难逃其咎—在集中精力与 Google 作战时搜索团队采取了一种“地堡心态”。Hadoop 是第一个出自搜索并流向各个方向且被认为有用的东西。
“它的确从技术上帮助将公司凝聚到了一起,”Stata 说。
Usama Fayyad 是在 Hadoop 尚未完全在 Yahoo 内部起势的 2008 年离职的。他承认从某些方面来说 Hadoop 是个救世主,完全适合于某些工作,但他也指出 Hadoop“肩负的担子过重”。“Hadoop 几乎就像是一种宗教信仰,”他说。
在他离开之前,Yahoo 在关系数据库、NoSQL 数据库,甚至一种名为 Everest 的列式数据库(为与定向广告相关的大数据查询而设计)上投入重金。Yahoo 决定把很多的负载全压到 Hadoop 身上,这部分是由于对该技术着迷,部分是因为要通力协作专注于更少的事情上,而他则把 Yahoo 的这种做法视为是用推土机去推一颗石子。
的确,Bassel Ojjeh 的新公司 nPario 就因为聚焦 Hadoop 的决定而受益,此举也让达到产品质量的时间比预期更长了一点。 nPario 利用了 Everest 技术作为其分析引擎的一部分(现在是在 Hadoop 上面跑 Everest),有一段时间把 Yahoo 当作自己的一个客户。
当你讨论的是这样一个大规模的系统时,Fayyad 解释说,它最终会变成一个与技术问题程度相当的业务问题:“维护(Hadoop 集群)的成本跟计算创造出来的价值相比是否值得?”对于 Yahoo 和许多其他公司遵循相同路径的特定负载来说,答案很有可能是否定的。
他暗示 Yahoo 因为 Hadoop 而失去了几位最好的数据科学家,这些人看到在其他地方针对更为合适的技术进行特定计算的机会。(也就是说,Yahoo 的投入可能为他人利用 Hadoop 技术做了嫁妆)
最后,想让用户浏览仍需要一个理由
无论是致力于 Hadoop 也好,投入重金到 Panama 上也罢,或者是 Yahoo 那些数不清的收购(包括新任 CEO Marissa Mayer 做出的那些),在公司不能早点认识到自己的处境并致力于门户以外的任何一件事情的情况下,讨论这些决定是否明智基本上是没有意义的。不管是做搜索的 Google,还是后面做社交的 Facebook 等,其他公司对于消费者会如何使用自己来访问 web 都有着一个更加清楚的愿景,然后成为了大家优先选择的接入点。
你需要“某个理由说明为什么你要让那个服务成为你生活的一部分,” David Ku 说。缺乏聚焦的 Yahoo 没有用信息或朋友来勾住你,而是提供(平庸的)服务及内容的融合,最终没法为吸引用户使用提供充分的理由。
“Yahoo 没有把下一代用户作为自己的定位,” Ojjeh 说:“真的,Yahoo 是给我这种年纪的人用的。”
Ku 认为新任的 CEO Mayer 迄今为止对于 Yahoo 是有好处的,至少她为一家一度停滞的公司注入了活力和动力,并且真心想要改善用户体验。然而,她仍需要为公司寻找核心业务(嘿,也许就是媒体也说不定呢!),并找到把它集成进用户生活中的方法。他指出,微软和 Google 早已根植到设备的世界里并利用这些设备作为消费者接入点了。
不过,即便这些年 Yahoo 误入歧途且排名已经大幅下挫,但 Mayer 并非无米下锅。该公司仍然有一些非常棒的技术、技术人员以及对数据的学院知识。还有着亿万用户和通过它的各种服务而来的访客。
“我仍在创业……一切都是白手起家,” Fayyad 说:“想象一下,要是你给我一个客户群然后说,‘OK,Usama,你可以拿这 700 万用户起步。你打算怎么做?’我会怎么做?我会告诉你,绝对会让你大吃一惊。”
[本文编译自:gigaom.com]
Yahoo浮沉录的更多相关文章
- webex录屏
你在寻找好用的录屏软件吗?商用级品质的 WebEx Recorder 就是一款优秀的录屏软件.WebEx Recorder可以录制全屏或指定窗口,可以设定是否包含声音,生成的文件体积极小且极清晰,录制 ...
- ASP.NET_各个币种之间的汇率转换(实时)使用Yahoo汇率。
近期开发支付平台的时候有运用到各国的实时汇率之间的转换问题,于是在往上找了很多相关资料,以下就是一些参考网址: 1.提供API接口的网站:https://www.showapi.com:这个网站有提供 ...
- Android中手机录屏并转换GIF的两种方式
之前在博文中为了更好的给大家演示APP的实现效果,本人了解学习了几种给手机录屏的方法,今天就给大家介绍两种我个人用的比较舒服的两种方法: (1)配置adb环境后,使用cmd命令将手机界面操作演示存为视 ...
- 手游录屏直播技术详解 | 直播 SDK 性能优化实践
在上期<直播推流端弱网优化策略 >中,我们介绍了直播推流端是如何优化的.本期,将介绍手游直播中录屏的实现方式. 直播经过一年左右的快速发展,衍生出越来越丰富的业务形式,也覆盖越来越广的应用 ...
- Camtasia 录屏说明
准备好要录制的屏幕或网页,在即将播放的位置暂停住. 从开始菜单位置“TechSmith”启动Camtasia Recorder 8,其界面如下所示: 注意,要录制系统声音,须在Recorded inp ...
- iOS--通讯录、蓝牙、内购、GameCenter、iCloud、Passbook等系统服务开发汇总
iOS开发过程中有时候难免会使用iOS内置的一些应用软件和服务,例如QQ通讯录.微信电话本会使用iOS的通讯录,一些第三方软件会在应用内发送短信等.今天将和大家一起学习如何使用系统应用.使用系统服务: ...
- 在Mac电脑上为iPhone或iPad录屏的方法
在以前的Mac和iOS版本下,录制iPhone或者iPad屏幕操作是一件稍微复杂的事情.但是随着Yosemite的出现,在Mac电脑上为iPhone或iPad录屏的方法就变得简单了.下面就介绍一下具体 ...
- Android 手机怎么录屏制成gif图片
参考:http://www.cnblogs.com/dasusu/p/4903511.html 上面的博主说的很详细了,但作为学习记录我就重新写一遍帮助自己加深记忆 一.准备条件 1.你搭建了Andr ...
- 光盘刻录 CD刻录软件 Ashampoo Burning Studio特别版 刻录CD就这么简单
著名的刻录软件Nero,其近上百M体积实在太大,而且安装之后的文件体积也有上G多.这么大的体积安装使用都不方便,好在现在很多都做得很不错,比如阿香婆的光盘刻录软件Ashampoo® Burning S ...
随机推荐
- Spark- 共享变量
Shared Variables Normally, when a function passed to a Spark operation (such as map or reduce) is ex ...
- Angular表单的本地校验和远程校验
AngularJS Form 进阶:远程校验和自定义输入项 表单远程校验 HTML代码: <!doctype html> <html ng-app="form-exampl ...
- Explain分析查询语句
表的读取顺序 读取操作的类型 可用索引,实际使用的索引 表之间的引用 每张表多少行被优化器查询 索引的长度 EXPLAIN字段解释: ØTable:显示这一行的数据是关于哪张表的 Øpossible ...
- CSS基础(滑动门,雪碧图,网页布局)
3.11.2017 这一篇主要是关于滑动门技术的学习,还有雪碧图(sprite),也就是精灵图,还有一点昨天的css可见性的回顾,下面先来回顾下吧 CSS可见性(元素可见性) overflow: hi ...
- python中的list和array的不同之处 2
版权声明:本文为博主非原创文章,未经博主允许可以转载. Python中的list和array的不同之处 python中的list是python的内置数据类型,list中的数据类不必相同的,而a ...
- 维度属性的KeyColumns,NameColumn和ValueColumn
维度的每一个属性都有KeyColumns,NameColumn和ValueColumn 1,如何理解KeyColumns,NameColumn和ValueColumn?对一行记录有不同的标识列,但 ...
- vue项目打包注意的地方
打包有两种方式: 第一种方式:1.更改config文件夹下prod.env.js下的地址: 2.将config文件夹下index.js中build下改为 assetsPublicPath: '', 第 ...
- 配合Jenkins自动化构建,bat脚本(一)
C:\Windows\System32\inetsrv\appcmd.exe stop site ServiceIIS C:\Windows\System32\inetsrv\appcmd.exe s ...
- Git学习--创建版本库
什么是版本库呢?版本库又名仓库,英文名repository,你可以简单理解成一个目录,这个目录里面的所有文件都可以被Git管理起来,每个文件的修改.删除,Git都能跟踪,以便任何时刻都可以追踪历史,或 ...
- Java使用指南(1)—— Java下载和安装
Java下载 1.在Oracle的官网中找到相应的