花名:越祈 部门:算法中心搜索策略组 入职时间:2017/06/01 主要从事蘑菇街推荐算法相关研发工作 蘑菇街是一家社会化导购电商平台,推荐一直是其非常重要的流量入口.在电商平台中,推荐的场景覆盖到用户浏览行为和交易的各个环节,如搜相似.商品详情页.购物车.订单和支付等.传统的itemCF.关联规则.simirank.swing等推荐相似召回技术也广泛应用于推荐各个场景中.在电商场景,计算商品和商品.用户和商品之间的相似性是一个非常重要的课题,但是受限大部分数据是稀疏,传统的关联规则,simi…
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是机器学习专题的第29篇文章,我们来聊聊SVD在上古时期的推荐场景当中的应用. 推荐的背后逻辑 有没有思考过一个问题,当我们在淘宝或者是某东这类电商网站购物的时候.我们一进首页,就会看到首页展出了很多商品.这些商品往往质量很高,很吸引人,一旦逛起来可能就没个结束.那么问题来了,电商平台拥有那么多商品,它是怎么知道我们可能会喜欢什么样的商品的呢?这背后的逻辑是什么? 简单来说在这背后,平台端的算法做了两件事情,第一件事情是召回,第二件…
git: https://github.com/linyi0604/MachineLearning 词向量技术 Word2Vec 每个连续词汇片段都会对后面有一定制约 称为上下文context 找到句子之间语义层面的联系 from sklearn.datasets import fetch_20newsgroups from bs4 import BeautifulSoup import nltk, re from gensim.models import word2vec # nltk.dow…
本文转载自: http://blogs.360.cn/360mobile/2016/10/24/android_escape/ 摘    要 传统逃逸技术涉及网络攻防和病毒分析两大领域,网络攻防领域涉及的逃逸技术主要为网络入侵逃逸技术,病毒分析领域涉及到的逃逸技术主要包括针对静态分析.动态分析的木马逃逸技术. 本文介绍的Android木马逃逸技术研究了针对用户感知.杀软查杀.沙箱动态养殖和人工分析的各种逃逸技术. 大多数Android木马的作恶途径是长期留存用户终端,通过持续性作恶获取收益. 为…
这一篇文章,是总结一下WCF技术,以及基于这个技术发展出来的几个典型应用场景,并且我将尝试对这些不同的WCF实现的原理进行一些比较分析. 关于WCF这个技术的基本概念,如果你不是很清楚,可以参考一下有关的文档 微软开发者中心 http://msdn.microsoft.com/en-us/netframework/aa663324 我的博客中先前也有很多这方面的介绍 http://zzk.cnblogs.com/s?w=blog%3achenxizhang+wcf&p=1 言归正传,我将先概括一…
https://blog.csdn.net/zxc456733/article/details/78861100 nginx(一) nginx详解 nginx是一个被广泛使用的集群架构组件,我们有必要对它有足够的了解.下面将先认识nginx:包括应用场景.nginx基本架构.功能特性.并发模型以及配置说明,最后我们再总结下,为什么选择nginx的原因. 1.nginx应用 nginx (engine x)是一个可以作为HTTP WEB服务器.反向代理服务器.邮件代理服务器和一个通用的TCP /…
转载allen303allen的空间 在Gnutella网络中存在以下问题: 冗余消息多,对带宽的消耗存在一定的浪费.Gnutella网络协议采用泛洪式(Flooding)消息传播机制,这种消息传播机制产生了呈指数级增长的冗余消息.据统计,P2P软件白天占Internet上运行带宽的40%-70%,晚上有时能达到80%. 搜索效率低,可扩展性差.Gnutella网络的搜索协议将所有资源与节点统一对待,没有考虑节点的性能差异,也没有利用查询成功的历史经验,使得搜索效率低下. KaZaA协议中节点大…
导读 跨镜追踪(Person Re-Identification,简称 ReID)技术是现在计算机视觉研究的热门方向,主要解决跨摄像头跨场景下行人的识别与检索.该技术能够根据行人的穿着.体态.发型等信息认知行人,与人脸识别结合能够适用于更多新的应用场景,将人工智能的认知水平提高到一个新阶段. ReID 是行人智能认知的其中一个研究方向,行人智能认知是人脸识别之后比较重要的一个研究方向,特别是计算机视觉行业里面,首先简单介绍 ReID 里比较热门的几项内容: 行人检测.任务是在给定图片中检测出行人…
Autodesk面试技术题解答 By SmartPtr(http://www.cppblog.com/SmartPtr/)          近一年以来,AUTODESK的面试题在网上是闹的沸沸扬扬,作为一个名企,这是可以理解的,况且其面试题质量也是不错的.抽一些闲暇时间,把网上传的比较多的70道题简单的解答了一遍,不为别的,只为再熟悉一下在大学学过的一些基础知识.希望对大家有用.当然,这只是我的个人解答,有什么不对的或者需要补充的,大家尽管提上来,好的话我加上去的... 1. 在类的普通成员函…
您查询的关键词是:清理dism知乎 以下是该网页在北京时间 2019年03月17日 21:56:16 的快照: 如果打开速度慢,可以尝试快速版:如果想更新或删除快照,可以投诉快照. 百度和网页 https://blog.csdn.net/qq_37610423/article/details/72729873 的作者无关,不对其内容负责.百度快照谨为网络故障时之索引,不代表被搜索网站的即时页面.     转 Windows上那些值得推荐的良心软件-整理 2017年05月25日 15:23:49 …
获取二维码方法:http://open.weixin.qq.com/qr/code/?username=公众账号,例如:cjscwe_2015   目录 全栈 编程语言 前端开发 移动开发 数据库 操作系统 技术团队 官方网站 设计   全栈 程序员的那些事 微信号: iProgrammer,「程序员的那些事」是最受欢迎的程序员.IT 技术和 IT 行业相关的微信公众号之一,分享 IT 技术资讯.经典文章和书籍.热门课程.高薪职位.职场和趣文,传播极客精神,更有难得一见的 IT 相亲活动. 全栈…
原文地址: https://www.cnblogs.com/marsggbo/p/9309520.html ---------------------------------------------------------------------------------------------- 以下内容是对AutoML技术现状与未来展望讲座的总结. 1.机器学习定义 <西瓜书>中的直观定义是:利用经验来改善系统的性能.(这里的经验一般是指数据) Mitchell在<Machine Le…
1. 拥有5.5亿的活跃用户 2. 过万台的设备 3. 数千万级别的同时在线 4. 数十亿级别的全站PV 5. P级的UGC存储量 6. 每天千亿级别的服务请求 图1--QQ空间海量服务数据规模 接下来,徐晓把QQ空间成长和发展的历程分成三个阶段:石器时代.冷兵器时代和现代战争时代,分享了QQ空间从开始甚至难以生存,到逐步发展成国内最大的SNS社区产品背后的酸甜苦辣. 石器时代–从十万在线到百万在线 石器时代是QQ空间1.0到3.0稳健上线的过程. 徐晓说:"QQ空间在石器时代遇到的最大难题就是…
[原文地址]http://www.hbjjrb.com/Jishu/ASP/201110/319372.html 引言 WWW是互联网上最受欢迎的应用之一,其快速增长造成网络拥塞和服务器超载,导致客户访问延迟增大,WWW服务质量问题日益显现出来.缓存技术 被认为是减轻服务器负载.降低网络拥塞.增强WWW可扩展性的有效途径之一,其基本思想是利用客户访问的时间局部性(Temporal Locality)原理,将客户访问过的内容在Cache中存放一个副本,当该内容下次被访问时,不必连接到驻留网站,而是…
原文地址:http://blog.sina.com.cn/s/blog_6024cfa90101cb0h.html 技术总监(Chief Technical Officer)与CTO(Chief Technology Officer,首席技术官)的区别是,技术总监主要思考技术,而CTO主要思考的是公司技术战略.国内很多软件公司只有技术总监,而没有CTO.虽然总监技术能力不错,但与公司的发展不沾边,光有技术是发挥不了核心作用的,没有技术前瞻性的视野,公司的业务发展也沾不上他技术的光. “原因就是技…
一.用赋值的方法可以扩展一个已知的数组: arr= 1:1:4; arr(8)=6; 此时,arr = 1 2 3 4 0 0 0 6 arrNew=arr; 此时arrNew = 1 2 3 4 0 0 0 6. 由上面可以看出,每一次扩展数组,都要经过以下步骤:第一步,创建一个新数组.第二步,把旧数组的元素复制到新数组当中.第三步,把扩展的元素写入新数组.第四步,删除旧数组.对于大数组来说这些步骤是相当耗时的. 二.用向量法 好的编程习惯在循环执行开始之前 ,总是要预先分配一个数组,这样能大…
原文链接:http://www.wushiqin.com/?post=68 一.什么是网卡绑定及简单原理 网卡绑定也称作"网卡捆绑",就是使用多块物理网卡虚拟成为一块网卡,以提供负载均衡或者冗余,增加带宽的作用.当一个网卡坏掉时,不会影响业务.这个聚合起来的设备看起来是一个单独的以太网接口设备,也就是这几块网卡具有相同的IP地址而并行链接聚合成一个逻辑链路工作.这种技术在Cisco等网络公司中,被称为Trunking和Etherchannel 技术,在Linux的2.4.x的内核中把这…
摘自: http://www.royaloo.com/articles/articles_2003/PolymorphismInCpp.htm http://blog.sciencenet.cn/blog-58025-691458.html 摘要 本文介绍了C++中的各种多态性,重点阐述了面向对象的动态多态和基于模板的静态多态,并初探两种技术的结合使用. 关键词 函数多态宏多态动态多态静态多态 导言 多态(polymorphism)一词最初来源于希腊语polumorphos,含义是具有多种形式或…
转帖allen303allen的空间 作 者:金海 廖小飞 摘要:对等网络(P2P)有3种主要的组织结构:分布式哈希表(DHT)结构.树形结构.网状结构.P2P技术已 经延伸到几乎所有的网络应用领域,如分布式科学计算.文件共享.流媒体直播与点播.语音通信及在线游戏支撑平台等方面.现在人们已经开始将重心转入到覆盖 层网络的节点延时聚集研究.覆盖网之间(Inter-Overlay)优化研究.P2P支撑平台研究以及P2P安全研究等方面. 关键词:对等网络:分布式哈希表:覆盖层网络 Abstract:T…
看到10月份天天写博客,只有一天没写,非常棒! 11月份也基本每天都写,现在看到有三天没加新博客,应该是之前挖的坑太多了,需要填坑,呵呵. 那这篇文章是不是为了占坑呢?哈哈.我不说话. 容器技术,这篇文章讲的比较好: http://server.zol.com.cn/535/5355822_all.html <开发漫谈:千万别说你不了解Docker!> 再补充看下面几篇: http://blog.csdn.net/colorant/article/details/20608157/ http:…
原文链接(向作者致敬):http://www.txrjy.com/thread-667901-1-1.html   无线通信世界在过去的几十年中的发展简直是爆发式的,MIMO(多发多收)技术的出现更是将通信理论推向了另一个高峰.它已经成为当今乃至今后很多年内的主流物理层技术.所以,理解一些MIMO技术的思想,对于理解通信收发原理,乃至通信系统设计,都是很有帮助的.笔者不才,通信小兵一名,冒昧在此布下一贴,愿与大家一同探讨MIMO技术心得.希望我们能够通过彼此的交流学习,共同体验到无线通信之美.然…
LPWAN,Low Power Wide Area Network,低功耗广域网.名字里就有它的两个最重要的特点:低功耗.广覆盖.目前比较主流的有:NB-IoT.LoRa.Sigfox.eMTC.NB-IoT全名是Narrow Band IoT,也就是窄带物联网(带宽窄,速度慢). NB-IoT除了速率之外,其它方面都表现优异. 功耗方面,NB-IoT牺牲了速率,却换回了更低的功耗.采用简化的协议,更适合的设计,大幅提升了终端的待机时间,部分NB终端,待机时间号称可以达到10年! 信号覆盖方面,…
您是新用户的 Visual Studio 应用程序生命周期管理 (ALM) 和 Team Foundation Server (TFS) 吗? 您想知道如何您和您的团队可以获得最大受益的这些工具来生成您的应用程序的最新版本? 然后花几分钟就可以走逐步完成该两个章节教程,并按照 Peter 和朱丽亚在 Fabrikam 纤程的两个开发人员的生活的一天 — — 虚构的公司,提供有线电视和相关的服务. 您将看到如何使用 Visual Studio 和 TFS 签出并更新代码. 暂停工作时被打断. 请求…
找到了这个系列的原始作者: http://www.cnblogs.com/rush/archive/2012/02/05/2339037.html 最近网络安全成了一个焦点,除了国内明文密码的安全事件,还有一件事是影响比较大的——Hash Collision DoS(通过Hash碰撞进行的拒绝式服务攻击),有恶意的人会通过这个安全漏洞让你的服务器运行巨慢无比,那他们是通过什么手段让服务器巨慢无比呢?我们如何防范DoS攻击呢?本文将给出详细的介绍. 这一篇跟Hash关系比较密切. 首先,发生哈希冲…
写在前面 之前公司不忙的时候,用闲暇功夫想学习React-Native 苦于找不到一款好的代码编辑器,在广泛搜索以后,发现最适合的就是网页代码编辑器WebStrom,所以就尝试安装和破解,下面我将自己的经验分享出来,为以后也需要用mac做前端和开发React-Native的朋友们莫福利! 1.下载软件最好的地址就是官网了,不会有毒而且还纯净下载地址 选择好系统版本以后点击DOWNLOAD   下载Webstorm 2.安装双击下载好的安装包.将WebStromt拖入application文件夹,…
https://blog.51cto.com/sf1314/2073519 服务器eth0与eth1作bonding,捆绑成bond0接口,服务器对端交换机端口,同属于100.101号vlan接口 vlan 100: 10.104.100.253/24                     vlan 101: 10.104.101.253/24 1.交换机端没有打VLAN,则需要在服务器端网卡打tag Center OS 7.2 网卡配置VLAN TAG 2.确认内核是否已经载入802.1q模…
2017年AI技术前沿进展与趋势 人工智能最近三年发展得如火如荼,学术界.工业界.投资界各方一起发力,硬件.算法与数据共同发展,不仅仅是大型互联网公司,包括大量创业公司以及传统行业的公司都开始涉足人工智能行业.2017年人工智能行业延续了2016年蓬勃发展的势头,那么在过去的一年里AI行业从技术发展角度有哪些重要进展?未来又有哪些发展趋势?本文从大家比较关注的若干领域作为AI行业代表,来归纳下AI领域一些方向的重要技术进展. 从AlphaGo Zero到Alpha Zero DeepMind携深…
作者:韩信子@ShowMeAI,Joan@腾讯 地址:http://www.showmeai.tech/article-detail/tencent-ctr 声明:版权所有,转载请联系平台与作者并注明出处 双塔模型是推荐.搜索.广告等多个领域的算法实现中最常用和经典的结构,实际各公司应用时,双塔结构中的每个塔会做结构升级,用CTR预估中的新网络结构替代全连接DNN,本期看到的是腾讯浏览器团队的推荐场景下,巧妙并联CTR模型应用于双塔的方案. 一图读懂全文 实现代码 文中涉及到的DCN / FM…
1. 技术背景 FaceBook页面加载技术 试想这样一个场景,一个经常访问的网站,每次打开它的页面都要要花费6 秒:同时另外一个网站提供了相似的服务,但响应时间只需3 秒,那么你会如何选择呢?数据表明,如果用户打开一个网站,等待3~4 秒还没有任何反应,他们会变得急躁,焦虑,抱怨,甚至关闭网页并且不再访问,这是非常糟糕的情况.所以,网页加载的速度十分重要,尤其对于拥有遍布全球的5亿用户的Facebook(全球最大的社交服务网站)这样的大型网站,有着大量并发请求.海量数据等客观情况,速度就成了必…
本文引自http://i.cnblogs.com/EditPosts.aspx?opt=1 如果说过去的十年是搜索技术大行其道的十年,那么个性化推荐技术将成为未来十年中最重要的革新之一.目前几乎所有大型的电子商务系统,如Amazon.CDNOW.Netflix等,都不同程度地使用了各种形式的推荐系统.而近来以“发现”为核心的网站正开始在互联网上崭露头角,比如侧重于音乐推荐的八宝盒,侧重于图书推荐的豆瓣等等.   那么,一个好的推荐系统需要满足什么目标呢?个性化推荐系统必须能够基于用户之前的口味和…