A公司 推荐算法大赛 总结】的更多相关文章

一.介绍 ♦通过用户前四个月(04.15~08.15)的用户行为预测用户第五个月(08.15~09.15)将会购买的品牌.用户共有四种行为(type)分别是:点击(0).购买(1).购物车(2).收藏(3).数据原始内容如下: 比赛评价方式按照F1排名,F1=2×P×R/(P+R)其中,P是准确率为命中的数量除以用户的预测数,R是召回率为命中的数量除以真实的购买数.采用F1评分,在正负样本数不平衡的系统中代替正确率作为系统的评价指标. 二.方法介绍与特征选择 ♦逻辑回归与随机森林.首先,在使用逻…
上周是淘宝穿衣搭配算法大赛开始评测后的第一周,周冠军是来自浙江大学的"FUC AUTH"队.他们在夺得本周冠军之后,还将自己的获胜经验分享给了大家,究竟有什么秘诀呢? 阿里巴巴天池大数据竞赛在浙大师兄们的口碑中一直很不错,它真正意义上地为我们提供了海量数据源和大数据处理平台,尤其是大数据处理平台是在高校实验室中很难提供.对于以后走向大数据方向的研究人员而言也很具备科研价值,大数据比赛确实也锻炼大数据挖掘算法和程序优化,让我们受益匪浅. 由于我们团队也差不多都是新手,能取得这样的成绩,确…
首届全球RTB(实时竞价)广告DSP算法大赛 竞赛指南     RTB (Real Time Bidding, 实时竞价) 是近年来计算广告领域最激动人心的进展之一. 它增加了展示广告的透明度与效率,有利于展示广告生态系统的健康发展. RTB模式使 得广告主能在合适的时间将合适的广告信息传递给合适的人,媒体能更好地利用其网站受 众获得更多盈收,而又使得用户能够通过个性化广告技术看到相关的信息.     在基于RTB的展示广告生态系统中,有两个重要的成员:Ad Exchange(广告交易平 台)与…
[以前的文章]最后一公里极速配送 - 阿里云算法大赛总结 总结一下新的教训 1.由于都是NP难题,获得最优解用常规的方法非常困难,对于不是算法科班出身的人来说,首先应该到网络上寻找一下论文,是否有一些好的经验. 2.保持平常心,这种比赛获奖很困难,生活还是要和往常一样,只是将空余的时间给做比赛 3.每一个小功能,小函数,尽可能做一些简单的单元测试,这种题目往往代码最后非常复杂,难以调试,不做单元测试,可能以后调试都很困难 4.熟悉使用语言的多线程工作方式,例如C#的多线程特点 5.寻找好的计算资…
1.闵可夫斯基距离 闵可夫斯基距离可以概括曼哈顿距离与欧几里得距离.  其中r越大,单个维度差值大小会对整体产生更大的影响.这个很好理解,假设当r=2时一个正方形对角线长度,永远是r=3时正方体对角线的投影,因此r越大,单个维度差异会有更大影响.(所以这也可能是很多公司的推荐算法并不准确的原因之一)   我们在对一个新用户进行推荐时,可以计算在同等维度下其他用户的闵可夫斯基距离.这种海量数据的表格,用pandas处理十分方便   下面有一个闵可夫距离计算的实例 from math import…
转自:http://zengzhaozheng.blog.51cto.com/8219051/1557054 一.概述 这2个月为公司数据挖掘系统做一些根据用户标签情况对用户的相似度进行评估,其中涉及一些推荐算法知识,在这段时间研究了一遍<推荐算法实践>和<Mahout in action>,在这里主要是根据这两本书的一些思想和自己的一些理解对分布式基于ItemBase的推荐算法进行实现.其中分两部分,第一部分是根据共现矩阵的方式来简单的推算出用户的推荐项,第二部分则是通过传统的相…
一.潜在因子(Latent Factor)推荐算法 本算法整理自知乎上的回答@nick lee.应用领域:"网易云音乐歌单个性化推荐"."豆瓣电台音乐推荐"等.        这种算法是在NetFlix(没错,就是用大数据捧火<纸牌屋>的那家公司)的推荐算法竞赛中获奖的算法,最早被应用于电影推荐中,在实际应用中比现在排名第一的 @邰原朗所介绍的算法误差(RMSE)会小不少,效率更高.下面仅利用基础的矩阵知识来介绍下这种算法.        该算法的思想是…
AI技术已成为推动营销迭代的重要驱动力.AI营销高速发展的同时,积累了海量的广告数据和用户数据.如何有效应用这些数据,是大数据技术落地营销领域的关键,也是检测智能营销平台竞争力的标准. 讯飞AI营销云一直致力于以AI赋能营销升级.为挖掘AI营销算法领域的顶尖人才,推动数字营销的技术革新,科大讯飞将于9月1日至10月25日举办“2018科大讯飞AI营销算法大赛”.   大赛介绍 “2018科大讯飞AI营销算法大赛”将提供讯飞AI营销云的海量广告投放数据,参赛选手通过人工智能技术构建预测模型预估用户…
由于官方审核代码,代码将在2019年6月28号后开源 写在前面 这次腾讯的第三届广告算法大赛,是我第一次参加,取得了初赛与复赛均为23名的成绩,毕竟我只是初打比赛不久的小白.我想在此分享下我的基本解题思路. 赛题背景: 广告曝光预估如何应用在实际业务中? 腾讯的效果广告主要是展示类广告,其背后的算法引擎本质上是一个推荐框架.当新增一条广告请求时,系统会自动执行召回候选广告和排序筛选两个步骤. 召回的条件是判断广告自身的定向设置.时段设置.素材尺寸是否和当前请求的用户属性.请求时间.广告位规格相匹…
100+天激烈赛程,40+国内顶级技术豪门对决,历经研发内部测试.正式环境测试和易观数据正式环境跑benchmark三大阶段.10月28日,易观OLAP算法大赛优胜名单出炉! 40+技术门派比武 易观OLAP大赛可谓国内算法界“武林大会”,英雄帖一发出就引起互联网各大技术门派积极响应. 吸引来自美团点评.阿里云.小米.链家.搜狗.科大讯飞.联通.原速数据.乐见.AggreData.GBase .Kyligence.PingCAP.LinkDoc.iflytek.hulu.上海睿民.热云数据.润乾…