第一次参加数据预测竞赛,发现还是挺有意思的.本文中的部分内容参考第一名“诗人都藏在水底”的解决方案. 从数据划分.特征提取.模型设计.模型融合/优化,整个业务流程得到了训练.作为新手在数据划分和模型训练以及模型融合上做的不够好(都是套路). 首先,数据划分方式最自然的按照月份->后面的月份这种自然顺序(滑窗)即可,在整个数据集上做特征提取实在是不能发挥出 特征的优势,因为数据量本身挺大,太多的脏数据,会导致训练出的模型不准确. 看来这个竞赛并没有涉及到太多的数据清洗处理等工作. 用户特征.商户特…
数据挖掘实战 - o2o优惠券使用预测 一.前言 大家好,家人们.今天是2021/12/14号.上次更新是2021/08/29.上篇文章中说到要开两个专题,果不其然我鸽了,这一鸽就是三个多月.今天,我不鸽(还要鸽).那两个专题关于ResNet和GoogLeNet的文章还等缓缓一缓(一月份一定发),今天这篇文章是关于数据挖掘实战入门的例子,题目及数据集来源于 天池新人实战赛o2o优惠券使用预测,题目地址:https://tianchi.aliyun.com/competition/entrance…
第一次参加天池新人赛,主要目的还是想考察下自己对机器学习上的成果,以及系统化的实现一下所学的东西.看看自己的掌握度如何,能否顺利的完成一个分析工作.为之后的学习奠定基础. 这次成绩并不好,只是把整个机器学习的流程熟悉了下.我本人总结如下: 步骤一:读懂题目含义,分析赛题的数据 步骤二:特征工程的设计,这部分非常重要,好的特征工程能大大提高模型的准确率 步骤三:训练算法.区分训练集.测试集等. 步骤四:测试模型,看效果如何. 赛题可以去天池的官网查看,里面有赛题说明,赛题数据等等 https://…
前沿: 这是天池的一个新人实战塞题目,原址 https://tianchi.aliyun.com/getStart/information.htm?spm=5176.100067.5678.2.e1321db7ydQmSB&raceId=231593 ,下文会分析以下几个过程. 1.数据预处理 2.特征的选取 3.算法的说明 4.结果分析 5.其他 第一部分:数据预处理 原始数据可以从上边链接中下载,拿到.csv文件,可以使用pandas处理. 比如: dfoff = pd.read_csv('…
赛事链接:https://tianchi.aliyun.com/competition/entrance/231593/introduction?spm=5176.12281925.0.0.7e157137DpLQO6 代码下载:https://github.com/luxuantao/alibaba_tianchi_book 请自己阅读赛题描述和下载代码 1.数据探索 1.1数据说明 本赛题提供用户在2016年1月1日至2016年6月30日之间真实线上线下消费行为,预测用户在2016年7月领取…
题目链接  2016 CCPC东北地区大学生程序设计竞赛 B题 题意  给定一个无向图和一棵树,树上的每个结点对应无向图中的一条边,现在给出$q$个询问, 每次选定树中的一个点集,然后真正被选上的是这些点以及这些点的所有祖先. 只有标号在树中真正被选上的点代表的这些原图中的边是存在的,这样就构成了一个新的图.求这个图的连通块个数. dfs整棵树,记$f[x]$为若$x$以及$x$的所有祖先被选上,那么构成的新的图的并查集) 这个实现比较简单,搜索的时候打上标记,回来的时候撤销即可. 这样预处理的…
背景 CVPR 2019 是机器视觉方向最重要的学术会议,本届大会共吸引了来自全世界各地共计 5160 篇论文,共接收 1294 篇论文,投稿数量和接受数量都创下了历史新高,其中与自动驾驶相关的论文.项目和展商也是扎堆亮相,成为本次会议的“新宠”. 障碍物轨迹预测挑战赛(Trajectory Prediction Challenge)隶属于CVPR 2019 Workshop on Autonomous Driving — Beyond Single Frame Perception(自动驾驶研…
纵观我国的O2O行业发展历程,去年上半年还处于资本的投资热潮,下半年就遭遇到了寒冬的突袭,使得很多才刚刚发芽的O2O企业直接被一阵寒风给吹倒.但同样的,一阵风浪过后才知道在O2O这片战场上谁才是有实力的猛将,一方面,被风浪卷走的小兵小将们没有机会再次重来:另一方面,O2O战场上还会迎来一场又一场实力大将间的争夺战. 2016年上半年的O2O战场上依旧硝烟弥漫,留在O2O战场上的企业依旧继续展开强烈的市场争夺战,那么,就让我们来看看O2O企业在这半年的时间里是否摆脱了“烧钱”模式,又在O2O战场上…
新年伊始,有不少人在总结过去,也有一些人在展望未来.下面让我们跟随 OpsClarity 的 Dhruv Jain,看看他对 2016 IT 趋势有什么大胆的预测. 又到了众人纷纷对下一年进行预测的时候了.虽然这些预测看起来多为老生常谈,但鉴于我所在的公司 OpsClarity 在 2015 年 12 月刚刚崭露头角,我决定做出一个预测.我们 OpsClarity 公司的人对于应用和基础设施监控的未来有一个独到的看法: 1. Web scale 应用(WSA)将会被主流企业采用. WSA 通过实…
1.阿里移动推荐算法: 答辩视频:https://space.dingtalk.com/c/gQHOEnXdXw 2.资金流入流出预测: 答辩视频:https://space.dingtalk.com/c/gQHOEnXi6w 3.阿里移动推荐&资金流入流出预测答辩PPT下载: https://tianchi.shuju.aliyun.com/mini/reply.htm?spm=5176.100259.100259.15.QVIzfX#nav1 4.新浪微博互动预测大赛&公交线路客流预测…