Posted by c cm on January 3, 2014 特征选择(feature selection)或者变量选择(variable selection)是在建模之前的重要一步.数据接口越来越多的今后,数据集的原始变量.衍生变量会越来越多,如何从中选取subset适用到模型之上在实际数据应用中十分重要. 信息值information value用来做特征选择最常用在计算信用评分卡时,是用来表示每一个变量对目标变量来说有多少"信息"的量. 对于一个分类变量性别,其计算过程如下…
Jeremy Howard 在业界可谓大名鼎鼎.他是大数据竞赛平台 Kaggle 的前主席和首席科学家.他本人还是 Kaggle 的冠军选手.他是美国奇点大学(Singularity University)最年轻的教职工.曾于 2014 年,作为全球青年领袖,在达沃斯论坛上发表主题演讲.他在 TED 上的演讲 The wonderful and terrifying implications of computers that can learn 收获高达 200 万的点击.同时,他还创立了 E…