作为天池上的新手,第一次参加天池阿里云线上的比赛,糖尿病预测, 一般的数据挖掘比赛,流程:数据清洗,特征工程(找特征,特征组合),不断的尝试的不同算法,不断调参,也可以考虑将多个模型进行线性组合 大赛初赛数据共包含两个文件,训练文件d_train.csv和测试文件d_test.csv,每个文件第一行是字段名,之后每一行代表一个个体.文件共包含42个字段,包含数值型.字符型.日期型等众多数据类型,部分字段内容在部分人群中有缺失,其中第一列为个体ID号.训练文件的最后一列为标签列,既需要预测的目标血…
微软发布云端基因服务:推动AI驱动的精准医疗 2018年03月07日 00:00:00 微软研究院AI头条 阅读数:117    版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/Y2c8YpZC15p/article/details/79479171 编者按:儿童癌症是很多研究者十分关注的问题,对相关数据的利用和处理无疑是解决问题的关键. 近日,微软宣布推出Microsoft Genomics服务,该服务通过帮助研究者利用和处理基因数据来取得治疗…
生物医学大数据 精准医疗 研发药物:特异性靶点&过表达靶点 Encode &roadmap找组织特异性的表观遗传学标记.TF.DNA甲基化的动态变化等信息. 生物大数据的标准化与整合----降维分析---聚类和功能分析----多组学----结合临床病理分型----生物信息学可视化分析(描述&预测) Regulation network:Multiple&dynamic&balance 单细胞测序:single-cell RNA-seq 大数据应用:将基础研究与临床医…
困扰年轻人的脱发问题萌生了新兴的产业链.36氪先前曾剖析过近来火热的植发市场,更多人则选择"防范于未然","头皮检测"服务备受关注.此前,人们对"头皮检测"的认识大多仅停留在美容美发店的捆绑式服务,而实际上效果式微. 36氪最近接触到的「先锋汇美」使用AI技术分析医疗数据,提供AI辅助诊疗整体解决方案,为客户提供头发养护方案. 四川先锋汇美生物科技有限公司是中国先锋医药控股有限公司(股票代码:HK01345)的控股子公司.同时,也是四川美容美发行…
昨天去北大生命科学院听了一场魏文胜教授关于基因方面的讲座.会场人不算太多,比起上次听城市规划,场面略显冷清.也能从一个侧面反映,关注基础科学领域的人虽然有,但是不是很多. 开场魏教授用了宣传海报作为导引,癌症可以被攻克吗,HIV有方法抑制吗.目前来说,还是做不到. 从这里他引出了最近三十年关于基因方面的国际层面的研究成果.虽然基因编辑的概念大概已经有三四十年了,但是最近两年有一些突破性的研究成果,还是非常值得欣慰的. 他提到,去年奥巴马提出的精准医疗计划(http://www.biomart.c…
编程界的新宠 Julia 发布 1.0 正式版本,多种优势集于一身2018-08-14 14:14 公司Julia 的累积下载次数超过 200 万,已被应用于自动驾驶汽车.机器人.3D 打印.精准医疗.增强现实.基因组学.能源交易.机器学习.金融风控和太空任务设计等多个领域. 此次 Julia 1.0 版本的发布,更是将商业用户越来越看重的稳定性与原有的快速.高生产力的特性结合起来,足以媲美 Python,R,C++和 Java 等编程语言. 众多来自科技.咨询和金融等行业的公司都有采用 Jul…
http://mp.weixin.qq.com/s?__biz=MzA3MDg0MjgxNQ==&mid=208451006&idx=1&sn=532e41cf020a06737ef7fc7f570d3b7a&scene=0#rd 资金流入流出预测 赛题简介蚂蚁金服拥有上亿会员并且业务场景中每天都涉及大量的资金流入和流出,面对如此庞大的用户群,资金管理压力会非常大.在既保证资金流动性风险最小,又满足日常业务运转的情况下,精准地预测资金的流入流出情况变得尤为重要.此届大赛以&…
NLP大赛冠军总结:300万知乎多标签文本分类任务(附深度学习源码)       七月,酷暑难耐,认识的几位同学参加知乎看山杯,均取得不错的排名.当时天池AI医疗大赛初赛结束,官方正在为复赛进行平台调试,复赛时间一拖再拖.看着几位同学在比赛中排名都还很不错,于是决定抽空试一试.结果一发不可收拾,又找了两个同学一起组队(队伍init)以至于整个暑假都投入到这个比赛之中,并最终以一定的优势夺得第一名. 1. 比赛介绍 这是一个文本多分类的问题:目标是“参赛者根据知乎给出的问题及话题标签的绑定关系的训…
https://www.bilibili.com/read/cv830627     到底什么是人工智能?人工智能能做什么?这是大家最关心的问题,但说到真正能够理解的话,还是只小部分专业人士.这篇文章通过介绍AI应用案例,目标是让更广大的受众能理解这一重要的技术.我们已经处在数字化的世界了,未来的价值创造的方式将会是高效的信息处理.而人工智能将会是促进技术发展的强大动力,推动社会的高速发展,其历史意义不亚于工业革命. 这几年机器学习等算法的发展,解决了工智能应用的关键问题,就是让机器可以获得“知…
摘要: 一家大型基因测序功能公司每日会产生 10TB 到 100TB 的下机数据,大数据生信分析平台需要达到 PB 级别的数据处理能力.这背后是生物科技和计算机科技的双向支撑:测序应用从科研逐步走向临床应用,计算模式从离线向在线演进,交付效率越来越重要. 作者李鹏,原文首发于InfoQ,<容器混合云,Kubernetes 助力基因分析> 引言 James Watson 和 Francis Crick 于 1953 年发现了 DNA 的双螺旋结构,从此揭开了物种进化和遗传的神秘面纱,开启了人类对…