随笔 - 383
文章 - 0
评论 - 0
阅读 -
35125
04 2018 档案
实战天池精准医疗大赛——观看答辩总结
摘要:1. 说明 今天是天池精准医疗大赛(糖尿病预测)的最终答辩,学习了一下前六名的经验分享.把自己没想到的列出来,如下. 2. 特征 (1) 多特征组合:一般是现有特征加减乘除的组合,在特征多的情况下,先取强特征相互组合.(2) 数据分析:常用分...
阅读全文
实战美年健康AI大赛之一_自然语言处理
摘要:1. 说明 一直想找个自然语言处理(NLP)相关的比赛.起始看到"美年健康AI大赛"的时候,觉得和之前糖尿病比赛很相似,还是GBDT调参大赛.解包一看几百兆数据,觉得自己机器可能跑不动(后来确实加了一条内存),都没打开看数据就放弃了. 后来两个朋...
阅读全文
实战药物分子筛选之一_初探
摘要:1. 说明 基于人工智能的药物分子筛选,是最近在DC大数据平台上看到的一个新比赛.这个题目对于我这种半科盲来说好难.花了一些时间才弄明白它是干嘛的.这是一家药品公词举办的比赛.我理解题目是这样的:给出三种数据:致病蛋白信息(病),小分子信息(药)...
阅读全文
实战量化投资大赛之二_GBDT模型
摘要:1. 说明 对股票预测这种典型的时序问题,使用梯度下降决策树,确实是有点生搬硬套.主要思路是想使用提供的特征值f1-f87,看看哪些特征更加重要. 具体方法是把历史数据用计算趋势和移动平均线的方式添加到特征之中,此时记录的前后顺序就不再重要,用1...
阅读全文