随笔分类 -  机器学习

摘要:数据操作 保存与读取文件 df.to_csv("fasttext_data.csv",sep="\t",header=None,index=None) 忽略行号和列号 pd.read_excel(header=None) 设置第一行不为索引 pd.read_excel(names=[名字列表]) 为 阅读全文
posted @ 2019-10-31 16:27 FromZeroToOne 阅读(120) 评论(0) 推荐(0) 编辑
摘要:1. 所有神经网络处理的的数据都是平均值接近0,标准差接近1的,这样可以保证神经网络尽快的收敛 2. batchNormalization是指从数据中减去平均值,然后再除以标准差的操作,可以像一个层一样添加到激活函数输入前面 阅读全文
posted @ 2019-10-03 14:42 FromZeroToOne 阅读(394) 评论(0) 推荐(0) 编辑
摘要:a.完整特征工程竞赛 b.野博客理论入门理解 c.再回到代码深入理解模型内部 d.再跨理论,查阅经典理论巨作。这时感性理性都有一定高度,会遇到很多很大的理解上的疑惑,这时3大经典可能就可以发挥到最大作用了。 阅读全文
posted @ 2019-10-02 16:10 FromZeroToOne 阅读(299) 评论(0) 推荐(0) 编辑
摘要:"参考博客" "显示中文标签" 阅读全文
posted @ 2019-09-23 17:25 FromZeroToOne 阅读(255) 评论(0) 推荐(0) 编辑
摘要:将txt文件转换成excel文件 统计类别分布 阅读全文
posted @ 2019-09-23 17:16 FromZeroToOne 阅读(162) 评论(0) 推荐(0) 编辑
摘要:model_selection Metrics 阅读全文
posted @ 2019-09-17 21:10 FromZeroToOne 阅读(130) 评论(0) 推荐(0) 编辑
摘要:交叉熵损失函数 Cross Entropy Error Function 1. 二分类表达式 其中: y——表示样本的label,正类为1,负类为0 p——表示样本预测为正的概率 y=1时,对应的p越大则log(p)越小,即损失越小 同理 ,y=0时,p越小,$ log(1 p 阅读全文
posted @ 2019-09-17 11:22 FromZeroToOne 阅读(258) 评论(0) 推荐(0) 编辑
摘要:不理解环境(Model Free RL) Q Learning Sarsa Policy Gradients 理解环境 基于概率 基于价值 阅读全文
posted @ 2019-08-28 19:15 FromZeroToOne 阅读(105) 评论(0) 推荐(0) 编辑
摘要:1.特征工程介绍 这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。 特征工程包含内容: 特征清洗 清洗异常样本(缺失值填充,异常值处理) 采样( 阅读全文
posted @ 2019-08-02 20:31 FromZeroToOne 阅读(197) 评论(0) 推荐(0) 编辑
摘要:现如今,深度学习方法成了解决nlp任务的首选方案,比如textCNN、LSTM、GRU、BiLSTM、Attention、BERT等等。当然,有的nlp任务也可以用机器学习方法去解决,至于哪种任务用哪种方法,需要我们根据实际情况去选择。就目前我接触到的nlp赛题任务有,文本分类、情感分析、关系抽取、 阅读全文
posted @ 2019-08-02 14:41 FromZeroToOne 阅读(752) 评论(1) 推荐(0) 编辑

点击右上角即可分享
微信分享提示
🚀
回顶
收起
  1. 1 404 not found REOL
404 not found - REOL
00:00 / 00:00
An audio error has occurred.