机器学习 - 随笔分类 - FromZeroToOne

pandas 笔记

摘要：数据操作保存与读取文件 df.to_csv("fasttext_data.csv",sep="\t",header=None,index=None) 忽略行号和列号 pd.read_excel(header=None) 设置第一行不为索引 pd.read_excel(names=[名字列表]) 为阅读全文

posted @ 2019-10-31 16:27 FromZeroToOne 阅读(120) 评论(0) 推荐(0) 编辑

为什么要进行batchNormalization？

摘要：1. 所有神经网络处理的的数据都是平均值接近0，标准差接近1的，这样可以保证神经网络尽快的收敛 2. batchNormalization是指从数据中减去平均值，然后再除以标准差的操作，可以像一个层一样添加到激活函数输入前面阅读全文

posted @ 2019-10-03 14:42 FromZeroToOne 阅读(394) 评论(0) 推荐(0) 编辑

算法学习步骤

摘要：a.完整特征工程竞赛 b.野博客理论入门理解 c.再回到代码深入理解模型内部 d.再跨理论，查阅经典理论巨作。这时感性理性都有一定高度，会遇到很多很大的理解上的疑惑，这时3大经典可能就可以发挥到最大作用了。阅读全文

posted @ 2019-10-02 16:10 FromZeroToOne 阅读(299) 评论(0) 推荐(0) 编辑

matplotlib Demo

摘要："参考博客" "显示中文标签" 阅读全文

posted @ 2019-09-23 17:25 FromZeroToOne 阅读(255) 评论(0) 推荐(0) 编辑

pandas小demo

摘要：将txt文件转换成excel文件统计类别分布阅读全文

posted @ 2019-09-23 17:16 FromZeroToOne 阅读(162) 评论(0) 推荐(0) 编辑

sklearn

摘要：model_selection Metrics 阅读全文

posted @ 2019-09-17 21:10 FromZeroToOne 阅读(130) 评论(0) 推荐(0) 编辑

损失函数

摘要：交叉熵损失函数 Cross Entropy Error Function 1. 二分类表达式其中： y——表示样本的label，正类为1，负类为0 p——表示样本预测为正的概率

y = 1

$y=1$ 时，对应的

p

$p$ 越大则

l o g (p)

$log(p)$ 越小，即损失越小同理，

y = 0

$y=0$ 时，

p

$p$ 越小，$ log(1 p 阅读全文

posted @ 2019-09-17 11:22 FromZeroToOne 阅读(258) 评论(0) 推荐(0) 编辑

强化学习简介

摘要：不理解环境(Model Free RL) Q Learning Sarsa Policy Gradients 理解环境基于概率基于价值阅读全文

posted @ 2019-08-28 19:15 FromZeroToOne 阅读(105) 评论(0) 推荐(0) 编辑

特征工程笔记

摘要：1.特征工程介绍这么一句话在业界广泛流传：数据和特征决定了机器学习的上限，而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢？顾名思义，其本质是一项工程活动，目的是最大限度地从原始数据中提取特征以供算法和模型使用。特征工程包含内容：特征清洗清洗异常样本（缺失值填充，异常值处理）采样（阅读全文

posted @ 2019-08-02 20:31 FromZeroToOne 阅读(197) 评论(0) 推荐(0) 编辑

NLP比赛心得

摘要：现如今，深度学习方法成了解决nlp任务的首选方案，比如textCNN、LSTM、GRU、BiLSTM、Attention、BERT等等。当然，有的nlp任务也可以用机器学习方法去解决，至于哪种任务用哪种方法，需要我们根据实际情况去选择。就目前我接触到的nlp赛题任务有，文本分类、情感分析、关系抽取、阅读全文

posted @ 2019-08-02 14:41 FromZeroToOne 阅读(752) 评论(1) 推荐(0) 编辑

Joe's blog

随笔分类 - 机器学习

搜索

随笔分类

随笔档案