随笔分类 - 机器学习
摘要:数据操作 保存与读取文件 df.to_csv("fasttext_data.csv",sep="\t",header=None,index=None) 忽略行号和列号 pd.read_excel(header=None) 设置第一行不为索引 pd.read_excel(names=[名字列表]) 为
阅读全文
摘要:1. 所有神经网络处理的的数据都是平均值接近0,标准差接近1的,这样可以保证神经网络尽快的收敛 2. batchNormalization是指从数据中减去平均值,然后再除以标准差的操作,可以像一个层一样添加到激活函数输入前面
阅读全文
摘要:a.完整特征工程竞赛 b.野博客理论入门理解 c.再回到代码深入理解模型内部 d.再跨理论,查阅经典理论巨作。这时感性理性都有一定高度,会遇到很多很大的理解上的疑惑,这时3大经典可能就可以发挥到最大作用了。
阅读全文
摘要:"参考博客" "显示中文标签"
阅读全文
摘要:将txt文件转换成excel文件 统计类别分布
阅读全文
摘要:model_selection Metrics
阅读全文
摘要:交叉熵损失函数 Cross Entropy Error Function 1. 二分类表达式 其中: y——表示样本的label,正类为1,负类为0 p——表示样本预测为正的概率 时,对应的越大则越小,即损失越小 同理 ,时,越小,$ log(1 p
阅读全文
摘要:不理解环境(Model Free RL) Q Learning Sarsa Policy Gradients 理解环境 基于概率 基于价值
阅读全文
摘要:1.特征工程介绍 这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。 特征工程包含内容: 特征清洗 清洗异常样本(缺失值填充,异常值处理) 采样(
阅读全文
摘要:现如今,深度学习方法成了解决nlp任务的首选方案,比如textCNN、LSTM、GRU、BiLSTM、Attention、BERT等等。当然,有的nlp任务也可以用机器学习方法去解决,至于哪种任务用哪种方法,需要我们根据实际情况去选择。就目前我接触到的nlp赛题任务有,文本分类、情感分析、关系抽取、
阅读全文