摘要: 本文主要是带你入门kaggle最基础的比赛——泰坦尼克号之灾,里面有各种可视化为你展示做的过程,并非只有一大段代码,希望能带大家真正地去入门 阅读全文
posted @ 2018-07-26 22:33 炼己者 阅读(922) 评论(0) 推荐(0) 编辑
摘要: 所有博文目录,欢迎大家参考 阅读全文
posted @ 2018-07-23 20:22 炼己者 阅读(291) 评论(0) 推荐(0) 编辑
摘要: 本文主要简单的介绍下BILSTM-CRF的原理,以及如何把大佬的数据集换成我们自己的数据集,进行训练 阅读全文
posted @ 2018-07-20 23:40 炼己者 阅读(3659) 评论(0) 推荐(0) 编辑
摘要: 使用conlleval.pl对CRF测试结果进行评价的方法 阅读全文
posted @ 2018-07-20 20:21 炼己者 阅读(3815) 评论(0) 推荐(0) 编辑
摘要: 这篇文章主要介绍了计算TF-IDF的不同方法实现,主要有三种方法: 用gensim库来计算tfidf值 用sklearn库来计算tfidf值 用python手动实现tfidf的计算 阅读全文
posted @ 2018-07-13 22:30 炼己者 阅读(664) 评论(1) 推荐(0) 编辑
摘要: 这篇博客主要是总结对各种特征训练后得出的F1值以及构造特征的思路 阅读全文
posted @ 2018-07-07 01:08 炼己者 阅读(556) 评论(0) 推荐(0) 编辑
摘要: 关于虚拟机和ubuntu的安装 阅读全文
posted @ 2018-06-29 20:56 炼己者 阅读(275) 评论(0) 推荐(0) 编辑
摘要: 本文是对上文[用CRF做命名实体识别](https://www.cnblogs.com/lookfor404/p/9189429.html)做一次升级。多添加了5个特征(分别是词性,词语边界,人名,地名,组织名指示词),另外还修改了特征模板,最终训练了11个小时,F1值为0.98。 阅读全文
posted @ 2018-06-22 23:46 炼己者 阅读(6274) 评论(1) 推荐(0) 编辑