摘要:
本文主要是带你入门kaggle最基础的比赛——泰坦尼克号之灾,里面有各种可视化为你展示做的过程,并非只有一大段代码,希望能带大家真正地去入门 阅读全文
摘要:
这篇文章主要介绍了计算TF-IDF的不同方法实现,主要有三种方法:
用gensim库来计算tfidf值
用sklearn库来计算tfidf值
用python手动实现tfidf的计算 阅读全文
摘要:
这篇博客主要是总结对各种特征训练后得出的F1值以及构造特征的思路 阅读全文
摘要:
关于虚拟机和ubuntu的安装 阅读全文
摘要:
本文是对上文[用CRF做命名实体识别](https://www.cnblogs.com/lookfor404/p/9189429.html)做一次升级。多添加了5个特征(分别是词性,词语边界,人名,地名,组织名指示词),另外还修改了特征模板,最终训练了11个小时,F1值为0.98。 阅读全文