随笔分类 -  data mining

摘要:隐马尔科夫模型HMM 序言 文本序列标注是自然语言处理中非常重要的一环,我先接触到的是CRF(条件随机场模型)用于解决相关问题,因此希望能够对CRF有一个全面的理解,但是由于在学习过程中发现一个算法像jar包依赖一样依赖于各种算法,就像提到CRF模型,那么肯定不得不提一下HMM等模型,如果不能很好的 阅读全文
posted @ 2019-07-02 11:11 Epir 阅读(625) 评论(0) 推荐(0)
摘要:本文是一篇介绍Wrapper Induction的阅读笔记,原文详见《Wrapper induction:Efficiency and expressiveness》。 Wrapper Induction是一种自动的学习Wrapper的技术,通过一系列需要抽取的页面资源(训练数据),每个被抽取的文本 阅读全文
posted @ 2018-03-27 14:46 Epir 阅读(565) 评论(0) 推荐(0)