摘要:
注:此篇博客无法提供源代码下载,读者可自行从博文上拷贝代码。作者:finallyliuyu(博文转载请注明作者和出处)注:有网友提出来说直接把抽取之后的搜狗2008版新闻语料库发布,根据搜狗实验室的数据使用许可说明(http://www.sogou.com/labs/dl/license.html):有如下条款三.受益者的义务禁止将搜狗实验室数据提供给第三方使用,第三方如有需要可直接访问搜狗实验室... 阅读全文
摘要:
正式开始使用C++做工作已经有一个月了吧。这一个月进步很大。首先要感谢很多人的帮助,包括QQ群里的同学和网友,还有博客园里的园友。在其中,自己遇到的最大的问题是:当用一个还没有完全了解的语言特性或者说语言知识点去写程序时,总会出现一些匪夷所思的错误。每次遇到这种错误我会认为这种错误是由还没有用熟练的语言知识点造成的,于是乎到处去求救,但是回过头来发现,造成错误的原因是自己的一个小疏忽。 上一次,网... 阅读全文
摘要:
整理者:finallyliuyu NLP研究者或者开发人员如果选用C++语言作为开发工具。那么首先需要克服两个难题。 第一个难题是:学会在C++中使用正则表达式。鉴于C++本身并不支持正则表达式,所以我们需要借助第三方库boost.中的regex子库。网络上有很多关于boost的安装方法,比如有的方法介绍如何部分安装boost库,我这里也整理了一个如何完全安装boost库的方法:《C++安装b... 阅读全文