12 2009 档案
摘要:MMSEG恐怕是最简单易实现而且效果还可以的基于字典的机械分词算法。http://nzinfo.spaces.live.com/Blog/cns!67694E0B61E3E8D2!344.entry当前我的程序放在http://code.google.com/p/chinese-word-segmentaion/网上有一个C++版本的源代码,但是我运行老是字典载入不成功。我看了下他的代码内部用的m...
阅读全文
摘要:written by chenghuige at gmail.com也需有更好的方法我没有想到,但是没有在linux下面找到比较方便的读取unicode文本的方法。用ICU,QT都太重量级了,于是自己写了一个包装好的unicode_iterator,当然还可以进一步包装比如提出一个类提供begin和end.但是还要考虑很多,比如有的是little edian格式的有的是big edian格式的,同...
阅读全文
摘要:作者:Scott Meyers and Andrei Alexandrescu 译者:ChengHuige at gmail.com1.引言详尽的讨论了volatile语义以及如何用C++实现线程安全的Singleton模式。主要参考Scott Meyers and Andrei Alexandrescu写的“C++ and the Perils of Double-Checked ...
阅读全文
摘要:对多线程经验不多,仅提供一些个人看法,如有错误请指正。 1.C++0X 多线程简介C++0x STL提供了对多线程的支持就不用再去选择跨平台的多线程库了,用标准的吧:) 看了一下BOOST和当前STL的接口几乎完全一致:)也就是说用boost thread写的程序应该把例如boost::thread, boost::unique_lock ...等等的地方换成std::thread, std::u...
阅读全文