摘要:
之前的文章介绍了个人分词软件在介入数据库作为词典存储介质后的表现,为了让分词软件能够更好得得到展示,本篇讲介绍将其移植B/S端的相关方法。 在《基于.NET的分词软件设计与实现V3.0--对比测试及改变》中,我介绍了很多基于B/S和C/S的分词程序,在移植B/S端时,我参照了很多相关的功能,并从中提炼了四个最主要的功能(其中标注不作为本分词软件的重点,故予以排除): 1、以“\”为间隔的切分; 2、以“ ”为间隔的切分(所谓的“北大标准”切分); 3、去除文本标点; 4、在之前的版本中我进行了去除文本格式的尝试,虽然在对比测试后没有予以使用,但在这里依然作为一个附属功能提炼出来,称... 阅读全文