随笔分类 - c#
c#
摘要:经过一周的研究,终于可以解析rss2.0,1.0,0.92,Atom0.3格式,今天在继续测试的时候让我又遭受一次挫折,在碰到GBK编码的rss文件会抛出异常! 比如 :http://club.sohu.com/rss.shtml这个页的rss. 在用 XmlDocument doc = new XmlDocument(); doc.Load(url);XmlTextWriter writer...
阅读全文
摘要:已经弄了几天了,今天测试了一下,在服务器上下载了我的一个歌词数据库,有90M左右,17万数据.下午我把把他索引了10多万一点记录,索引文件46M.在winforms下做搜索测试一般需要100MS,不过在程序第一次加载需要20S左右!主要是加载中文分词的分词数据库! 晚上又把搜索转到asp.net上做测试,一样,在编译后第一次打开要20S左右,不过以后就快多了,比winfor...
阅读全文
摘要:现在RSS很流行,一度风行于整个互联网,的确,他给我们带来了很大的改变和方便!RSS也分很多版本,rss.1.0.rss2.0比较多,还有atom格式的! 在解析的时候给我带来了麻烦,由于本人没有怎么研究过xml和相关的解析工作,所以碰到很多问题,目前能成功解析rss2.0。 顶部的一些解析(暂时这么叫吧,我也不知道叫什么) 1private void GetRssHead(X...
阅读全文
摘要:开始看了下java的,弄不太明白,没学过java,后来找了了.net的,主要是研究下dotlucene,由于刚刚接触c#,对这样一个开源的项目研究还是有点困难,不过我比较喜欢搜索类的,所以还是看了起来,看了大量的资料,英文的和中文的,现在终于是调试成功了,而且加了一个基于词表的中文分词。 现在还有Highlighter高亮显示的没弄出来,正在研究中! 还有就是自己写的html2...
阅读全文