eaglet

本博专注于基于微软技术的搜索相关技术
随笔 - 189, 文章 - 0, 评论 - 3725, 阅读 - 147万
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

05 2008 档案

摘要:公布1.3版本的所有改动和下载位置 阅读全文

posted @ 2008-05-29 08:27 eaglet 阅读(12705) 评论(130) 推荐(1) 编辑

摘要:中文姓名识别和未登录词识别是中文分词中的难点,具体为什么是难点,很多文章都有叙述,这里不再多讲。主要介绍一下 1.3版本是如何对中文姓名和未登录词进行识别的。 阅读全文

posted @ 2008-05-28 15:18 eaglet 阅读(3369) 评论(12) 推荐(0) 编辑

摘要:KTDictSeg 分词组件1.3版本已经接近完成,只剩下最后的一点功能。在KTDictSeg 分词组件1.3版本的开发过程中,得到了很多朋友的关注和支持,特别是一些分词方面的专家提出了很多很好的意见,也对我的分词算法给出了很多中肯的建议,在此向他们表示由衷的感谢。1.3版本的预分词算法还是沿用了之前版本的变相的最大匹配算法,这个算法有着本质的缺陷,未来的2.0版本可能会使用目前比较先进的算法替代这个过时的算法。 1.3版本在预分词中增加了对英文专业词汇的支持,比如C++,C#原来无法被分出来,现在只要在词库中有就可以分出来。在预分词中1.3版本还增加了对词频的判断。在预分词后,1.3版本对中文姓名匹配,未登录词识别等进行了一些改进。另外1.3版本还增加了对lucene.net的支持以及字典管理功能。之前很多朋友建议将ArrayList全部改成了List,非常好的建议,1.3版本将原来代码中所有的ArrayList全部改成了List. 从今天开始,我打算逐步公布新版本中的一些主要算法,供朋友们参考,由于我水平有限,很多算法难尽如人意,有不对的地方还望指正。 b 阅读全文

posted @ 2008-05-27 15:07 eaglet 阅读(3924) 评论(32) 推荐(0) 编辑

摘要:最近项目中需要通过程序自动设置windows 防火墙,查了一下资料,可以通过命令行netsh firewall来实现。封装了一个类来实现对允许放开的程序(Allowed program)进行管理。管理其他内容比如放开端口等方法是类似的。 阅读全文

posted @ 2008-05-20 15:22 eaglet 阅读(3149) 评论(5) 推荐(0) 编辑

摘要:最近做了一个采用FileMapping进行进程间通信的程序,目的是希望通过这个程序实现WebService和我写的其他服务之间 通信,实现安全隔离以及一些状态的跟踪、保持和管理。做好后,先用两个普通的Windows 进程测试了一下,一切OK,立 即将客户端移植到ASP.NET中,结果打开FileMapping失败,立即意识到是权限问题。 阅读全文

posted @ 2008-05-14 14:35 eaglet 阅读(1874) 评论(5) 推荐(0) 编辑

摘要:.Net 框架提供了两种List类型,一种是基于链表的LinkedList, 一种是基于数组的List。那么在实际应用中到底采用哪种List,如何取舍呢?本文对两种类型在队列,堆栈和简单插入三种简单算法中的效率进行了一个比较。 阅读全文

posted @ 2008-05-08 15:53 eaglet 阅读(3649) 评论(6) 推荐(0) 编辑

摘要:最近在做KTDictSeg 的 1.3 版本,在这个版本中做了一个用Lucene.net 搜索新闻的例子,其中生成关键词摘要用了 highlighter.net-1.4.0版本,发现中文关键词摘要生成结果总是不对,但英文的结果是对的。没办法,只得把highlighter.net 的源码拿出来调了一遍,最终发现问题在TokenGroup类的IsDistinct函数上。 阅读全文

posted @ 2008-05-06 19:07 eaglet 阅读(2104) 评论(4) 推荐(0) 编辑

摘要:V1.1.1 版本增加一个配置模式 RegistryKeyPattern,用于帮助调用者自动读写注册表配置。另外该版本将IConfigurationPattern 接口的parameter 参数类型有String改为Object,以便更加通用。 阅读全文

posted @ 2008-05-06 14:52 eaglet 阅读(2554) 评论(3) 推荐(0) 编辑

点击右上角即可分享
微信分享提示