我用纯C语言开发的中英文混合分词服务器3.0正式发布,词库190多万词,每秒切分5万+,同时提供 c、java、C#、delphi、js调用范例
我用纯C语言开发的中英文混合分词服务器3.0正式发布,词库190多万词,每秒切分5万+,同时提供 c、java、C#、delphi、js调用范例
百万商业圈中英文混合分词服务器3.0正式发布,绝对稳定高效,分词库扩大到了190多万词汇,
开发语言:C语言
编译器:GCC
测试环境:xp、win2000、win2003、win7、win2008、win8
质量测试:用例共 3000份10K+的随机文章
平均性能:5万字以内的文章单线程切分1秒内可以切分完毕
3.0版算法做了全面修正,分词准确性、服务稳定性、健壮性、速度都有了质的飞跃!
同时提供c、java、C#、delphi、js调用范例
支持大规模并发,线程安全、5万字以内的文章单线程切分1秒内可以切分完毕!
软件名称:百万商业圈中文分词服务器 作者:QQ 99923309
具体使用时可将词库文件(190多万词汇) bwsyq.com.dat放在分词服务器相同的目录即可
使用前请先启动分词服务器
分词服务器程序既是一个windows 服务程序, 服务名称是:bwsyq fenci service and serve 0.1 (百万商业圈中文分词服务器)
同时又是一个简单的webserver安装启动后,你可以直接在浏览器中输入 http://127.0.0.1:888 进行使用
同时又还是一个Scoket server 通信端口是 888.
分词服务器安装方式有两种(假设你保存在D盘,如果不是请自行更改):
一、也可以直接通过双击 安装分词服务器.bat 来进行安装
二、d:\fenciserver.exe install 回车即可!(安装后就会自动启动服务)
分词服务器卸载方式是(假设你保存在D盘,如果不是请自行更改):
一、也可以直接通过双击 卸载分词服务器.bat 来进行卸载
二、d:\fenciserver.exe uninstall 回车即可!(卸载后就会自动关闭服务)
另外:为了便于大家的开发使用,
我提供了Delphi、C#、Java、Html、javascript这几中不同语言的使用代码。
另词库文件 bwsyq.com.dat 请与分词服务器保存在同一目录下,并且不能改名!
使用步骤:
一、下载分词服务器和词库文件,词库文件与分词服务器保存在同一目录下。
二、分词服务器安装,请参考上面的说明。
三、可以开始使用了!
相关工具说明: ImportCiHuiToCiKuFromFile.exe 词库批量导入工具 具体说明:
用法比如: c:\ImportCiHuiToCiKuFromFile.exe "c:\词汇文档.txt" 回车即可
"c:\词汇文档.txt" 中请按照一个词一行的格式 保存,文件编码请采用ANSI格式
有任何疑问请与我沟通:QQ 99923309
百万商业圈中英文混合分词服务器3.0正式发布,绝对稳定高效,分词库扩大到了190多万词汇,
开发语言:C语言
编译器:GCC
测试环境:xp、win2000、win2003、win7、win2008、win8
质量测试:用例共 3000份10K+的随机文章
平均性能:5万字以内的文章单线程切分1秒内可以切分完毕
3.0版算法做了全面修正,分词准确性、服务稳定性、健壮性、速度都有了质的飞跃!
同时提供c、java、C#、delphi、js调用范例
支持大规模并发,线程安全、5万字以内的文章单线程切分1秒内可以切分完毕!
软件名称:百万商业圈中文分词服务器 作者:QQ 99923309
具体使用时可将词库文件(190多万词汇) bwsyq.com.dat放在分词服务器相同的目录即可
使用前请先启动分词服务器
分词服务器程序既是一个windows 服务程序, 服务名称是:bwsyq fenci service and serve 0.1 (百万商业圈中文分词服务器)
同时又是一个简单的webserver安装启动后,你可以直接在浏览器中输入 http://127.0.0.1:888 进行使用
同时又还是一个Scoket server 通信端口是 888.
分词服务器安装方式有两种(假设你保存在D盘,如果不是请自行更改):
一、也可以直接通过双击 安装分词服务器.bat 来进行安装
二、d:\fenciserver.exe install 回车即可!(安装后就会自动启动服务)
分词服务器卸载方式是(假设你保存在D盘,如果不是请自行更改):
一、也可以直接通过双击 卸载分词服务器.bat 来进行卸载
二、d:\fenciserver.exe uninstall 回车即可!(卸载后就会自动关闭服务)
另外:为了便于大家的开发使用,
我提供了Delphi、C#、Java、Html、javascript这几中不同语言的使用代码。
另词库文件 bwsyq.com.dat 请与分词服务器保存在同一目录下,并且不能改名!
使用步骤:
一、下载分词服务器和词库文件,词库文件与分词服务器保存在同一目录下。
二、分词服务器安装,请参考上面的说明。
三、可以开始使用了!
相关工具说明: ImportCiHuiToCiKuFromFile.exe 词库批量导入工具 具体说明:
用法比如: c:\ImportCiHuiToCiKuFromFile.exe "c:\词汇文档.txt" 回车即可
"c:\词汇文档.txt" 中请按照一个词一行的格式 保存,文件编码请采用ANSI格式
3.0下载地址:http://www.everbox.com/f/SqsPamaSN9lxv1SB4OCbHGI7X9
3.1下载地址:http://www.everbox.com/f/q9CJbCBVmvpizndCnNNQlBIBUv
有任何疑问请与我沟通:QQ 99923309
小白救星 QQ 99923309
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· [AI/GPT/综述] AI Agent的设计模式综述