乐哈哈旅游视频网:
随笔 - 186  文章 - 1  评论 - 149  阅读 - 93万

大成功!

这几天吧词组建立环节的代码重写了!用的是一个非常好的哈希算法,可以对20多万变长词进行散列,碰撞率极低,几乎没有!因为其中用到对不同频率字节的词组散列到不同位上去的方法。很好的解决了词库建立这一过程,时间从以前的7小时没有提取完只提取到6万词组左右----->现在20多分钟就可以提取16多万词的高效结果!!
真是值得欣喜!

不过现在词频矩阵等的计算还得想写好办法!大规模矩阵运算~~改进中....

posted on   riky  阅读(561)  评论(1编辑  收藏  举报
编辑推荐:
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
< 2007年5月 >
29 30 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 1 2
3 4 5 6 7 8 9

乐哈哈旅游视频网:
点击右上角即可分享
微信分享提示