04 2013 档案

摘要:网上很多人把什么文本分类说的神乎其技,搞的我非常火大花了一个通宵阅读了N个文本分类的开源代码,总结了一下其实简单的难以置信:先验概率计算=某分类文档总数/所有分类文档总数分类条件概率计算=某分类包含关键词的训练文档总数+1/(某分类的训练文档总数+分类总数)文本某分类条件概率=所有词汇的分类条件概率的乘积*先验概率最终分类就是根据上面的结果排序概率最大的就表示属于某分类的可能性越大明明三句话就能说清楚的事,专家们长篇大论,为何?交流QQ群:204725117 阅读全文
posted @ 2013-04-28 10:15 chinacloudy 阅读(349) 评论(0) 推荐(0) 编辑
摘要:开源:云寻觅中文分词 (Yunxunmi Chinese Word Segmentation) ,词汇440万,10万字文章分词并计算频率不超过1秒云寻觅中文分词 (Yunxunmi Chinese Word Segmentation) 指的是将一个汉字序列切成一个一... 阅读全文
posted @ 2013-04-23 00:07 chinacloudy 阅读(201) 评论(0) 推荐(0) 编辑
摘要:开源:云寻觅中文分词 (Yunxunmi Chinese Word Segmentation) ,词汇440万,10万字文章分词并计算频率不超过1秒 云寻觅中文分词 (Yunxunmi Chinese Word Segmentation) 指的是将一个汉字序列切成一个一个单独的词。云寻觅中文分词就是将连续的字序列按照一定的规范重新组合成词序列的 过程。中文分词也是搜索引擎最核心的技术包括(全文索引,检索,排序权重计算,文本分类,聚类),因此,中文分词的准确性和高效性将直接决定一个搜索引擎的好坏,目前很多搜索引擎包括谷歌对中国各地的方言几乎无法识别,直接导致搜索结果漏洞百出,正是基于上述原因,本人不辞辛苦开发出云寻觅中文分词并开源,希望更多的有识之士从中受益。 阅读全文
posted @ 2013-04-22 20:53 chinacloudy 阅读(4322) 评论(28) 推荐(42) 编辑
摘要:我的 云寻觅 搜索引擎 开始公测,前天开始开发,昨天买域名,今天发布在本机,请各路专家指正! 顺便开源!网站公测中,正在完善 有任何疑问请联系:QQ交流群 204725117全部开发仅用时3 天,顺便开源:开源:实时采集,实时索引,实时检索的视频搜索引擎正式开源,单机支持3000万网页的全文索引http://hi.baidu.com/earthsearch/item/1d6f48ec1415efe3fb42ba39全部开发仅用时3 天,顺便开源:开源:实时采集,实时索引,实时检索的视频搜索引擎正式开源,单机支持3000万网页的全文索引http://hi.baidu.com/earthsearc 阅读全文
posted @ 2013-04-12 21:20 chinacloudy 阅读(1153) 评论(3) 推荐(0) 编辑
摘要:如花快来接客,如今拉客接客都自动化了,如花咋办?为了让广大程序员可以直接与客户面对面,本人泣血打造了如花接客系统实时采集项目,实时针对项目发布产品说明及广告如花接客系统拉客全自动,一个顶十个精英业务员,业绩一天提升1000%,用了全自动拉客系统腰不疼,手不酸,数钱数到手抽筋!减少人为体力劳动,增加准确性和及时性,实时采集项目,实时针对项目发广告!系统将根据您设定的关键词寻找相应的需求,寻找将定时根据关键词找出最新的需求,并按照广告词所设定的内容发布到对应的需求页面内,方便您接项目!1、自动实时获取最新关键词需求!2、自动对新需求发布拉客广告!3、支持多关键词4、无须安装,纯绿色,无毒,无污染5 阅读全文
posted @ 2013-04-09 15:49 chinacloudy 阅读(552) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示