◆版权声明:本文出自胖喵~的博客,转载必须注明出处。 转载请注明出处:http://www.cnblogs.com/by-dream/p/7668501.html 前言 机器学习中经过听到“召回率”和“精确率” 这两个名词,今天简单解释一下。 概念 首先我先简单看几个名词解释: 通常我们预测的样本中 Read More
◆版权声明:本文出自胖喵~的博客,转载必须注明出处。 转载请注明出处:http://www.cnblogs.com/by-dream/p/7610228.html 这个时代大数据、人工智能火的一塌糊涂,趁着自己还有精力,体验体验这NB的技术,先选图像识别来玩。 简单看了下市面上,图像识别比较全的是百 Read More
◆版权声明:本文出自胖喵~的博客,转载必须注明出处。 转载请注明出处:http://www.cnblogs.com/by-dream/p/7091315.html 前言 最近打算把翻译质量的人工评测好好的做一做。 首先废话几句,介绍下我这边翻译质量的人工评测怎么做。先找一批句子,然后使用不同的引擎对 Read More
之前一直在Linux上使用crontab,今天换到了Ubuntu上踩了不少小坑,今天总结一下。 默认情况下Ubuntu里都装好了crontab,我们直接使用crontab来编辑命令: 结果出现了这个页面,当时第一反应就是这个怎么是这样。。。 这里一定要选对,之前一直选了2,超级难操作。后来发现可以使 Read More
参考: https://msdn.microsoft.com/zh-cn/library/mt146806.aspx 首先你需要一个Microsoft的帐号,如果没有在这里注册一下 https://signup.live.com/signup 感叹一下微软的验证码复杂的绝对比12306牛逼。 注册成 Read More
分词技术目前已经在机器翻译领域广泛使用。今天我们说说分句。 分句的作用主要用在,当我们给翻译引擎一大段文字的时候,它很有可能就搞不定了,因为一般需要将分句后的句子送给引擎,引擎在翻译完后再将结果拼起来。 这里找到一个开源的分句,我们一起来看看它: https://github.com/Tessmor Read More
◆版权声明:本文出自胖喵~的博客,转载必须注明出处。 转载请注明出处:http://www.cnblogs.com/by-dream/p/6554340.html 前言 google的翻译不得不承认它是比较好的。但是google翻译对外提供的翻译接口都是收钱的,做为一名普普通通的开发者,囊中羞涩,因 Read More
之所以研究这个算法,是因为最近在研究NLP中文的分词,所谓分词就是将一个完整的句子,例如“计算语言学课程有意思”,分解成一些词组单元“计算语言学,课程,有,意思”。 “最大匹配法” 在中文分词中有所应用,因此这里介绍一下。 “最大匹配法” 分为正向匹配和逆向匹配,这里先看正向匹配。 算法思想: 正向 Read More