◆版权声明:本文出自胖喵~的博客,转载必须注明出处。 转载请注明出处:https://www.cnblogs.com/by-dream/p/9016289.html 前言 通常我们在网购的时候会遇到这样的情况,当我们买了一个物品A后,网站上可能会给你推荐一些和A相似的物品。这样的推荐就是典型的协同过 Read More
概念 回归即Regression,回归分析到意思中其实包含了“倒推”的含义,其实就是一种归纳到过程,一种思想。当看到大量事实所呈现的样式形态,推断出原因是如何的;当看到大量到数字对(pair)是某种样态,推断他们之间蕴含到关系是如何的。 线性回归是利用数理统计学中到回归分析来确定两种或者两种以上变量 Read More
前言 不要怀疑自己,这个字就是读shang,哈哈。这一节主要说一下“信息熵”。 当然在介绍信息熵之前,先需要了解一下信息量以及热力熵。 信息量 信息,指音讯、消息、通讯系统传输和处理的对象,泛指人类社会传播的一切内容。1948年,数学家香农在题为“通讯的数学理论”的论文中指出:“信息是用来消除随机不 Read More
马上要迎来2018年了。 新的一年希望自己可以系统的学习一下机器学习的基础,先从统计基础开始吧。 加和值 我们生活中几乎处处可以见到应用的实例。 例如:我这次去旅游一共花了2000元;2015年中国人民共和国GDP(国内生产总值)为68.91万亿元;这个班同学的成绩综合是600分。 这些都是用加和值 Read More
要统计自动化的覆盖率,所以临时看了下jacoco,记录下过程。后续用的时候方便查看。 1、build.gradle中修改 android { buildTypes { debug { debuggable true testCoverageEnabled true } } } 2、直接编译即可,这里 Read More
◆版权声明:本文出自胖喵~的博客,转载必须注明出处。 转载请注明出处:http://www.cnblogs.com/by-dream/p/7765345.html 上一节介绍了BLEU算的缺陷。NIST(National Institute of standards and Technology)方 Read More
dojo和kata的练习记录: 进入 http://cyber-dojo.org/ 由一个人进行 setup a default practice,然后创建: 这里支持各种语言和各种测试框架,这里我们选择C++和GoogleTest 这里是选择一个题目进行联系,我们选择“网球记分规则”来练习。 成功 Read More
◆版权声明:本文出自胖喵~的博客,转载必须注明出处。 转载请注明出处:http://www.cnblogs.com/by-dream/p/7679284.html 前言 近年来,在自然语言研究领域中,评测问题越来越受到广泛的重视,可以说,评测是整个自然语言领域最核心和关键的部分。而机器翻译评价对于机 Read More
◆版权声明:本文出自胖喵~的博客,转载必须注明出处。 转载请注明出处:http://www.cnblogs.com/by-dream/p/7683126.html 前言 机器翻译的评测,很大程度上会依赖评测集。制作一份好的评测集,远远没有我们想象的那么简单。 今天我就将自己制作评测集的经验分享给大家 Read More
◆版权声明:本文出自胖喵~的博客,转载必须注明出处。 转载请注明出处:http://www.cnblogs.com/by-dream/p/7669139.html 首先解释一下几个名词,由于我的另外两篇文章还没有写出来,因此这里需要先介绍一下: 翻译评测集:以下简称评测集,一组由原文和译文组成的文件 Read More