摘要: 考虑一个语音识别系统,假设用户说了这么一句话:“I have a gun”,因为发音的相似,该语音识别系统发现如下几句话都是可能的候选:1、I have a gun. 2、I have a gull. 3、I have a gub. 那么问题来了,到底哪一个是正确答案呢? 一般的解决方法是采用统计的 阅读全文
posted @ 2018-08-07 01:20 理想几岁 阅读(569) 评论(0) 推荐(0) 编辑
摘要: 在学习机器学习中,看过挺多案例,看到很多人在处理数据的时候,经常把连续性特征离散化。为此挺好奇,为什么要这么做,什么情况下才要做呢。 一、离散化原因 数据离散化是指将连续的数据进行分段,使其变为一段段离散化的区间。分段的原则有基于等距离、等频率或优化的方法。数据离散化的原因主要有以下几点: 1、算法 阅读全文
posted @ 2018-08-07 00:54 理想几岁 阅读(2940) 评论(0) 推荐(0) 编辑