摘要: Contents What is Trie?What Does It Take to Implement a Trie?Tripple-Array TrieDouble-Array TrieSuffix CompressionKey InsertionKey DeletionDouble-Ar... 阅读全文
posted @ 2015-11-22 22:20 StevenLuke 阅读(152) 评论(0) 推荐(0) 编辑
摘要: 分词、词性标注、命名实体识别、关键词提取、自动摘要、拼音、简繁转换、文本推荐 阅读全文
posted @ 2015-11-22 20:25 StevenLuke 阅读(84) 评论(0) 推荐(0) 编辑
摘要: 指数分布族:伯努利分布、高斯分布、多项式分布、泊松分布、伽马分布。 伯努利分布用来对0-1问题进行建模 多项式分布用来对有K个结果的事件进行建模 泊松分布通常是用来对计数的过程进行建模 伽马分布和指数分布考虑的是正数的分布,经常被用来对间隔进行建模 β分布和迪利克雷分布通常用来对小数进行建模,... 阅读全文
posted @ 2015-11-22 15:21 StevenLuke 阅读(93) 评论(0) 推荐(0) 编辑
摘要: 充分统计量 编辑 统计量是样本数据的函数,在统计学中,T(x) 为未知分布P的参数θ的充分统计量,当且仅当T(x)可以提供θ的全部信息,也就是说,没有统计量可以提供关于θ的额外信息。 统计量是实际上是一种对数据分布的压缩,在样本加工为统计量的过程中,样本中所含的信息可能有所损失,若... 阅读全文
posted @ 2015-11-22 12:59 StevenLuke 阅读(268) 评论(0) 推荐(0) 编辑