摘要: 有1,2,3....n个数组,每个数组包含一系列一维线段的表示,每个数组的元素结构为(point,length)(point>=0 且 length>=1,都为整数),表示从point开始长为length的线段,现将n个数组中的线段合并,其中需要考虑数组的优先级:1>2>....>n,高优先级的数组 阅读全文
posted @ 2018-04-03 11:55 Shendu.CC 阅读(541) 评论(2) 推荐(0) 编辑
摘要: 上一篇中,主要说的就是词袋模型。回顾一下,在进行文本分类之前,我们需要把待分类文本先用词袋模型进行文本表示。首先是将训练集中的所有单词经过去停用词之后组合成一个词袋,或者叫做字典,实际上一个维度很大的向量。这样每个文本在分词之后,就可以根据我们之前得到的词袋,构造成一个向量,词袋中有多少个词,那这个 阅读全文
posted @ 2018-04-03 11:50 Shendu.CC 阅读(13345) 评论(0) 推荐(0) 编辑