摘要:1、去除网页的标签,如<br/> 2、将标点符号等去掉,用正则表达式。 去除特殊符号: 3、将文本中的单词小写化,并将data用空格分开 4、去掉停用词 5、将所有的词连接成一个句子 6、把空格前缀去除 7、删除短词,删除句子中词语长度小于3的词,如haa,hi等无意义的词 8、分词 9、提取词干
阅读全文
摘要:1、导入模块 http://scikit-learn.org/stable/modules/generated/sklearn.discriminant_analysis.LinearDiscriminantAnalysis.html#sklearn.discriminant_analysis.Li
阅读全文
摘要:1、输出树的所有路径:(前序遍历,深度遍历的特例) 1、二叉树中的最大路径和 给定一个非空二叉树,返回其最大路径和。 本题中,路径被定义为一条从树中任意节点出发,达到任意节点的序列。该路径至少包含一个节点,且不一定经过根节点。 示例 1: 示例 2: ############超出时间限制 2、路径求
阅读全文
摘要:1、序列化:层次遍历【用字符串来存储】 2、反序列化:用队列存已经建立的节点,从序列化后的字符串列表取数来建立树 二、前序遍历的序列化: 代码: 反序列化: 3、前序遍历和中序遍历反序列化
阅读全文