07 2018 档案

Python数据分析8-----网页文本处理
摘要:1、去除网页的标签,如<br/> 2、将标点符号等去掉,用正则表达式。 去除特殊符号: 3、将文本中的单词小写化,并将data用空格分开 4、去掉停用词 5、将所有的词连接成一个句子 6、把空格前缀去除 7、删除短词,删除句子中词语长度小于3的词,如haa,hi等无意义的词 8、分词 9、提取词干 阅读全文

posted @ 2018-07-17 21:19 吱吱了了 阅读(538) 评论(0) 推荐(0) 编辑

Python数据分析3------数据预处理(2)----字符串处理
摘要: 阅读全文

posted @ 2018-07-13 13:12 吱吱了了 阅读(604) 评论(0) 推荐(0) 编辑

sklearn学习9----LDA(discriminat_analysis)
摘要:1、导入模块 http://scikit-learn.org/stable/modules/generated/sklearn.discriminant_analysis.LinearDiscriminantAnalysis.html#sklearn.discriminant_analysis.Li 阅读全文

posted @ 2018-07-04 15:57 吱吱了了 阅读(1257) 评论(0) 推荐(0) 编辑

树(8)----路径和
摘要:1、输出树的所有路径:(前序遍历,深度遍历的特例) 1、二叉树中的最大路径和 给定一个非空二叉树,返回其最大路径和。 本题中,路径被定义为一条从树中任意节点出发,达到任意节点的序列。该路径至少包含一个节点,且不一定经过根节点。 示例 1: 示例 2: ############超出时间限制 2、路径求 阅读全文

posted @ 2018-07-03 19:47 吱吱了了 阅读(562) 评论(0) 推荐(0) 编辑

树(7)-----二叉树的序列化和反序列化
摘要:1、序列化:层次遍历【用字符串来存储】 2、反序列化:用队列存已经建立的节点,从序列化后的字符串列表取数来建立树 二、前序遍历的序列化: 代码: 反序列化: 3、前序遍历和中序遍历反序列化 阅读全文

posted @ 2018-07-01 15:16 吱吱了了 阅读(204) 评论(0) 推荐(0) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示