03 2018 档案
摘要:缩进 用4个空格来缩进代码 分号 不要在行尾加分号, 也不要用分号将两条命令放在同一行。 行长度 每行不超过80个字符 以下情况除外: l 长的导入模块语句 l 注释里的URL 不要使用反斜杠连接行。 Python会将 圆括号, 中括号和花括号中的行隐式的连接起来 , 你可以利用这个特点. 如果需要
阅读全文
摘要:目的 将gensim输出的格式转化为numpy array格式,支持作为scikit learn,tensorflow的输入 实施 使用nltk库的停用词和网上收集的资料整合成一份新的停用词表,用来过滤文档中的停用词,也去除了数字和特殊的标点符号,最后将所有字母转化为小写形式。 以下是原文: Sub
阅读全文