摘要:
1. 当uninstall或者upgrade包时遇到类似下面的问题时: It is a distutils installed project and thus we cannot accurately determine which files belong to it which would l 阅读全文
摘要:
改变python的工作目录: import os os.getcwd() os.chdir('D:\data') os.getcwd() 另外如果是spyder还可以通过设置的方式: 阅读全文
摘要:
明明安装了keras和tensorflow,可是import keras时,却出现错误:cannot import name 'tf_utils': 错误出现的原因是keras和tensorflow不兼容(tensorflow 1.7 应该下载keras 2.1.6版本),但是我安装的却如下: 解决 阅读全文
摘要:
几种交叉熵之间的区别: 参考: https://www.cnblogs.com/guqiangjs/p/8202899.html 阅读全文
摘要:
一、文本预处理 API 句子分割text_to_word_sequence,将一个句子拆分成单词构成的列表。注意这个函数对中文的分割无效。 参数: text:字符串,待处理的文本 filters:需要滤除的字符的列表或连接形成的字符串,例如标点符号。默认值为 '!"#$%&()*+,-./:;<=> 阅读全文
摘要:
一、Dirichlet-Multinomial共轭 二、LDA=PLSA(Probabilistic Latent Semantic Analysis)+bayes 三、训练方法有gibbs sampling(吉布斯采样)和variation inference-EM算法(变分推断-EM算法) 四、 阅读全文
只有注册用户登录后才能阅读该文。 阅读全文
摘要:
python中的re库用于正则化,相当于一个过滤器,可以过滤掉不需要的字符,得到自己想要的。 运行结果是: 其中,\u4e00-\u9fa5表示匹配中文字符,\u4e00是在编码中中文字符开始的值,\u9fa5是中文字符结束的值。 jieba.posseg.cut(text) 可以对段落进行词的划分 阅读全文