python使用记录

去重后,依据原来列表的顺序进行排序

   a = [1,1,4,5,2,2,9,9] m = list(set(a)) m.sort(key=a.index)

处理自然语言,去除停用词

  import nltk

  nltk.download('stopwords')

  [nltk_data] Error loading stopwords: <urlopen error [WinError 10054]
  [nltk_data] 远程主机强迫关闭了一个现有的连接。>

 

  输入from nltk.book import *:

  

  手动下载nltk数据集(所有的)https://pan.baidu.com/s/1oUsf-FgVAZnQAtZWRwiK4w 提取码:9sor

  然后把下载好的压缩包解压至上图中Searched in的一个目录下。重新输入from nltk.book import *:

  

posted @ 2019-06-07 21:25  天上白云蓝湛湛  阅读(243)  评论(0编辑  收藏  举报