摘要: 在进行自然语言处理之前,首先需要一个语料,这里选择维基百科中文语料,由于维基百科是 .xml.bz2文件,所以要将其转换成.txt文件,下面就是相关步骤: 步骤一:下载维基百科中文语料 https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-p 阅读全文
posted @ 2018-05-18 12:42 每天坚持一点点 阅读(3000) 评论(0) 推荐(0) 编辑
摘要: 首先一点,之前我一直自己安装python,然后直接在python环境下再安装第三方库,但自从另一台电脑重装系统之后,我当时在没有python的情况下直接安装的anaconda,觉得她超级好用(所以如果没有python,就直接安装它吧),而且很多第三方库(有一些巨难安装)都不需要安装,她就自带,特别好 阅读全文
posted @ 2018-04-11 22:28 每天坚持一点点 阅读(36929) 评论(0) 推荐(3) 编辑
摘要: 方法一:如果你的电脑没有安装python,推荐使用anaconda(自带python环境,同时自带各种第三方库,可以省去很多麻烦) 这里提供两个下载地址:1,、官网https://www.anaconda.com/download/(但是下载较慢,所以推荐第二种) 2、到国内清华镜像https:// 阅读全文
posted @ 2018-04-08 21:06 每天坚持一点点 阅读(12134) 评论(0) 推荐(0) 编辑
摘要: 在ubuntu16.04+python3.5情况下安装nltk,以及gensim时pip3安装不成功的解决办法,我刚开始因为不太会用linux命令,所以一直依赖于python 的pip命令,可是怎么都安装不成功,所以就从官网上下载好解压包,然后手动安装(下面以nltk为例,gensim类似) 第一步 阅读全文
posted @ 2018-03-29 22:13 每天坚持一点点 阅读(1408) 评论(0) 推荐(0) 编辑
摘要: 使用pip3安装tensorflow以及gensim等时,出现如下错误: 然后我试了很多种方法,而且还根据许多其他答案pip3 install --upgrade pip setuptools等等都不行,最终还是在外文的一个讨论区找到一个,修改了一下,觉得还可以: 具体来说就是编辑文件#2121~2 阅读全文
posted @ 2018-03-29 17:17 每天坚持一点点 阅读(1106) 评论(1) 推荐(0) 编辑
摘要: (1)cd /代表到根目录下面;ls表示将盘中内容列出;cd /home表是打开根目录下的home文件夹;(注意:凡是根目录下的文件夹前面都要加 /) (2)快捷键方式:可以用tab自动补全 (1)创建新的文件命令:mkdir空格+文件夹名称(一般下载下新的东西时,不在当下文件夹操作,要移到自己新建 阅读全文
posted @ 2018-03-29 16:51 每天坚持一点点 阅读(327) 评论(0) 推荐(0) 编辑
摘要: 一、基本操作 1、读操作 (1)“r” 运行结果:(data1后没有数据,原因文件读写顺序从头到尾,读完一遍,指针停留在末尾) (2)“r+”因为光标定位在开始,如果先写他就会直接覆盖,如果先读后写就会追加到最后 2、写操作 (1)“w”错误示例:(只写不能读) (2)“w+”还是会先创建文件,重新 阅读全文
posted @ 2017-11-22 21:25 每天坚持一点点 阅读(264) 评论(0) 推荐(0) 编辑