摘要: 安装pip install Scrapy 中间可能会遇到的问题: 超时,网络问题需要多次尝试 缺少vc++库,官网可以下载 缺少vc++库,官网可以下载 win32api缺失,https://sourceforge.net/projects/pywin32/?source=typ_redirect选 阅读全文
posted @ 2017-02-21 15:57 kuqs(奇小东) 阅读(791) 评论(0) 推荐(0) 编辑
摘要: 抓取使用Ajax技术完成的网页内容时可以使用Selenium+PhantomJS技术 1.pip install selenium 2.下载Phantomjs不需要用pip 武汉科技大学首页有一块使用js异步加载的网页内容,如图 抓取这一块内容的思路是:判断这一块是否加载完毕;selenium抓取 阅读全文
posted @ 2017-02-13 20:36 kuqs(奇小东) 阅读(4353) 评论(0) 推荐(0) 编辑
摘要: 自然语言处理有一种ROUGE的评测方法,使用这种评测方法时有时需要将带评测文本每个汉字之间用空格分开。 原版说明如下: The recommended ROUGE metrics are Recall and F scores ofCharacter-based ROUGE-1, ROUGE-2 a 阅读全文
posted @ 2016-12-15 15:23 kuqs(奇小东) 阅读(9340) 评论(0) 推荐(0) 编辑
摘要: 一: 正则在Perl、Py森、Ruby、Java等语言中文本的正则表达式几乎是一样的 以前常用到的在网上都有现成的例子拿来用,比如电话格式、邮箱格式之类的。 但是自然语言处理中往往会根据自己的需求来制定一个表达式,如果正则的知识掌握的比较片面,在编写自然语言处理程序时可能会觉得苦恼。 在《自然语言处 阅读全文
posted @ 2016-08-01 22:05 kuqs(奇小东) 阅读(44891) 评论(2) 推荐(3) 编辑
摘要: 主函数main()这个静态方法无法引用非静态方法 aa(int)的。函数调用时,参数传递的方式主要有两种: 值传递和引用传递。Java使用的是值传递。值传递是把变量的值、常数或常量传递给参数。而引用传递,是把变量的所在内存中的地址传递给参数,参数通过地址找到变量的值。无论是在C、c++还是java中 阅读全文
posted @ 2016-05-09 10:20 kuqs(奇小东) 阅读(5553) 评论(0) 推荐(0) 编辑
摘要: 下载链接 戳这里 下载后的文件夹是这样的: 然后打开eclipse,新建项目,把源文件segDemo.java拷贝进去,把jar包全丢进去(右键项目, properties,Java Build Path,Add External Jars) 导入data数据包,并且修改源码中的路径,如图所示: 然 阅读全文
posted @ 2016-04-26 16:26 kuqs(奇小东) 阅读(2262) 评论(0) 推荐(0) 编辑
摘要: 假如要给一个叫做xiaobang的文件夹权限,CD到这一级目录 chmod -R 777 xiaobang 阅读全文
posted @ 2016-04-24 11:01 kuqs(奇小东) 阅读(554) 评论(0) 推荐(0) 编辑
摘要: Localhost的意思是本地服务器,而127.0.0.1是本机地址,他们的关系是通过操 作系统中的hosts文件,将Localhost解析为127.0.0.1。而实际工作中,Localhost是不经过网卡传输的,所以,它不受网络防火 墙和与网卡相关的种种限制;而127.0.0.1则要通过网卡传输数... 阅读全文
posted @ 2015-07-24 16:49 kuqs(奇小东) 阅读(373) 评论(0) 推荐(0) 编辑