摘要: 本实验采用python3.6环境 1. 实验目的 掌握爬虫工作的基本原理,并完成一定的任务。 2. 相关知识 2.1 python基础知识学习 python3 字符串基本操作 |python3 file操作 |python3 os操作 2.2 python爬虫知识学习 BeautifulSoup | 阅读全文
posted @ 2019-04-18 16:50 森林1997 阅读(3304) 评论(0) 推荐(0) 编辑
摘要: 上一篇我们搭建了pyltp的基本环境,现在我们用简单的示例来测试它的使用,因为还是新手,肯定会有很多不全面的地方,后面我慢慢补充。 我们采用PyCharm作为编辑器,进行示例。 0. 检查pyltp 首先先检查下python27/Lib/site-packages/目录下是否存在pyltp的相关文件 阅读全文
posted @ 2019-04-18 16:47 森林1997 阅读(2001) 评论(0) 推荐(0) 编辑
摘要: 1.简介 1.1 LTP 语言技术平台 (Language Technology Platform)中文语言处理系统 ,哈工大社会计算与信息检索研究中心独立研发,(官网)。2011年,LTP正式开源。 LTP提供了一系列中文自然语言处理工具,用户可以使用这些工具对于中文文本进行分词、词性标注、句法分 阅读全文
posted @ 2019-04-18 16:44 森林1997 阅读(647) 评论(0) 推荐(0) 编辑