2018 年 6月 17 日随笔档案 - 王琳杰

2018年6月17日

摘要：获取页面信息，用XPath 做数据提取获取每个blog里的用标题、正文、阅读次数信息保存到 json 文件内待完。。。 python3中：阅读全文

posted @ 2018-06-17 23:22 王琳杰阅读(161) 评论(0) 推荐(0) 编辑

摘要： ORC库概述在读取和处理图像、图像相关的机器学习以及创建图像等任务中，Python 一直都是非常出色的语言。虽然有很多库可以进行图像处理，在这里只重点介绍：Tesseract Tesseract Tesseract 是一个 OCR 库,目前由 Google 赞助(Google 也是一家以 OCR 阅读全文

posted @ 2018-06-17 22:21 王琳杰阅读(235) 评论(0) 推荐(0) 编辑

糗事百科实例

摘要：爬取糗事百科段子，页面的URL是 http://www.qiushibaike.com/8hr/page/ 使用requests获取页面信息，用XPath 做数据提取获取每个帖子里的用户头像链接、用户姓名、段子内容、点赞次数和评论次数保存到 json 文件内在python3中爬取糗事百科段子：阅读全文

posted @ 2018-06-17 18:44 王琳杰阅读(167) 评论(0) 推荐(0) 编辑

一蓑烟雨

公告