贾昕潼 - 博客园

2020年5月

摘要：这次作业主要是对天气的爬取主要使用到了csv、sys、urllib.request、matplotlib和BeautifulSoup4模块，其中csv模块是为了对csv文件的处理，urllib.request可以构造http请求，BeautifulSoup4可以解析页面信息。在使用这些模块之前，如阅读全文

posted @ 2020-05-10 11:01 贾昕潼阅读(359) 评论(0) 推荐(0)

用python分析《三国演义》中人物数据

摘要：作为一个三国迷，我有了这样的想法：能不能用文本处理的方法，得到《三国演义》中的人物社交网络，再进行分析呢？首先还是获得三国演义的txt文本。先用jieba库把人物出场计算出来用numpy库和matplotlib库做一个出场人物柱形图接着我们导出数据文件，将数据导入到三国人物出场次数.txt 阅读全文

posted @ 2020-05-09 16:47 贾昕潼阅读(1651) 评论(0) 推荐(0)

2020年4月

《三国演义》python爬虫并分析数据

摘要： 1、网页URL: http://www.shicimingju.com/book/sanguoyanyi.html 接着安装requests库和BeautifulSoup4这两个库通过调用BeautifulSoup对象中相关的属性或者方法进行标签定位和数据提取。快捷键[Ctrl+Shift+C] 阅读全文

posted @ 2020-04-14 16:35 贾昕潼阅读(1190) 评论(1) 推荐(1)

《三国演义》人物出场次数词云统计

摘要：【领域文章来源】：通过百度查找的《三国演义》，下载，在本地自己创建txt文件。注：用encoding=utf-8 【源代码】： import jieba excludes = {"来到","人马","领兵","将军","却说","荆州","二人","不可","不能","如此"} txt = ope 阅读全文

posted @ 2020-04-10 16:31 贾昕潼阅读(3451) 评论(0) 推荐(0)

公告