摘要: 这次作业主要是对天气的爬取 主要使用到了csv、sys、urllib.request、matplotlib和BeautifulSoup4模块,其中csv模块是为了对csv文件的处理,urllib.request可以构造http请求,BeautifulSoup4可以解析页面信息。在使用这些模块之前,如 阅读全文
posted @ 2020-05-10 11:01 贾昕潼 阅读(329) 评论(0) 推荐(0) 编辑
摘要: 作为一个三国迷,我有了这样的想法:能不能用文本处理的方法,得到《三国演义》中的人物社交网络,再进行分析呢? 首先还是获得三国演义的txt文本。 先用jieba库把人物出场计算出来 用numpy库和matplotlib库做一个出场人物柱形图 接着我们导出数据文件,将数据导入到 三国人物出场次数.txt 阅读全文
posted @ 2020-05-09 16:47 贾昕潼 阅读(1528) 评论(0) 推荐(0) 编辑
摘要: 1、网页URL: http://www.shicimingju.com/book/sanguoyanyi.html 接着安装requests库和BeautifulSoup4这两个库 通过调用BeautifulSoup对象中相关的属性或者方法进行标签定位和数据提取。 快捷键[Ctrl+Shift+C] 阅读全文
posted @ 2020-04-14 16:35 贾昕潼 阅读(1006) 评论(1) 推荐(1) 编辑
摘要: 【领域文章来源】: 通过百度查找的《三国演义》,下载,在本地自己创建txt文件。注:用encoding=utf-8 【源代码】: import jieba excludes = {"来到","人马","领兵","将军","却说","荆州","二人","不可","不能","如此"} txt = ope 阅读全文
posted @ 2020-04-10 16:31 贾昕潼 阅读(3254) 评论(0) 推荐(0) 编辑