摘要: 经过之前的慕课内容和b站上的一些知识内容的学习,决定制作一个2019中国最好医科大学的数据分析。 之前试着爬过其他的网站...一些爬出来的排版真的是逼疯我了= = 还有另一些网站自己就是图表形式的数据展示... 找网站着实费了那么一丢丢时间... 于是我就换了最好大学网。 (这多好看!) 首先通过以 阅读全文
posted @ 2020-05-10 12:56 王书玉 阅读(238) 评论(0) 推荐(1) 编辑
摘要: 通过学习requests和bs4两个爬虫相关第三方库的使用,尝试爬取本周网易云音乐的飙升榜单的歌曲名以及相关网页链接。 网址为:https://music.163.com/#/discover/toplist 通过查看网页源代码找到相关信息和标签: 为了找到上面这张图片内容需要往下翻很久...... 阅读全文
posted @ 2020-04-27 11:15 王书玉 阅读(560) 评论(0) 推荐(0) 编辑
摘要: 【领域文章来源】: 通过百度查找余光中的《寻李白》,复制粘贴内容,在本地自己创建txt文件。 【程序编写基本思路】: 通过jieba库和wordcloud库制作词云图片。调用目标txt内容,通过jieba的分词功能来产生词组;再用wordcloud库展示词云。 【源代码】: import jieba 阅读全文
posted @ 2020-04-04 15:15 王书玉 阅读(306) 评论(1) 推荐(1) 编辑