01 2022 档案

爬取酷狗榜单并可视化词云 - Python

摘要：爬取酷狗音乐榜单并做一个词云展示。分为两部分，爬虫部分和可视化部分；爬虫的话我用的是openpyxl进行保存的，因为这块一直是薄弱的地方，加强一下面向对象保存数据到excel里。 1 import openpyxl 2 import requests 3 import parsel 4 5 6 de 阅读全文

posted @ 2022-01-12 11:26 、一叶孤城阅读(716) 评论(0) 推荐(0) 编辑

文本数据分词，词频统计，可视化 - Python

摘要：词频、分词和可视化结合爬虫，做一些作业。爬虫库requests 词频统计库collections 数据处理库numpy 结巴分词库jieba 可视化库pyecharts等等。数据的话直接从网上抠一些东西，这里抠一篇新闻。要导入的库，一次性导入： 1 import collections 2 im 阅读全文

posted @ 2022-01-10 15:53 、一叶孤城阅读(1422) 评论(0) 推荐(0) 编辑

几个简单的例子 - 巩固Xpath语法 - Python

摘要：Xpath在w3cschool有教程，传送门。Xpath是使用路径表达式来选去xml或者html的节点。常用的路径表达式如下：下面列出了最有用的路径表达式：表达式描述 nodename 选取此节点的所有子节点。 / 从根节点选取。 // 从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置。阅读全文

posted @ 2022-01-07 16:33 、一叶孤城阅读(151) 评论(0) 推荐(0) 编辑

雪中悍刀行热播，来做一篇关于python的作业 - 爬虫与数据分析

摘要：雪中悍刀行在腾讯热播，做篇关于python的作业。--Python爬虫与数据分析。分为三个部分：第一：爬虫部分；爬虫爬评论内容和评论时间；第二：数据处理部分；将爬下来的数据进行整理清洗以便可视化；第三：可视化分析；对清洗好的数据进行可视化分析，对爬取的内容做一个整体的分析；项目结构分为三个阅读全文

posted @ 2022-01-07 11:34 、一叶孤城阅读(147) 评论(0) 推荐(0) 编辑

公告

昵称：、一叶孤城
园龄： 4年9个月
粉丝： 9
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

、一叶孤城

01 2022 档案

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论