摘要:
大概2年之前,就可以接触pyecharts,无奈工作中接触不多,很多功能已经忘记,现在重拾,以求实用 小白学Python(8)——pyecharts 入门 - 徐海建 - 博客园 (cnblogs.com) 简介 Apache ECharts是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图 阅读全文
摘要:
Jupyter Notebook 是一个 Web 应用程序,用于创建和共享包含代码、可视化效果和文本的文档。它可用于数据科学,统计建模,机器学习等等。 Jupyter项目|安装 Jupyter 软件 CMD命令下: pip3 install jupyter 等一会就安装好了 指定文件位置:(dos命 阅读全文
摘要:
逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。 纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。 CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条 阅读全文
摘要:
有时会看到非常好的公众号文章想保存下来供以后参阅,避免文章被删的情况,笔者介绍几种方法以供参考。 手动保存 找到公众号链接,如下篇:https://mp.weixin.qq.com/s/8fhYaOnAwqCOZwip__3zcg 在浏览器打开 然后 ctrl+p 点击保存即可。 存在问题,有的图片 阅读全文
摘要:
颜色名称及色样表(HTML版) 颜色名 中文名称 Hex RGB 十进制 Decimal LightPink 浅粉红 #FFB6C1 255,182,193 Pink 粉红 #FFC0CB 255,192,203 Crimson 深红(猩红) #DC143C 220,20,60 LavenderBl 阅读全文
摘要:
提取新闻联播相关文字并输出 网址:新闻联播 (cctv.com) import requests import re url = 'https://tv.cctv.com/lm/xwlb/' ua = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win 阅读全文
摘要:
由于腾讯视频评论处进行触碰处理,点击后,网址是不变的,所以需要先进行分析。 网址:HBO纪录片:成为沃伦·巴菲特【正片】_成为沃伦·巴菲特_腾讯视频 (qq.com) 点击更多评论,查看F12,可以发现其网址。 打开后,我们发现其通过 'first'和'last’进行评论的翻页。我们需要对网址二次赋 阅读全文
摘要:
网址:豆瓣电影 (douban.com) 和豆瓣读书类似,需要对爬虫的headers进行处理。 import requests import re for i in range(0,2): j = i*20 url = 'https://movie.douban.com/j/search_subje 阅读全文
摘要:
豆瓣网站禁止了爬虫爬取,需要对其进行简单的反爬虫处理后才可进行提取。 https://book.douban.com/robots.txt 网址:豆瓣读书 (douban.com) F12,找到 User-agent ,在爬虫程序中进行添加。 import requests import re fo 阅读全文
摘要:
网址:畅销榜_正版电子书在线阅读_百度阅读 (baidu.com) 根据页数,提取网址,查看其变化,进行爬取。 import requests import re for i in range(0,10): j = i*20 url = 'https://yuedu.baidu.com/rank/h 阅读全文