2017 年 1月 17 日随笔档案 - lemonbit

2017年1月17日

python3实践-从网站获取数据(Carbon Market Data-GD) （bs4/Beautifulsoup）

摘要：结合个人需求，从某个网站获取一些数据，发现网页链接是隐藏的，需要通过浏览器看后面的代码来获取真实的链接。下面这个案例，直接是从真实的链接中爬去数据。此外，发现用pandas的read_html不能直接解析“lxml”的表格，有待后续研究。另外，爬去的数据发现有很多空格符号，主要是 "\r"、" 阅读全文

posted @ 2017-01-17 00:13 lemonbit 阅读(1323) 评论(4) 推荐(0) 编辑

lemonbit

个人官网： http://liyangbit.com

个人微信公众号: “Python数据之道”

公告

lemonbit

个人官网： http://liyangbit.com 个人微信公众号: “Python数据之道”

公告

个人官网： http://liyangbit.com

个人微信公众号: “Python数据之道”