2018 年 3月 29 日随笔档案 - 199-陈楷涛

网络爬虫基础练习

摘要： 1.利用requests.get(url)获取网页页面的html文件结果截图 2.利用BeautifulSoup的HTML解析器，生成结构树 3.找出特定标签的html元素 4.取得含有特定CSS属性的元素取出h1标签的文本取出a标签的链接取出所有li标签的所有内容取出一条新闻的标题、链接阅读全文

posted @ 2018-03-29 18:58 199-陈楷涛阅读(104) 评论(0) 推荐(0) 编辑

2018年3月29日