pands 的 read_html方法

 1 import requests
 2 import pandas as pd
 3 
 4 url = 'https://www.accessdata.fda.gov/scripts/cdrh/cfdocs/cfpma/pmamemos.cfm'
 5 param = {
 6     "start_search": 1,
 7     "device": "",
 8     "sort": "ddd",
 9     "pagenum": 500
10 }
11 r = requests.get(url, params=param)
12 data = pd.read_html(r.text)[2]

pd.read_html(r.text): 可以获取页面中所有的表格的列表，在列表中选择你需要的那个

此外，该url直接访问时：

选择一页显示500条数据时：网址改变了，多了载荷，可以发现拼在网址后面的正是载荷，所以写爬虫代码时可以可以传入载荷

posted on 2023-04-25 15:22 明媚的夏午阅读(60) 评论(0) 编辑收藏举报

刷新页面返回顶部

导航

pands 的 read_html方法