在论文的爬取中
对于整个的网页内容的一个爬取
这个网页是一个内容比较多的一个网页
所以我选择了selenium中的webdriver库
来进行网页的解析然后进行爬取
def gethtml(url): brower = webdriver.Firefox() brower.get(url) html = brower.page_source return html