安装spynner
sudo apt-get install xorg-dev, libxtst-dev
sudo pip install spynner
这个类库可解析js加载出来的数据!
测试:
#!/usr/bin/env python import spynner import pyquery browser = spynner.Browser(debug_level=spynner.DEBUG) browser.create_webview() #browser.show() browser.set_html_parser(pyquery.PyQuery) browser.load("http://detail.tmall.com/item.htm?spm=a230r.1.10.2.cpNxpf&id=19955188752&ad_id=&am_id=&cm_id=&pm_id=") browser.wait(2) print "url:", browser.url # Soup is a PyQuery object browser.soup.make_links_absolute(base_url=browser.url) print "html:", browser.soup("#J_PromoBox").html()#这个id的数据就是js加载出来的 # Demonstrate how to download a resource using PyQuery soup #imagedata = browser.download(browser.soup("img:first").attr('src')) #print "image length:", len(imagedata)) browser.close()
python,go,redis,mongodb,.net,C#,F#,服务器架构
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
· C++代码改造为UTF-8编码问题的总结
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· 实操Deepseek接入个人知识库
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· 【.NET】调用本地 Deepseek 模型
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库