PuppeteerSharp读取页面完整HTML(.NetCore)
1.使用NUGET安装PuppeteerSharp
通过工具或者命令方式安装
2.初始化浏览器
1 | await new BrowserFetcher().DownloadAsync(BrowserFetcher.DefaultRevision); |
3.具体代码
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 | using (Browser browser = await Puppeteer.LaunchAsync( new LaunchOptions { Headless = true })) { using ( var page = await browser.NewPageAsync()) { //设置浏览器的页面大小 await page.SetViewportAsync( new ViewPortOptions { Width = 1024, Height = 768 }); await page.GoToAsync( "http://www.baidu.com" ); var html = await page.GetContentAsync(); var sourceFile = "" ; var memoryStream = new MemoryStream(Encoding.Default.GetBytes(html)); var sr = new StreamReader(memoryStream); sourceFile = sr.ReadToEnd(); //针对源代码进行分析 sr.Close(); //将页面保存为图片 //await page.ScreenshotAsync(@"D:\1.png", // new ScreenshotOptions() { FullPage = true, Type = ScreenshotType.Png }); } } |
本文来自博客园,作者:一块白板,转载请注明原文链接:https://www.cnblogs.com/ykbb/p/11947035.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步