Playwright爬虫(.net)介绍:2 安装及第一个应用程序
Playwright的安装比较简单,只需要使用命令行输入几行命令就可以完成。由于本系统主要通过Microsoft Visual Studio Community 2022及C#进行记录,因此在安装Playwright前需要自行完成相关开发环境的搭建。
1.运行PowerShell,并定位到某个目录中。
2.输入如下命令,新建一个mstest项目:
dotnet new mstest -n PlaywrightTests
PlaywrightTests可以更换为任意名称,执行后等待项目创建。
3.进入新建的项目目录
cd PlaywrightTests
4.安装必要的 Playwright 依赖项。
dotnet add package Microsoft.Playwright.MSTest
5.构建项目
dotnet build
6.安装所需的浏览器
playwright install
或者
pwsh bin/Debug/net8.0/playwright.ps1 install
此示例使用net8.0,如果使用其他版本,请根据文件夹名称将net8.0修改。
如果提示pwsh命令不可用,需要下载最新版本的Powershell,可以参考如下地址:
https://learn.microsoft.com/zh-tw/powershell/scripting/install/installing-powershell-on-windows?view=powershell-7.4
如上操作后,即可完成Playwright的安装,不需要再单独安装其他浏览器,也不需要下载驱动程序。
做好准备后,就可以开始第一个Playwright爬虫程序的编写了。
在Visual Studio中创建一个控制台程序,并在NuGet包管理器中搜索安装Microsoft.Playwright,将Program.cs修改为如下内容:
using Microsoft.Playwright;
var playwright = await Playwright.CreateAsync();
var browser = await playwright.Chromium.LaunchAsync(new BrowserTypeLaunchOptions() { Headless = false });
var page = await browser.NewPageAsync();
await page.GotoAsync("https://www.baidu.com");
Console.ReadLine();
运行程序后,就可以打开浏览器并导航至百度首页。
具体的语句将在后续内容中进行解释。