百度文库内容复制 C# webbrowser+Nsoup

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Windows.Forms;
using System.Net;

namespace NSoupDemo
{
    public partial class Form1 : Form
    {
        public Form1()
        {
            InitializeComponent();
        }

        private void button1_Click(object sender, EventArgs e)
        {
           
            NSoup.Nodes.Document NSoupDoc = NSoup.NSoupClient.Parse(webBrowser1.Document.Body.InnerHtml);

            var strpagecount = NSoupDoc.Body.Select(".page-count").Text;
            if (strpagecount.Contains("/"))
            {
                strpagecount = strpagecount.Replace("/", "");
            }
            int pagecount = 0;
            if (!int.TryParse(strpagecount, out  pagecount))
            {
                MessageBox.Show("页数处理失败");
                return;
            }
            StringBuilder content = new StringBuilder();
            for (int i = 0; i < pagecount; i++)
            {
                content.Append(NSoupDoc.Body.Select("#pageNo-"+(i+1)).Text);
            }

            Form2 frm = new Form2();
            frm.richTextBox1.Text= content.ToString();
            frm.Show();

        }

        private void button2_Click(object sender, EventArgs e)
        {
            webBrowser1.Url = new Uri(textBox1.Text);
        }
    }
}

附件下载

文中内容可查看Linux安装Oracle12C

 

posted @   天天代码码天天  阅读(5)  评论(0编辑  收藏  举报  
编辑推荐:
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
点击右上角即可分享
微信分享提示