下载网页内容,并编译生成CHM文件

  看了园子里的一系列关于生成CHM的文件的方式,主要是这些:

C#生成CHM文件(入门篇)
C#生成CHM文件(中级篇)
C#生成CHM文件(应用篇)

http://www.cnblogs.com/alexis/archive/2010/10/16/1853275.html

 

  自己就想写一个从网上下载页面,然后将页面编译成CHM的小程序。现在把源代码提供出来:

源代码下载

 

  主要的难点是网页编码的判断,目前是先对Request的HEAD里面的Content-Type中进行判断,如果这里没有获取到,在根据默认的编码解析网页内容,获取网页内部的Content-Type标签数据。如果这两种都无法获取到,这个网页就有可能会出现乱码,如果哪位有更好的解决方案,还望不吝赐教!

 

  HTML的解析,我用的是开源的Winista.Htmlparser.Net,感觉挺方便,园子里也有相应的教程,我就不多说了。

本文作者:拓荒者IT

本文链接:https://www.cnblogs.com/youring2/archive/2012/04/24/2467747.html

版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

 

📌做了个微信公众号【拓荒者IT】,分享各种技术干货,新内容首发到公众号,欢迎关注❤️

posted @   拓荒者IT  阅读(2079)  评论(0编辑  收藏  举报
皮肤配置 参考地址:https://www.yuque.com/awescnb/user
点击右上角即可分享
微信分享提示
💬
评论
📌
收藏
💗
关注
👍
推荐
🚀
回顶
收起