C# 爬虫框架实现 概述
目录:
开发目的:写这个程序主要是为了找工作。因为没项目在简历上吃大亏,空口无凭,只能做出点东西证明自己能做事情。其次是为了练习使用MVC做的博客网站提供素材。
需自定义:
- patternlist匹配项定义
- 定义结果输出方式:本地sqlserver 的spider数据库,或者终端
- 种子库
需要:
- 开发使用了开源类:CSQuery解析HTML,所以patternlist匹配项的书写规范要符合CSQuery,其实基本和CSS选择器差不多
- 使用visual studio 2015 update2