摘要: 在C#中,一般常用的请求方式,就是利用HttpWebRequest创建请求,返回报文。但是有时候遇到到动态加载的页面,却只能抓取部分内容,无法抓取到动态加载的内容。 如果遇到这种的话,推荐使用phantomJS无头浏览器。 开发之前,先准备两样东西。 1. phantomJS-2.1.1 官方下载地 阅读全文
posted @ 2018-07-19 18:18 lbx.tom 阅读(3347) 评论(1) 推荐(1) 编辑
摘要: 最近了解了下有关正则表达式回溯的内容,想想就写下来,方便自己。 正则表达式匹配算法是建立在正则表达式引擎的基础上的,目前有两种引擎:DFA(确定型有穷自动机)和NFA(不确定型有穷自动机)。这两种引擎的区别主要在于被匹配对象不同。 DFA是用文本去匹配表达式。而NFA是用表达式去匹配文本。这个了解一 阅读全文
posted @ 2018-07-19 10:33 lbx.tom 阅读(903) 评论(0) 推荐(0) 编辑