摘要:
在Web数据采集中为了避免被服务器封锁而通过代理下载的情况很常见。但是,并非所有的代理都适合于Web数据采集。下面是鲲鹏数据的技术人员给出的说明。根据HTTP代理的匿名性可以将其分为以下几种:1. 透明代理(Transparent Proxies)目标服务器能够检测到真实的源IP。目标服务器根据HT... 阅读全文
摘要:
一般情况下,当ReadyState属性变成READYSTATE_COMPLETE时,Webbrowser控件会通过触发DocumentCompleted事件来指示网页加载完毕。但当加载的网页包含frame时,可能会多次触发该事件,所以不能简单地通过它来判断网页加载完毕。从微软的官方网站上了解到,并非... 阅读全文
摘要:
由于缓存文件是特殊的文件,以及WebBrowser与IE版本有关因此删除缓存绝对不可能用一些IO函数就总可以解决的因此我的这些函数在IO操作的基础上,又针对环境进行相应的清理。 static class WebCleaner { /* * 7 个静态函数 ... 阅读全文
摘要:
网站可能会包含一些模块:像文章、产品、图片、留言等。栏目模块主要实现功能,启用或禁用模块,模块权限设置,模块上传设置等。权限设置和上传设置以后专门考虑,先来显示或禁用模块。1、在顶部导航栏添加管理连接打开Home/Header.cshtml,在添加代码2、添加Module接口using Ninesk... 阅读全文
摘要:
I:基础绑定的实现1.在前面的两篇基础文章(路由及控制器&视图)当中,还没对QueryString的绑定进行介绍,因为我觉得它更适合放在这一章节中去介绍.我们在用WebForm去开发的时候,有时候会利用到QueryString去做一些功能如:http://localhost/First/QueryS... 阅读全文
摘要:
http://www.jquery001.com/asp.net-mvc3-instance-add-update-delete2.html上篇我们在 ASP.NET MVC3 中实现了添加操作,由于时间关系没有完成修改、删除操作,我们新建了一个名为"Contact"的 Controller,并实现... 阅读全文
摘要:
在完成产品列表页前要做一些准备功夫。首先是去下载MvcPager用了为产品列表分页。下载的可能是基于MVC 2的,没关系,可以用在MVC 3上。如果有担心,下载源代码重新编译一次好了。下载后将DLL添加到引用里。 接着是要修改一下路由以实现“Catalog/List/[id]/[page]”的访问... 阅读全文
摘要:
在MVC中实现基本的增删改和传统的asp .net 程序有很大的不同,刚开始使用MVC还是有些不太适应,但是它的页面简洁也相当的不同,同时对服务器的访问性能上也有很大的提高。基于此,下面对我学习过程记录如下:首先,使用VS创建一个以Internet为模板的项目,如下所示:在“_Layout.csht... 阅读全文
摘要:
微软在1997年正式推出Browser Helper Object (BHO), 使程序员能够更好的对IE进行二次开发和操作. 在通过编写BHO程序数月后, 我希望把我的一些经验告诉才开始的同志, 避免走一些弯路.我本人是非常喜欢C++的. 因为C++对内存直接操作的方式可以节省非常多的内存损耗, ... 阅读全文
摘要:
usingSystem.Text.RegularExpressions;//利用正则表达式去掉""之间的内容。privatestringStripHT(stringstrHtml){Regexregex=newRegex("",RegexOptions.IgnoreCase);stringstrOu... 阅读全文
摘要:
精确查询: CREATE PROCEDURE FindCosInfo( @CosID varchar (10), //课程编号 @CosName varchar (20), //课程名称 @CosCredit int //课程学分)ASdeclare @sql varchar (1000)begi... 阅读全文
摘要:
之所以要引入XPath的概念,目的就是为了在匹配XML文档结构树时能够准确地找到某一个节点元素。可以把XPath比作文件管理路径:通过文件管理路 径,可以按照一定的规则查找到所需要的文件;同样,依据XPath所制定的规则,也可以很方便地找到XML结构文档树中的任何一个节点. 不过,由于XPath可... 阅读全文
摘要:
很多朋友都想如何提高自己的网站流量,可是都没有什么好的办法经过很长时间的研究,在C#中实现了,当然了,这部分代码其中一部分是网上的,不是原创。using System;using System.Drawing;using System.Collections;using System.Compone... 阅读全文
摘要:
WebBrowser控件是基于IE浏览器的,所以它的内核功能是依赖于IE的,相信做.NET的人都知道。今天的主题,和上一篇文章应该是差不多的,都是通过代理来实现功能的。请看下面的代码://1.定义代理信息的结构体publicstructStruct_INTERNET_PROXY_INFO{publi... 阅读全文
摘要:
微软webbrowser控件也就是IE插件,他的所有功能就像IE类似,当然设置也是一样的,下面介绍下webbrowser如何设置代理,可不要用这个对抗广告联盟哦You can change the proxy with InternetSetOption method from the winine... 阅读全文
摘要:
中文分词插件很多,当然都有各自的优缺点,近日刚接触自然语言处理这方面的,初步体验中文分词。首先感谢harry.guo楼主提供的学习资源,博文链接http://www.cnblogs.com/harryguo/archive/2007/09/26/906965.html,在此基础上进行深入学习和探讨。... 阅读全文
摘要:
SASS是一种 CSS 的开发工具,提供了许多便利的写法,大大节省了设计者的时间,使得 CSS 的开发,变得简单和可维护。 SASS 提供四个编译风格的选项:* nested:嵌套缩进的 css 代码,它是默认值。* expanded:没有缩进的、扩展的 css 代码。* compact:简洁格式... 阅读全文
摘要:
最近在弄网页爬虫这方面的,上网看到关于htmlagilitypack搭配scrapysharp的文章,于是决定试一试~于是到https://www.nuget.org/packages/ScrapySharp去看看,看到这句下载提示:To install ScrapySharp, run the f... 阅读全文
摘要:
这是我的第一个爬虫代码。。。算是一份测试版的代码。大牛大神别喷。。。通过给定一个初始的地址startPiont然后对网页进行捕捉,然后通过正则表达式对网址进行匹配。List todo:进行抓取的网址的集合List visited :已经访问过的网址的集合下面实现的是,给定一个初始地址,然后进行爬虫,... 阅读全文
摘要:
读取选取的文件夾下的所有.txt文件private void button1_Click(object sender, EventArgs e){ if (folderBrowserDialog1.ShowDialog() == DialogResult.OK) { str... 阅读全文