随笔分类 - C#
摘要:读取选取的文件夾下的所有.txt文件private void button1_Click(object sender, EventArgs e){ if (folderBrowserDialog1.ShowDialog() == DialogResult.OK) { str...
阅读全文
摘要:最近在弄网页爬虫这方面的,上网看到关于htmlagilitypack搭配scrapysharp的文章,于是决定试一试~ 于是到https://www.nuget.org/packages/ScrapySharp去看看, 看到这句下载提示:To install ScrapySharp, run the
阅读全文
摘要:中文分词插件很多,当然都有各自的优缺点,近日刚接触自然语言处理这方面的,初步体验中文分词。 首先感谢harry.guo楼主提供的学习资源,博文链接http://www.cnblogs.com/harryguo/archive/2007/09/26/906965.html,在此基础上进行深入学习和探讨
阅读全文
摘要:菜鸟HtmlAgilityPack初体验。。。弱弱的代码。。。 Html Agility Pack是一个开源项目,为网页提供了标准的DOM API和XPath导航。使用WebBrowser和HttpWebRequest下载的网页可以用Html Agility Pack来解析。 HtmlAgility
阅读全文
摘要:由于最近在做毕业设计,需要用到一些简单的浏览器功能,于是学习了一下,顺便写篇博客~~大牛请勿喷,菜鸟练练手~ 实现界面如下:(简单朴素版@_@||) button_go实现如下: button_back实现如下: 点击一个新的链接时,会弹出新的窗口,默认是ie浏览器打开,应该使它还在此界面显示,而不
阅读全文
摘要:这是我的第一个爬虫代码。。。算是一份测试版的代码。大牛大神别喷。。。 通过给定一个初始的地址startPiont然后对网页进行捕捉,然后通过正则表达式对网址进行匹配。 List<string> todo :进行抓取的网址的集合 List<string> visited :已经访问过的网址的集合 下面
阅读全文
摘要:下面介绍两个函数:File.AppendAllText(String, String)File.AppendAllText (String, String, String)File.AppendAllText 方法 (String, String)函数说明:打开一个文件,向其中追加指定的字符串,然后关闭该文件。 如果文件不存在,此方法创建一个文件,将指定的字符串写入文件,然后关闭该文件。命名空间: System.IO程序集: mscorlib(在 mscorlib.dll 中)语法:public static void AppendAllText( string path, str...
阅读全文
摘要:使用FormsAuthentication.HashPasswordForStoringInConfigFile("需要加密的字符串", "MD5")这个方法进行加密时,编译器显示“FormsAuthentication上下文不存在”。下面是部分代码,for(Int32 i = 100; i <= 1750; i++){ String ii = i.ToString(); string strmd5 = FormsAuthentication.HashPasswordForStoringInConfigFile(ii, "md5"
阅读全文
摘要:我的第一个c#练习程序,果然又出现问题了。。。在Form1_Load() not work。估计我的人品又出现问题了。下面实现的功能很简单,就是声明一个label1然后,把它初始化赋值为hello,然后点击它的时候,它显示改为world。代码如下:using System;using System.Collections.Generic;using System.ComponentModel;using System.Data;using System.Drawing;using System.Linq;using System.Text;using System.Windows.Forms;
阅读全文
摘要:在HTML网页中经常使用相对URL。绝对URL是不依赖其他URL路径。在一定的上下文环境可以使用相对URL。网页中的相对URL的形式如:“./index.html”。可以在<A>和<img>标签中使用相对URL。如:<img src = "../images/a.gif" />。 那么如何把相对UR
阅读全文
摘要:实现从Web网页提取文本之前,首先要识别网页的编码,有时候还需要进一步识别网页所使用的语言。因为同一种编码可能对应多种语言,例如UTF-8编码可能对应英文或中文等语言。 识别编码整体流程如下: (1)从WEB服务器返回的content type头信息中提取编码,如果是GB2312的编码要当GBK处理
阅读全文
摘要:由于要做一个系统,需要用到搜索引擎开发的很多知识点。对于开发语言的选择,我一般不是擅长什么才选择什么的,而是通过对比之后,考虑开发时间和难易程度来选择。尽管现在的开发经验还不足,也只能凭借自己弱弱的判断能力来选择。所以选择了C#。 基本语法 (C#与java的比较) (1)语法上,C#和java非常类似,主要的差别不是语言本身,而是所执行的平台。java程序运行需要运行环境JRE,而C#运行环境CLR(Common Language Runtime)。 (2)java源码可以被编译成字节代码的一种中间状态,然后由已提供的虚拟机来执行这些字节代码。而C#代码也被编译成一种中间状态,称为中...
阅读全文