04 2013 档案
摘要:匹配html的<a>标签:<a[^>]+>.*?</a>匹配html的<img>标签中的src属性:(?<=<img[^>]+src=")\S+?(?=")
阅读全文
摘要:在这里,有必要把Attribute和Property这两个词仔细地辨别一下。这两个词的混淆由来已久。混淆的主要原因就是大多数中文译本里既把Attribute译为“属性”,也把Property译为“属性”。其实,这两个词所表达的不是一个层面上的东西。Property 属于面向对象理论范畴。在使用面向对象思想编程的时候,我们常常需要对客观事物进行抽象,再把抽象出来的结果封装成类,类中用来表示事物状态的成员就是 Property。比如我要写一个模拟赛车的游戏,那么必不可少的就是对现实汽车的抽象。现实中的汽车身上会带有很多数据,但在游戏中我可能只关心它的长 度、宽度、高度、重量、速度等有限的几个数据,
阅读全文
摘要:Fudannlp:开源中文自然语言处理工具包|中文分词|词性标注|依存句法分析|指代消解。支持JAVA调用,和WebServices调用。ictclas:中科院研发的一个分词系统,支持的编程语言较丰富。
阅读全文
摘要:HtmlNode对象有一个Remove()方法,如果要将此节点从父节点从删除,务必使用如下的写法:node.ParentNode.RemoveChild(node);而不要使用node.Remove(),后者有时候会把自身从一个Collection中移除掉,而不是从父节点中移除。
阅读全文
摘要:工作以后就会发现,项目中有时候用到哈希表,有时候用到字典表,这两个都是索引、值得表现形式,那么它们的区别在哪里?以下是笔者总结的区别:1,单线程里面用字典,多线程里面用哈希表。2,字典的排序就是按照插入的顺序来的,而哈希表未必是。3,哈希表允许单线程写入,多线程读取。4,哈希表最大的优势在于其索引方式,它是经过散列处理过的,在数据量大的时候尤其如此。(转)
阅读全文
摘要:参考:http://www.cnblogs.com/yukaizhao/archive/2011/07/25/xpath.html关于XPath Axes,child和descendant的区别在于child只包含下一级的子节点,而descendant包含所有的子节点,下一级,再下一级,再下一级,如果有的话。同理,parent和ancestor也是这种关系。
阅读全文

浙公网安备 33010602011771号