04 2013 档案

摘要:匹配html的<a>标签:<a[^>]+>.*?</a>匹配html的<img>标签中的src属性:(?<=<img[^>]+src=")\S+?(?=") 阅读全文
posted @ 2013-04-25 14:11 门对夕阳 阅读(91) 评论(0) 推荐(0)
摘要:在这里,有必要把Attribute和Property这两个词仔细地辨别一下。这两个词的混淆由来已久。混淆的主要原因就是大多数中文译本里既把Attribute译为“属性”,也把Property译为“属性”。其实,这两个词所表达的不是一个层面上的东西。Property 属于面向对象理论范畴。在使用面向对象思想编程的时候,我们常常需要对客观事物进行抽象,再把抽象出来的结果封装成类,类中用来表示事物状态的成员就是 Property。比如我要写一个模拟赛车的游戏,那么必不可少的就是对现实汽车的抽象。现实中的汽车身上会带有很多数据,但在游戏中我可能只关心它的长 度、宽度、高度、重量、速度等有限的几个数据, 阅读全文
posted @ 2013-04-20 21:02 门对夕阳 阅读(289) 评论(0) 推荐(0)
摘要:Fudannlp:开源中文自然语言处理工具包|中文分词|词性标注|依存句法分析|指代消解。支持JAVA调用,和WebServices调用。ictclas:中科院研发的一个分词系统,支持的编程语言较丰富。 阅读全文
posted @ 2013-04-19 23:10 门对夕阳 阅读(233) 评论(0) 推荐(0)
摘要:HtmlNode对象有一个Remove()方法,如果要将此节点从父节点从删除,务必使用如下的写法:node.ParentNode.RemoveChild(node);而不要使用node.Remove(),后者有时候会把自身从一个Collection中移除掉,而不是从父节点中移除。 阅读全文
posted @ 2013-04-17 11:02 门对夕阳 阅读(251) 评论(0) 推荐(0)
摘要:工作以后就会发现,项目中有时候用到哈希表,有时候用到字典表,这两个都是索引、值得表现形式,那么它们的区别在哪里?以下是笔者总结的区别:1,单线程里面用字典,多线程里面用哈希表。2,字典的排序就是按照插入的顺序来的,而哈希表未必是。3,哈希表允许单线程写入,多线程读取。4,哈希表最大的优势在于其索引方式,它是经过散列处理过的,在数据量大的时候尤其如此。(转) 阅读全文
posted @ 2013-04-14 14:05 门对夕阳 阅读(2834) 评论(0) 推荐(0)
摘要:参考:http://www.cnblogs.com/yukaizhao/archive/2011/07/25/xpath.html关于XPath Axes,child和descendant的区别在于child只包含下一级的子节点,而descendant包含所有的子节点,下一级,再下一级,再下一级,如果有的话。同理,parent和ancestor也是这种关系。 阅读全文
posted @ 2013-04-02 11:32 门对夕阳 阅读(153) 评论(0) 推荐(0)