上一页 1 ··· 18 19 20 21 22 23 24 25 26 ··· 41 下一页
  2010年11月2日
摘要: 作者:finallyliuyu 出处:博客园(博文转载请标明作者和出处)编者按:本系列文章给出的网络数据采集方法、思路、和框架并无工业化应用价值,但足以满足各高校实验室在实验阶段爬去语料库,获取网络资源的需求。 欢迎老鸟指点,但是此篇博文的定位是“写个菜鸟,新手的”所以禁止无厘头的疯狗式乱骂。 在上一篇文章:《巧用C# webbrowser实现动态网页爬虫机器人》中,给出了... 阅读全文
posted @ 2010-11-02 13:04 finallyly 阅读(11408) 评论(17) 推荐(6) 编辑
  2010年10月28日
摘要: 作者:finallyliuyu (转载请注明作者:finallyliuyu,出处:博客园)可以采用DOM+正则+浏览器组件来解决上面的问题。DOM (Document Object Model),是一个接口标准,该接口是将html网页解析成为树的格式,关于DOM的教程,请见:http://www.w3.org/DOM/ 虽然上面讲的是JavaScript的 DOM 接口函数,但是由于DOM是一个接... 阅读全文
posted @ 2010-10-28 18:20 finallyly 阅读(16647) 评论(38) 推荐(11) 编辑
  2010年10月20日
摘要: public delegate void EventHandler(object sender, EventArgs e); //定义函数的类public event EventHandler Click //申明函数类的特殊实例(加event,可以包括多个函数对象)button1.Click += new System.EventHandler(this.button1_Click); //实例... 阅读全文
posted @ 2010-10-20 09:13 finallyly 阅读(366) 评论(2) 推荐(0) 编辑
  2010年10月17日
摘要: http://en.wikipedia.org/wiki/Bijection,_injection_and_surjectionBijection, injection and surjectionFrom Wikipedia, the free encyclopediaJump to: navigation, search In mathematics, injections, surjecti... 阅读全文
posted @ 2010-10-17 21:17 finallyly 阅读(951) 评论(1) 推荐(0) 编辑
摘要: 浅谈程序员的数学修养作者: 刘伟发布时间: 2010-10-17 11:10阅读: 91 次 全屏阅读  [收藏]   可能有很多朋友在网上看过Google公司早几年的招聘广告,它的第一题如下了:{first 10-digit prime found in consecutive digits e}.com,e中出现的连续的第一个10个数字组成的质数。据说当时这个试题在美国很多地铁的出站口都有大幅... 阅读全文
posted @ 2010-10-17 14:51 finallyly 阅读(482) 评论(1) 推荐(1) 编辑
  2010年10月15日
摘要: nchoosek:计算组合数 画beta分布 pdf的函数:betapdfx=[0.01:0.0001:0.999];y1=betapdf(x,2,6);y2=betapdf(x,2.7,6.3);figure(1)plot(x,y2,'r');hold on plot(x,y1,'g');hold off绿色candidate density红色 target density 阅读全文
posted @ 2010-10-15 21:25 finallyly 阅读(579) 评论(0) 推荐(0) 编辑
  2010年10月13日
摘要: 原文地址:http://hi.baidu.com/handsomedtl/blog/item/e4d449359a47a146241f1445.html一、引言  WIN32 API为我们提供了一种进行文件操作的高效途径,即内存映射文件。内存映射文件允许我们在WIN32进程的虚拟地址空间中保留一段内存区域,把目标文件映射到这段虚拟内存之中。我们可以用存取内存数据的方式直接操作文件中的数据,就好像这... 阅读全文
posted @ 2010-10-13 14:24 finallyly 阅读(3139) 评论(4) 推荐(2) 编辑
  2010年10月11日
摘要: 一、C++中不能使用random()函数==================================================================================本文由青松原创并依GPL-V2及其后续版本发放,转载请注明出处且应包含本行声明。C++中常用rand()函数生成随机数,但严格意义上来讲生成的只是伪随机数(pseudo-random integr... 阅读全文
posted @ 2010-10-11 18:12 finallyly 阅读(101198) 评论(4) 推荐(12) 编辑
  2010年10月4日
摘要: 最终版本的文本分类代码、语料、以及中间文件都已经开源共享见:http://www.cnblogs.com/finallyliuyu/archive/2012/01/15/2322721.html。由于数据和程序规模比较大,就不在博客园上传了。大家可以自己注册下载。(注:转载请注明作者和出处 作者:finallyliuyu 出处:博客园)适用人群:文本分类初学者、新手、菜鸟、业余爱好者目的:1.将书本上关于文本分类的相关内容,如分类器、特征词选择算法等,用程序实现,让入门者对文本分类有个感性的、具体的了解,毕竟数学公式还是蛮抽象的; 2.“尽信书不如无书”,“纸上得来终觉浅,绝知此事要躬行”,借 阅读全文
posted @ 2010-10-04 22:50 finallyly 阅读(22778) 评论(61) 推荐(5) 编辑
摘要: (注:博文转载请注明作者和出处 作者:finallyliuyu 出处:博客园)本博文旨在通过实践验证各种特征词选择算法对文本分类性能的影响。根据Yi ming yang 1999年的论文《A comparision of feature selection algorithms in Text Categorization》中的论断: DF,IG,CHI-square法性能差不多,point wi... 阅读全文
posted @ 2010-10-04 21:51 finallyly 阅读(5417) 评论(11) 推荐(3) 编辑
上一页 1 ··· 18 19 20 21 22 23 24 25 26 ··· 41 下一页