摘要:
我走过山的时候山不说话 我走过山的时候山不说话,我路过海的时候海不说话; 我坐着的毛驴一步一步滴滴答答,我带着的倚天喑哑。 大家说我因为爱着杨过大侠,找不到所以在峨嵋安家; 其实我只是喜欢峨嵋的雾,像十六岁那年绽放的烟花。 摘自 程灵素 红颜弹指老,刹那芳华 阅读全文
摘要:
pyste是boost.python自带的代码生成器,利用pyste可以很方便的为c++ 的 lib加一层python的shell。如果当前boost版本不支持pyste的话,可以到boost官方网站上下载最新版本的boost源码。以 boost 1.3.1为例,进入boost_1_33_1/libs/python/pyste/install目录,运行python setup.py install... 阅读全文
摘要:
默认状态下log4cpp日志文件是不会超过2G(int32的最大值)的。 将FileAppender.cpp中的两处 _flags(O_CREAT | O_APPEND | O_WRONLY) 更改为: _flags(O_CREAT | O_APPEND | O_WRONLY | O_LARGEFILE) 重新configure;make;make install。然后就可写出大日志文件了。 ... 阅读全文
摘要:
eclipse/cdt打开(去掉indexer),1~2分钟Kdevelop打开,花了1小时我回来看,KDE死了(不知道怎么关indexer)VS2005打开,到现在20分钟了,cpu还在100%呢.郁闷! 阅读全文
摘要:
一些个人经验总结. 阅读全文
摘要:
最近在写龙龙第二版网络风行者。网络风行者引入了规则体系,简介如下: 规则主要分成两部分,一是数据匹配规则,二是数据提取规则。本文详述数据匹配规则,数据提取规则只简单提及。 我认为好的规则应该具备以下两点: (1)实用,能适用于大部分应用场合 (2)易用,容易编写与调试 我看了几个国内现有的网络信息提取软件,主要是通过制定正则表达式进行提取,适用的场景有限,主要适用于1对1的数据提取场景,既从1个... 阅读全文
摘要:
时间:2006~2008年,业余时间慢慢来目的:(1)学习编译原理基本概念、理论(2)学会使用1种词法/语法分析工具(我选择antlr)(3)顺便学学自动机理论(4)大量阅读代码(5)了解主要语言的机制(c,c++,java,cli/.net,python)教材:(1)编译原理,(美)Alfred V. Aho, Ravi Sethi, Jeffrey D. Ullman著,李建中 姜守旭 译(2... 阅读全文
摘要:
很多时候需要给c++程序提供一种使用上的灵活性,脚本语言在这里就变得很重要了。采用Boost.Python为c++程序加一层shell,比较简单、简洁,对原有的c++代码也没有侵入性。今天试了一下,感觉不错,可以把它集成在现在正在做的项目中。 我主要参照David Abrahams的"Building Hybrid Systems with Boost.Python"(http://www.bo... 阅读全文
摘要:
去年(2005年)花了数月的时间写了一个Web Spider。主要集中于功能实现,线程模型,任务自动化,数据攫取方面。在两个月的运行测试中,改正了不少的bug。当时给这个程序起的名字叫"龙龙"(俺是兽族的嘛).龙龙的缺点是完全定制性的控制台程序,对不同的网页必须进行硬编码解析。于是想开发"龙龙2.0",加入规则系统和UI界面。前一阵比较忙,就停下了"龙龙"的开发。现在开始接续龙龙2.0,并为龙龙2... 阅读全文
摘要:
今晚又折腾CDT几个小时,差不多有点思路,就个人的体会归纳一下,说得不对之处,还请大家指正。我的环境是Eclipse3.1.1, CDT 3.0.1, jdk 1.5.0.06, linux fc4, gcc 4.0。别的环境没试过。 CDT有很多性能/内存方面的陷阱, (1)indexer。CDT的有些功能需要indexer(我也不知道是哪些功能需要它,反正有人这么说),我做过试验,一个500... 阅读全文