上一页 1 ··· 27 28 29 30 31 32 33 34 35 ··· 38 下一页
摘要: 我走过山的时候山不说话 我走过山的时候山不说话,我路过海的时候海不说话; 我坐着的毛驴一步一步滴滴答答,我带着的倚天喑哑。 大家说我因为爱着杨过大侠,找不到所以在峨嵋安家; 其实我只是喜欢峨嵋的雾,像十六岁那年绽放的烟花。 摘自 程灵素 红颜弹指老,刹那芳华 阅读全文
posted @ 2006-03-27 15:18 xiaotie 阅读(1213) 评论(0) 推荐(0) 编辑
摘要: pyste是boost.python自带的代码生成器,利用pyste可以很方便的为c++ 的 lib加一层python的shell。如果当前boost版本不支持pyste的话,可以到boost官方网站上下载最新版本的boost源码。以 boost 1.3.1为例,进入boost_1_33_1/libs/python/pyste/install目录,运行python setup.py install... 阅读全文
posted @ 2006-03-16 12:27 xiaotie 阅读(2140) 评论(1) 推荐(0) 编辑
摘要: 默认状态下log4cpp日志文件是不会超过2G(int32的最大值)的。 将FileAppender.cpp中的两处 _flags(O_CREAT | O_APPEND | O_WRONLY) 更改为: _flags(O_CREAT | O_APPEND | O_WRONLY | O_LARGEFILE) 重新configure;make;make install。然后就可写出大日志文件了。 ... 阅读全文
posted @ 2006-03-15 18:28 xiaotie 阅读(1152) 评论(0) 推荐(0) 编辑
摘要: eclipse/cdt打开(去掉indexer),1~2分钟Kdevelop打开,花了1小时我回来看,KDE死了(不知道怎么关indexer)VS2005打开,到现在20分钟了,cpu还在100%呢.郁闷! 阅读全文
posted @ 2006-03-15 01:51 xiaotie 阅读(678) 评论(0) 推荐(0) 编辑
摘要: 一些个人经验总结. 阅读全文
posted @ 2006-03-11 00:59 xiaotie 阅读(1926) 评论(6) 推荐(2) 编辑
摘要: 最近在写龙龙第二版网络风行者。网络风行者引入了规则体系,简介如下: 规则主要分成两部分,一是数据匹配规则,二是数据提取规则。本文详述数据匹配规则,数据提取规则只简单提及。 我认为好的规则应该具备以下两点: (1)实用,能适用于大部分应用场合 (2)易用,容易编写与调试 我看了几个国内现有的网络信息提取软件,主要是通过制定正则表达式进行提取,适用的场景有限,主要适用于1对1的数据提取场景,既从1个... 阅读全文
posted @ 2006-03-07 13:04 xiaotie 阅读(2779) 评论(5) 推荐(0) 编辑
摘要: 时间:2006~2008年,业余时间慢慢来目的:(1)学习编译原理基本概念、理论(2)学会使用1种词法/语法分析工具(我选择antlr)(3)顺便学学自动机理论(4)大量阅读代码(5)了解主要语言的机制(c,c++,java,cli/.net,python)教材:(1)编译原理,(美)Alfred V. Aho, Ravi Sethi, Jeffrey D. Ullman著,李建中 姜守旭 译(2... 阅读全文
posted @ 2006-02-26 00:12 xiaotie 阅读(1241) 评论(1) 推荐(0) 编辑
摘要: 很多时候需要给c++程序提供一种使用上的灵活性,脚本语言在这里就变得很重要了。采用Boost.Python为c++程序加一层shell,比较简单、简洁,对原有的c++代码也没有侵入性。今天试了一下,感觉不错,可以把它集成在现在正在做的项目中。 我主要参照David Abrahams的"Building Hybrid Systems with Boost.Python"(http://www.bo... 阅读全文
posted @ 2006-02-22 17:53 xiaotie 阅读(4045) 评论(0) 推荐(0) 编辑
摘要: 去年(2005年)花了数月的时间写了一个Web Spider。主要集中于功能实现,线程模型,任务自动化,数据攫取方面。在两个月的运行测试中,改正了不少的bug。当时给这个程序起的名字叫"龙龙"(俺是兽族的嘛).龙龙的缺点是完全定制性的控制台程序,对不同的网页必须进行硬编码解析。于是想开发"龙龙2.0",加入规则系统和UI界面。前一阵比较忙,就停下了"龙龙"的开发。现在开始接续龙龙2.0,并为龙龙2... 阅读全文
posted @ 2006-02-12 15:36 xiaotie 阅读(695) 评论(1) 推荐(0) 编辑
摘要: 今晚又折腾CDT几个小时,差不多有点思路,就个人的体会归纳一下,说得不对之处,还请大家指正。我的环境是Eclipse3.1.1, CDT 3.0.1, jdk 1.5.0.06, linux fc4, gcc 4.0。别的环境没试过。 CDT有很多性能/内存方面的陷阱, (1)indexer。CDT的有些功能需要indexer(我也不知道是哪些功能需要它,反正有人这么说),我做过试验,一个500... 阅读全文
posted @ 2006-02-09 00:37 xiaotie 阅读(9182) 评论(7) 推荐(0) 编辑
上一页 1 ··· 27 28 29 30 31 32 33 34 35 ··· 38 下一页