2012年1月7日

摘要: 09年的时候,我用C#实现了简单的飞信协议,并开了源,详情请查看这里。直到现在还有童鞋发邮件给我向咨询或是所要代码。但是由于飞信协议有个几次的升级,我那个库基本上没什么用了。由于工作比较忙,也一直没有去管他。前两天,我用这个项目申请了sinaapp的中级开发者人证,居然侥幸通过了,所以觉得有必要更新一下代码了。网上查了一下有关飞信协议的最新的情况,没有什么进展,我也不想自己通过抓包去分析飞信协议了,毕竟那样会比较耗时。正当我准备放弃的时候发现有人用php实现了wap飞信的协议。不看不知道,一看吓一跳,协议非常简单,总共代码也不超过100行。我花了一小段时间,将那php的代码翻译成了C#的,测试 阅读全文
posted @ 2012-01-07 18:49 小橋流水 阅读(43421) 评论(29) 推荐(6) 编辑

2012年1月6日

摘要: 很多时候想通过.NET调用一些C/C++写的库,但是一直都不知道怎么弄。去网上找了一些资料,大多数是教如何通过托管C++和非托管C++的混合编程来完成C/C++的的类库的.NET Wrapper。有的时候用C#来实现一个功能的时候,可能要调用windows api,往往都是到网上现查代码,然后粘过来使用,没有细研究到底是怎么做到的。最近一个朋友用到分词,所以就研究了一些中科院提供的中文分词软件,详情请访问http://ictclas.org/。用了一下还挺好用的,速度没有测试,感觉应该用于学术研究肯定是没有问题的,如果要用到项目中,我觉得还是公司自己实现会比较好。可惜该组件没有提供.NET的版 阅读全文
posted @ 2012-01-06 01:03 小橋流水 阅读(40688) 评论(1) 推荐(1) 编辑

2012年1月3日

摘要: 最近想平均分割一个数组,比如把一个10数的数组分成6个数组的,最好的分法是2,2,2,2,1,1,这个2很好求出,直接10/6上取整就可以了,但是如果按2去分割的话,最后会变成2,2,2,2,2,0这样不均匀的分法,很是蛋疼。今天休息,想了一下这个问题,发现可以用递归来解决。比如先分出2来,递归将8分成5个数组,有能分出2来,递归将6分成4个数组,在分出2来,变成了递归将4分成3个数组,又可以分出2来,那就变成了将2分成2个数组,下一步就很明显了。不多说了,直接上码,希望对遇到同问题的人有所帮助,这也算我的功德了。View Code #include<iostream>#inclu 阅读全文
posted @ 2012-01-03 16:22 小橋流水 阅读(41544) 评论(4) 推荐(2) 编辑

2011年12月24日

摘要: 在shell下,可以直接创建文件的硬链接,而符号链接(软链接)可以对文件和目录。很多情况下,直接用软链接就可以搞定。但在有的时候,单纯的软链接是解决不问题的。 但是对于目录来说又不能创建硬链接,那肿么办呢? 把目录中所有的文件都硬链接过来。 阅读全文
posted @ 2011-12-24 22:41 小橋流水 阅读(40496) 评论(0) 推荐(1) 编辑

2011年12月22日

摘要: 自2011年初,CSDN在网上发起“2011年软件行业技术人员薪资大调查”以来,引起了广大开发者们的热烈反响,短短两月时间内,近万名开发者提交了调查数据。尽管这只是中国百万开发者大军的一小部分,但他们所在的行业几乎涵盖了整个中国软件的产业链,他们的职位几乎代表了一个软件团队体系的每一个层面,而且 “一叶知秋”,所以透过这些调查数据和变化,我们或许可以一瞰中国软件开发者的普遍生存状态,甚至可帮助开发... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 在百度实习已经三个多月了。我但是就计划在百度实习三个月,然后到其他的公司,去感受不同的企业文化。百度其实挺好的,我在这里的三个月学到了太多太多的东西。 刚来的两周时间,压力非常的大,以前基本上没有接触到linux,到了百度后,首先就是要做新人题。从设计到代码,单测都要独立完成。这个过程非常折磨人,周末的时候,我都在写代码的,学会了使用各种各样的的内部库,学会了单测,学会了Makefile,学... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(254) 评论(0) 推荐(0) 编辑
摘要: 个人目录下: Web Crawled by myself # 自己爬取的数据集 cn 5 depth # 用nutch 0.7.2爬取的数据集,限制在cn域中,包括链接和文本 cn-2010-01-01 # 用nutch 0.7.2爬取的数据集,限制在cn域中,包括链接和文本 dlut.edu.cn2010-01-01 # 用nutch 0.... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(911) 评论(0) 推荐(0) 编辑
摘要: 导航类的查询是指那些有明确寻址需求的查询,如“优酷网”或“优酷”等。目前很多互联网用户很可能只能记得百度等搜索引擎的网址,或把百度设置为首页,要进别的网站时,一般通过搜索来解决。 在搜索引擎中,对于导航类的查询,如果返回的第一条搜索结果不是目标网站的话,对用户的搜索体验是巨大的伤害。比如搜索“中国银行”,如果返回的不是中国银行的网站,而是某钓鱼网站的话,那很有可能对用户造成非常的伤害。因此,很有必... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(201) 评论(0) 推荐(0) 编辑
摘要: hadoop streaming示例:${HADOOP_BIN}streaming\r-Dmapred.job.name=${JOB_NAME}#任务名-Dstream.memory.limit=1500#任务内存限制-Dmapred.map.capacity.per.tasktracker=1\r-Dmapred.reduce.capacity.per.tasktracker=1\r-Dmapred.map.tasks=${MAP_TASKS}#map个数-Dmapred.job.map.capacity=${MAP_CAPACITY}#map容量,一般与map个数一致-Dmapred.re 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(40467) 评论(0) 推荐(0) 编辑
摘要: 前两天Google的*.appspot.com被和谐后,广大墙友的GappProxy就用不了了,不过通过自己绑定域名的GAE却可以正常访问,所以我想,通过自定绑定的域名来使用GAppProxy应该也是可以的,待我使用最新版的GAppProxy2时,却无情的收到404错误: Error response Error code 404. Message: Local proxy error, Fetchserver not found at the URL you specified, please check it.. Error code explanation: 404 = N... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(39957) 评论(0) 推荐(0) 编辑
摘要: java中提供很多集合类,比如ArrayList,HashMap等等。但你有没有发现其中的这些集合类都是泛型的,有的时候你会发现用泛型会比较慢。慢在哪呢?慢就慢在基本类型的装包和拆包。当你处理大数量的时候,这个慢有的时候就不能接受了。那这怎么解决呢?推荐大家使用fastutil,一个意大利实验室出品,主要用在其的WebGraph上。下面是其官方网站对其的介绍:fastutil extends the Java™ Collections Framework by providing type-specific maps, sets, lists and queues with a small m 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(40399) 评论(0) 推荐(0) 编辑
摘要: linux下线程采用pthread.h,采用的是c语言的风格,为了更加面向对象话,我在写程序的时候给封装成了一个类,用到了一些内部的库,但是去掉内部的库,也无伤大雅。懒得去改程序了,所以没有去处某些内部的头文件和函数的调用。thread.h/***@filethread.h*@version*@date2011/5/12*@authorwangyou@baidu.com*@brief对线程进行了简单的封装(java风格)**/#pragmaonce#include#include//线程classthread{public:/***@brief构造函数*@param无*@return无**/t 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(41365) 评论(0) 推荐(0) 编辑
摘要: 工作的时候进程需要手工去check服务器的运行状况,有的时候要check很多台,手工的话,就很繁琐,而且也容易出错。 我就想着写一个脚本来完成,想法是脚本通过ssh连上远程服务器,然后运行命令,返回结果。 但是发现需要一个一个输入密码,这也很郁闷,网上找了找,发现可以添加认证关系,但是如果手工一台一台的添加的话,也要花费不少时间。而且添加人证关系的过程也是比较繁琐的。 我就想能不能用命令指定密码,... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(40136) 评论(0) 推荐(0) 编辑
摘要: stl提供各种各样的容器,大家都感受到了它给我们带来的方便,但是它也存在一定的问题。刚来百度的时候,查看编码规范的时候,看到一条建议不要使用stl,而使用百度自己的bsl,原因是stl的内存不可控,不太适合百度的线上服务。当时不了解这句话的真正含义,只是记住了,甚至在后来用的时候,发现其实bsl就是将stl改吧改吧,并没有觉得有什么好的,而且用起来还没有stl方便。只是在做新人题的时候,试着去用b... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(611) 评论(0) 推荐(0) 编辑
摘要: 在别人的代码中看到的,看来还是有一点作用的,代码如下:#include using namespace std;int quickfindonecnt(int i){ int cnt = 0; while (i) { cnt++; i &= i-1; } return cnt;}int main(){ int i = 0xFFF; cout << quickfindonecnt(i) << e... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(486) 评论(0) 推荐(0) 编辑
摘要: 大连理工大学部分有效FTP地址列表[V1.0]地址格式:ftp://账号:密码@服务器IP:端口号建议使用FlashFXP登录FTPftp://ftp.dlut.edu.cnftp://210.30.96.4ftp://210.30.96.5ftp://ssdut:download@210.30.96.116ftp://ssuser:ssuser@210.30.97.149ftp://cippus:cippus@210.30.97.150ftp://ssdut:download@210.30.98.67ftp://ssdut:ssdut@crazyso.3322.orgftp://cti.dl 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(41857) 评论(0) 推荐(0) 编辑
摘要: ls -al 1>/dev/null 2>&1 ls -al就是显示当前目录的信息,1>/dev/null是叫标准输出重定向到/dev/null,即空,2>&1,就是将标准错误输出合并到标准输出。也就是将所有的输出都输出到/dev/null,即不输出任何信息。 另外,我们也可以将输出重定向到文件ls -al 1>1.txt 2>2.txt,将标准输出重定向1.txt,标准错误输出重定向2.txt ... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(243) 评论(0) 推荐(0) 编辑
摘要: 题目:实现int add(int a, int b)方法,实现a和b的和,但是内部不允许使用+-*/等算术运算。 解答:这个题考查的其实是对计算机硬件如何做加法的。计算机内做加法和乘法都是模拟人做加法和乘法的方法来设计和实现cpu算术运算模块的。这在我们学习计算机组成原理的课程时应该学到过。如下面例子: 1101 11+--------------10000 这个计算可以分为两部分,一部分是按位+... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(772) 评论(0) 推荐(0) 编辑
摘要: 很多同学正在面临或即将面临找工作的问题,很多人对自己想要从事的行业不是很了解。做为软件学院的同学大多数要去软件公司、游戏公司和互联网公司。我就我比较了解的互联网公司的几个跟技术有关的职位做一定的科普,希望对大家有一定的帮助,大牛请绕道。 RD(Research&Development),即研发,其实就是软件工程师,或者叫程序员、码农。我们软件学院的大多数人都将从事这个职位,主要任务就是写代码,当... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(773) 评论(0) 推荐(0) 编辑
摘要: mxr.mozilla.org是mozilla的代码查看网站,上面有丰富的代码资源,但是上边没有打包下载的功能,只能单个单个文件的下载,用起来会非常的麻烦。今天没啥事,想研究一下firefox的编码识别模块,需要到mxr.mozilla.org上去下载代码。去网上找了一圈也没有找到批量下载的方法或工具。本想一个一个文件下载,但是发现文件数量还是比较大的,很麻烦,所以决定写个工具来下载。工具用C#写... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(372) 评论(0) 推荐(0) 编辑

导航