上一页 1 ··· 13 14 15 16 17 18 19 20 21 ··· 99 下一页
摘要: 据新华社电谷歌公司和苹果计算机公司在多个领域互为竞争对手,却“共享”包括谷歌首席执行官埃里克·施密特在内的两名董事,涉嫌垄断,美国联邦贸易委员会对此进行调查。美国多家媒体5日披露了这一事件。  谷歌和苹果在智能手机操作系统领域竞争正日趋激烈。苹果推出“iPhone”大获成功后,谷歌研发出“Android”操作系统相抗... 阅读全文
posted @ 2009-05-07 13:24 广陵散仙(www.cnblogs.com/junzhongxu/) 阅读(207) 评论(0) 推荐(0) 编辑
摘要: Mozilla社区开发总监阿萨·多特茨尔(Asa Dotzler)今日透露,尽管火狐浏览器不具有记录用户数量功能,但该公司预计目前火狐浏览器用户达2.7亿名。这意味着火狐用户数要比Facebook注册用户数(2亿)多出35%,也是后者日均浏览人数(1亿)的近三倍。 阅读全文
posted @ 2009-05-07 13:24 广陵散仙(www.cnblogs.com/junzhongxu/) 阅读(186) 评论(0) 推荐(0) 编辑
摘要: Linux 服务器虽然相对来说比Windwos服务器要稳定与安全。但是工欲善其事,必先利其器。稳定安全的Linux服务器,仍然离不开合理的及时的维护工作。对于Linux服务器系统的维护技巧有很多,笔者这里就先给大家几个锦囊妙计。 阅读全文
posted @ 2009-05-07 13:22 广陵散仙(www.cnblogs.com/junzhongxu/) 阅读(166) 评论(0) 推荐(0) 编辑
摘要: C#实现所有经典排序算法 阅读全文
posted @ 2009-05-07 13:21 广陵散仙(www.cnblogs.com/junzhongxu/) 阅读(278) 评论(0) 推荐(0) 编辑
摘要: 1998年3月,MP3.com成立。作为这家公司的创建者、Robertson充分发掘数字技术的商业潜力,创造出互联网音乐产业模式。 阅读全文
posted @ 2009-05-06 09:35 广陵散仙(www.cnblogs.com/junzhongxu/) 阅读(217) 评论(0) 推荐(0) 编辑
摘要: 《财富》杂志通过寻访多位苹果公司高层和IT界分析人士,得出的答案是:苹果公司现任首席运营管(COO)蒂姆.库克(Timothy D. Cook)。 阅读全文
posted @ 2009-05-06 09:34 广陵散仙(www.cnblogs.com/junzhongxu/) 阅读(233) 评论(0) 推荐(0) 编辑
摘要: 现今Cerf在谷歌公司副总裁这个岗位上负责鉴别新的技术,支持谷歌开发和提供基于互联网的先进产品和服务。 阅读全文
posted @ 2009-05-06 09:33 广陵散仙(www.cnblogs.com/junzhongxu/) 阅读(387) 评论(0) 推荐(0) 编辑
摘要: 作为CEO,Scott一直尽职尽责。但是进入21世纪以后,随着技术热潮的逐步降温,IT业界也一直因缺乏新的技术增长点而徘徊 阅读全文
posted @ 2009-05-06 09:32 广陵散仙(www.cnblogs.com/junzhongxu/) 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 由于Unix与C语言的深远影响,1983年美国计算机协会将当年的图灵奖破例颁给了作为软件工程师的Ken与Dennis,并在当年还决定新设立一个奖项――软件 阅读全文
posted @ 2009-05-06 09:31 广陵散仙(www.cnblogs.com/junzhongxu/) 阅读(141) 评论(0) 推荐(0) 编辑
摘要: 克雷先后创造了CRAY-1,CRAY-2等机型,他亲手设计了Cray机型的全部硬件与操作系统,其中的作业系统更是他用机器码编写完成。 阅读全文
posted @ 2009-05-06 09:30 广陵散仙(www.cnblogs.com/junzhongxu/) 阅读(378) 评论(0) 推荐(0) 编辑
摘要: 正则表达式很强大,利用它我们可以获得一定格式的数据,比如网址,E-mail地址,数字,字母等等.可喜的是,从3.2版开始,火车采集器就支持正则规则的编写了,这给喜欢用正则来实现不同需求的朋友带来福音。火车采集器里支持两种正则,一个纯正则,一个参数正则。我们下边分开讲一下。 1.纯正则: 先看一下图 在标签中用正则表达式采内容的格式是这样: 开始代码(?正则表达式)结束代码 其中在开始代码和结束代... 阅读全文
posted @ 2009-04-30 09:24 广陵散仙(www.cnblogs.com/junzhongxu/) 阅读(3806) 评论(0) 推荐(0) 编辑
摘要: 使用过滤,替换,可以去除采集到的内容里我们不需要的东西,如干扰码,白色字等。 程序自带的htm标签排除功能已什么全面,可以大面积去除不需要的标签,比如第一个就可以去除所有的链接。 这里的排除支持(*), 这里支持参数型替换,注意这个是标准版有的功能。 需要注意的一点是:程序是先排除后替换。最后使用html标签排除。还有就是替换和排除里的顺序。 看上边的图,这里的替换和排除是有顺序的。可以... 阅读全文
posted @ 2009-04-30 09:23 广陵散仙(www.cnblogs.com/junzhongxu/) 阅读(880) 评论(0) 推荐(0) 编辑
摘要: 循环采集的原理和网址采集部分相似,我们以论坛主题和回复为例,讲一下循环采集的使用.以http://bbs.locoy.com/spider-34395-1-1.html为例: 我们要获得每一楼的作者,写规则 href="space.php?uid=(*)" style="margin-left: 20px; font-weight: 800">开头, <结尾,默认可以获得一 个结果 rq204 ,... 阅读全文
posted @ 2009-04-30 09:23 广陵散仙(www.cnblogs.com/junzhongxu/) 阅读(1665) 评论(0) 推荐(0) 编辑
摘要: 分页就是目标网站上一个文章分为好几页,我们需要设置规则将其全部采到。采集要点: 1.采集规则要对每个分页都适用。 2.分页规则如果是全部列出,只要第一个页面的分页规则就可以了。如果是上下页,每个页面的分页规则也要都适用。 具体操作流程:先测试获得所有分页,再对每个分页里的内容进行获取。 下边我们以http://www.pconline.com.cn/diy/graphics/hq/gz/0802/... 阅读全文
posted @ 2009-04-30 09:23 广陵散仙(www.cnblogs.com/junzhongxu/) 阅读(3722) 评论(0) 推荐(1) 编辑
摘要: 何为多页?本来我们是从网址采集那块采集到网址,再对这个网址(也叫默认页)进行采集。但是有时有许多信息他并不在一个页面上,而是和这个默认页有一定的关系,要不他网址在默认页里,要不他网址和默认页网址有联系。我们就这个问题来说一下具体的解决办法。 这里也有两种途径获得第三个网址,我们先讲从默认页网址替换得到新网址。我们以http://data.movie.xunlei.com/movie/39843... 阅读全文
posted @ 2009-04-30 09:22 广陵散仙(www.cnblogs.com/junzhongxu/) 阅读(2305) 评论(0) 推荐(0) 编辑
上一页 1 ··· 13 14 15 16 17 18 19 20 21 ··· 99 下一页