摘要: 这里介绍两个php采集能用到的好工具。一个是Snoopy,一个是simple_html_dom。采集还有很多方式(其实本质就2-3种,其他的都是衍生的),php自带了几个方法也能直接进行采集。但是,出于把懒惰进行到底的精神。我们还是可以通过这两个工具,让采集变得更简单。网上有不少介绍Snoopy的,下面是别人翻译的Snoopy的SDK//////////////////////////////////////////////////////////////Snoopy是一个php类,用来模拟浏览器的功能,可以获取网页内容,发送表单。Snoopy的一些特点:1抓取网页的内容 fetch2 抓取网 阅读全文
posted @ 2013-05-28 16:27 幻星宇 阅读(250) 评论(0) 推荐(0) 编辑
摘要: mongodb由C++写就,其名字来自humongous这个单词的中间部分,从名字可见其野心所在就是海量数据的处理。关于它的一个最简洁描述为:scalable, high-performance, open source, schema-free, document-oriented database。MongoDB的主要目标是在键/值存储方式(提供了高性能和高度伸缩性)以及传统的RDBMS系统(丰富的功能)架起一座桥梁,集两者的优势于一身。安装及使用:首先在Ubuntu上安装MongoDB。下载MongoDB, 现在最新的生产版本1.7.01. 解压文件.$ tar -xvf mongodb 阅读全文
posted @ 2013-05-28 15:36 幻星宇 阅读(164) 评论(0) 推荐(0) 编辑
摘要: <?php/*** PHP操作MongoDB学习笔记*///*************************//** 连接MongoDB数据库 **////*************************//格式=>(“mongodb://用户名:密码 @地址:端口/默认指定数据库”,参数)$conn= newMongo();//可以简写为//$conn=new Mongo(); #连接本地主机,默认端口.//$conn=new Mongo(“172.21.15.69″); #连接远程主机//$conn=new Mongo(“xiaocai.loc:10086″); #连接指定 阅读全文
posted @ 2013-05-28 15:01 幻星宇 阅读(195) 评论(0) 推荐(0) 编辑
摘要: 一、MongoDB简介MongoDB (名称来自"humongous") 是一个可扩展的、高性能、开源、模式自由、面向文档的数据库,集文档数据库、键值对存储和关系型数据库的优点于一身。官方站点:http://www.mongodb.org/,MongoDB特点:•面向文档存储(类JSON数据模式简单而强大)•动态查询•全索引支持,扩展到内部对象和内嵌数组•查询记录分析•快速,就地更新•高效存储二进制大对象 (比如照片和视频)•复制和故障切换支持•Auto-Sharding自动分片支持云级扩展性•MapReduce 支持复杂聚合•商业支持,培训和咨询二、安装MongoDB安装 阅读全文
posted @ 2013-05-28 14:06 幻星宇 阅读(267) 评论(0) 推荐(0) 编辑