摘要: 基础数据结构: CREATE TABLE email (emailid mediumint(8) unsigned NOT NULL auto_increment COMMENT '邮件id',fromid int(10) unsigned NOT NULL default '0' COMMENT '发送人ID',toid int(10) unsigned NOT NULL default '0' COMMENT '收件人ID',content text unsigned NOT NULL COMMENT ' 阅读全文
posted @ 2013-11-15 10:32 幻星宇 阅读(382) 评论(0) 推荐(0) 编辑
摘要: 我用php ,curl主要是抓取数据,当然我们可以用其他的方法来抓取,比如fsockopen,file_get_contents等。但是只能抓那些能直接访问的页面,如果要抓取有页面访问控制的页面,或者是登录以后的页面就比较困难了。1,抓取无访问控制文件1 2,使用代理进行抓取为什么要使用代理进行抓取呢?以google为例吧,如果去抓google的数据,短时间内抓的很频繁的话,你就抓取不到了。google对你的ip地址做限制这个时候,你可以换代理重新抓。 1 3,post数据后,抓取数据单独说一下数据提交数据,因为用 curl的时候,很多时候会有数据交互的,所以比较重要的。 1 serializ 阅读全文
posted @ 2013-11-15 10:31 幻星宇 阅读(656) 评论(0) 推荐(0) 编辑