02 2015 档案
摘要:建站指南:百度认为什么样的网站更有抓取和收录价值2012-06-20百度认为什么样的网站更有抓取和收录价值呢?我们从下面几个方面简单介绍.鉴于技术保密以及网站运营的差异等其他原因,以下内容仅供站长参考,具体的收录策略包括但不仅限于所述内容。第一方面:网站创造高品质的内容,能为用户提供独特的价值。 百...
阅读全文
摘要:https://github.com/moonbingbing/Oriole
阅读全文
摘要:http://www.ideawu.net/blog/archives/824.html为了满足各位对 Facebook 出品的 rocksdb 的爱好, SSDB 数据库也可以使用 rocksdb.这个项目就是 ssdb-rocks:https://github.com/ideawu/ssdb-r...
阅读全文
摘要:在 FREEBUF 投放广告FreebuF黑客与极客—高质量的全球互联网安全媒体,同时也是爱好者们交流、分享安全技术的最佳平台。本站读者群以IT、政企信息安全人员、互联网安全爱好者和学生为主,对互联网&极客产品/服务/网络等均有较强的接受能力。说明:1、目前本站只接受图片投放,您提供的广告,必须建立...
阅读全文
摘要:在CentOS 6.4中编译安装gcc 4.8.1分类:C/C++Linux/Unix2013-11-28 21:021877人阅读评论(0)收藏举报原文链接:http://www.cnblogs.com/codemood/archive/2013/06/01/3113200.html1. 安装gc...
阅读全文
摘要:以用户登录为例介绍,其它注销,改密码,消息,头像,好友均类同。从用户xxx在某一应用程序的login.php,输入用户名,密码讲起。先用uc_user_login函数到uc_server验证此用户和密码,如正确,则写入session,写入cookies,并更新应用程序会员表中的登录ip,登录时间。用...
阅读全文
摘要:不同于使用自己的服务器进行分词,Discuz!在线中文分词服务是基于API返回分词结果的。在项目中,我们只需要一个函数即可方便地进行分词、关键词提取。以下是根据Discuz!在线分词服务API写的函数,测试可正常运行:复制代码代码如下:/*** DZ在线中文分词* @param $title str...
阅读全文
摘要:http://blog.sina.com.cn/s/articlelist_2946221994_0_1.html
阅读全文
摘要:simple_html_dom使用小结分类:PHP2012-08-31 14:243094人阅读评论(0)收藏举报htmlcallbackstringdivfunctionfile1.文件夹结构如下:php解析html页面工具 simple html dom 使用的简单介绍:(1)下载(http:/...
阅读全文
摘要:首先,大家应该明白,收录量是一个网站大小的体现,其次是权重的表现。还应该注意的问题,权重的表现并不是收录量决定的,而是收录率决定。一个网站总共的页面数量和被收录的页面数量决定了你的网站在百度的权重多少。也跟排名有关系了。上面的几个朋友的网站,google收录多,baidu收录少,可见,网站页面很多的...
阅读全文
摘要:TokuDB的特点验证 - billy鹏时间2014-03-03 14:28:00博客园_billy鹏的足迹原文http://www.cnblogs.com/billyxp/p/3567421.html随着数据量越来越大,越来越频繁的遇到需要进行结构拆分的情况,每一次拆分都耗时很久,并且需要多方配合...
阅读全文
摘要:shell判断文件,目录是否存在或者具有权限#!/bin/sh myPath="/var/log/httpd/" myFile="/var /log/httpd/access.log" #这里的-x 参数判断$myPath是否存在并且是否具有可执行权限 if [ ! -x "$myP...
阅读全文
摘要:centos安装redis及php-redis扩展Linux,WEB七162012今天公司同事要求在测试机上安装redis,并且要求让php安装上redis的扩展,redis是一个key-value存储系统.和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、l...
阅读全文
摘要:PHP很有用的一个函数ignore_user_abort ()2013-01-16 14:21:31|分类:PHP|标签:php函数|举报|字号订阅ignore_user_abort 设置与客户机断开是否会终止脚本的执行。 本函数返回 user-abort 设置的之前的值(一个布尔值)。int i...
阅读全文
摘要:做采集的时候,可以使用file_get_contents()去获取网页源代码,但是使用file_get_contents采集,速度慢,而且超时时间,不好控制。如果采集的页面不存在,需要等待的时间很长。一般来说,curl的速度最快,其次是socket,最后是file_get_contents。现在跟大...
阅读全文
摘要:下载地址: http://www.jb51.net/codes/33397.html Snoopy的一些特点: 1抓取网页的内容 fetch 2 抓取网页的文本内容 (去除HTML标签) fetchtext 3抓取网页的链接,表单 fetchlinks fetchform 4 支持代理主机 5支持基...
阅读全文