摘要:
昨天发了一个无水印解析,评论说想要多线程下载,还是比较简单的。 py文件同目录下创建url.txt,把链接一行一行复制进去,就能批量下载。 代码中的延时不能去掉,由于是多线程,速度较快,延时很重要。 阅读全文
摘要:
今天没事,就分享一个采集新浪新闻PHP插件接口,可用于火车头采集,比较简单,大家可以研究! 新浪新闻实时动态列表为:https://news.sina.com.cn/roll/?qq-pf-to=pcqq.group#pageid=153&lid=2968&k=&num=50&page=1 接口主要 阅读全文
摘要:
网站sitemap制作格式与要求1.sitemap格式说明 2.sitemap主索引文件格式如需提交大量sitemap文件,则可将其列在sitemap索引文件中,然后将该索引文件提交。您无需分别提交每个文件。 3.sitemap生成要求生成的数据包括:a.所有网站文章详情页:数据状态为可访问页面,同 阅读全文
摘要:
最近在对PHP网站高并发高性能有所领悟,今天写一篇关于这方面的文章。今天用我的测试站点:http://zhimo.yuanzhumuban.cc/来讲解实例。 支模网整体开发到上线为10个月左右,后端采用php开源框架destoon,站点总数据为800万,其中每天会更新入库数据5000-50000数 阅读全文
摘要:
最近因为做聚合页面http://www.kaotop.com/ 内部站点关键词拥有5万的行业词库,所以这么多搜索词库,如何让百度第一时间抓取呢?于是就花了10分钟时间写了这个插件,这个插件实现MIP+熊掌号历史推送+普通主动推送三项合一多功能推送,这个是初始版本,也是核心版本,需要其他推送功能可以在 阅读全文
摘要:
最近做这个站点http://zhimo.yuanzhumuban.cc/ ,百度一直出现转码问题,很头疼,通过一周时间研究meta属性,达到了代码优化的效果,在此做一些笔记。 具体真实页面可以参考:http://zhimo.yuanzhumuban.cc/news/show-543025.html 阅读全文
摘要:
今天一个朋友给我说在网页上添加dns-prefetch,网页访问速度能提高,于是我百度查询关于dns-prefetch。 DNS Prefetch,即DNS预获取,是前端优化的一部分。一般来说,在前端优化中与 DNS 有关的有两点: 一个是减少DNS的请求次数,另一个就是进行DNS预获取 。 DNS 阅读全文
摘要:
网站上线http://zhimo.yuanzhumuban.cc/有一年左右时间了,百度搜索显示略缩图少之又少,通过自己这几天的观察发现。 结合百度站长平台的 robots 工具和抓取诊断工具检查后,发现果然是 robots 误禁封造成的! 百度索引变动一直以慢著称,所以 robots 写错了也不会 阅读全文
摘要:
今天给一个朋友http://www.myunigift.cn/ 这个站点是用wordpress,今天帮他改造熊掌号,于是做了数据同步推送。 只要把下面的代码写到funtions.php里面,发布文章的时候就会自动推送到百度了哦! 阅读全文
摘要:
Homebrew简称brew,OSX上的软件包管理工具,在Mac终端可以通过brew安装、更新、卸载软件。 1、打开终端直接输入下面指令回车: 注意:如果当前的用户是管理员,需要对权限进行许可,在执行上面的指令前先执行:sudo chmod -R g+w /usr/local 2、在1中指令回车后会 阅读全文