摘要: # -*- coding:utf-8 -*-的主要作用是指定文件编码为utf-8, 因为一般默认的是ASCII码,如果要在文件里面写中文,运行时会出现乱码,加上这句之后会把文件编码强制转换为utf-8运行时会就不会出现乱码了。声明的语法参考python的PEP http://www.python.o... 阅读全文
posted @ 2015-10-10 18:42 scofi 阅读(7859) 评论(0) 推荐(1) 编辑
摘要: 大部分python文件的头部都会写上 #!/usr/bin/python 或者 #!/usr/bin/env ,这个语句主要和运行模式有关, 如果我们用普通运行模式例如(linux) : python *.py 那么这个语句在此运行模式下无效。如果想让python程序像普通程序一样运行,例如:./* 阅读全文
posted @ 2015-10-10 17:58 scofi 阅读(34858) 评论(1) 推荐(7) 编辑
摘要: http头必须带上Content-type:application/x-www-form-urlencoded 之后 ,php 才能接收到post数据1.用php://input可以很便捷的取到原始POST数据2.$HTTP_RAW_POST_DATA仅在POST的Content-Type类型不为P... 阅读全文
posted @ 2015-05-24 10:45 scofi 阅读(294) 评论(0) 推荐(0) 编辑
摘要: 1.hadoop相关术语HDFS: Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)MapReduce:NameNode:DataNode:JobTracker:TaskTracker: 阅读全文
posted @ 2015-02-04 17:24 scofi 阅读(211) 评论(0) 推荐(0) 编辑
摘要: 定义:node.js是运行在服务器端的运用了谷歌v8引擎的javascript运行平台特点:1. 异步式I/O(非阻塞式I/O) 2. 事件驱动什么是异步式I/O(非阻塞式I/O)?要了解什么是异步式I/O(非阻塞式I/O),必须要先了解下什么是I/O,什么阻塞, 什么是同步式I/O(阻塞式I/O)... 阅读全文
posted @ 2014-05-03 15:24 scofi 阅读(369) 评论(0) 推荐(0) 编辑
摘要: 方法一,摘自discuz/** * * 根据php的$_SERVER['HTTP_USER_AGENT'] 中各种浏览器访问时所包含各个浏览器特定的字符串来判断是属于PC还是移动端 * @author discuz3x * @lastmodify 2014-04-09 * @return BOOL */function checkmobile() { global $_G; $mobile = array();//各个触控浏览器中$_SERVER['HTTP_USER_AGENT']所包含的字符串数组 static $touchbrowser_list =arr 阅读全文
posted @ 2014-04-09 13:57 scofi 阅读(40437) 评论(0) 推荐(1) 编辑
摘要: 1. 使用curl,get获得数据2. 使用curl,post获得数据'test_name', 'age' => 1);curl_post("http://www.explame.com/", $arr_post);?>3. 使用代理抓取页面为什么要使用代理进行抓取呢?以google为例吧,如果去抓google的数据,短时间内抓的很频繁的话,你就抓取不到了。google对你的ip地址做限制这个时候,你可以换代理重新抓。4.继续保持本站session的调用在实现用户同步登录的情况下需要共享session,如果要继续保持本站的sess 阅读全文
posted @ 2014-03-18 13:59 scofi 阅读(3203) 评论(0) 推荐(1) 编辑
摘要: 上篇说到我们说到设置file_get_contents超时时间用到了stream_context_create方法,那么这个方法到底是什么呢?查了下资料,stream_context_create创建并返回一个文本数据流并应用各种选项,可用于fopen(),file_get_contents()等过程的超时设置、代理服务器、请求方式、头信息设置的特殊过程。这样看起来功能就强大了,不仅仅可以设置超时时间,还可以设置代理服务器,请求方式和头信息,下面我们就测试下吧:request.php请求页面负责发起请求: 1 'test_name',"content" =& 阅读全文
posted @ 2014-03-18 13:56 scofi 阅读(778) 评论(0) 推荐(0) 编辑
摘要: 早在2010年时候遇到过这样的事情,因为file_get_contents函数造成服务器挂掉的情况,现在觉得很有必要总结下。公司里有经常有这样的业务,需要调用第三方公司提供的HTTP接口,在把接口提供的信息显示到网页上,代码是这样写的:file_get_contents("http://example.com/")。有一天突然接到运维同事的报告,说是服务器挂了,查出原因说是因为file_get_contents函数造成的,那么为什么一个函数会把服务器给搞挂掉呢?经过详细的查询发现第三方公司提供接口已经坏掉了,就是因为接口坏掉了,才导致服务器挂掉。问题分析如下: 我们代码是“ 阅读全文
posted @ 2014-03-18 13:54 scofi 阅读(18177) 评论(3) 推荐(2) 编辑
摘要: 在工作中遇到一个问题,在A服务器上投递一条数据到B服务器【用Curl访问服务器B上的一个URL】,但是对比两边的数据【A服务器上的Nginx日志和B服务器上的Nginx日志】总是对比不上B服务器的日志条数比A上每小时要少4%左右,服务器上也没有任何报错日志,curl 也没有报错。这个就让我很头疼。后来一问运维才知道并发很高。难道是由于并发的原因吗?那为什么连一条错误日志也没有呢?为了证明这个假设,我设计如下实验:1 让运维把A服务器上的日志切成一个文件【一小时一个】2 让PHP去读取文件内容,之后循环投递到B服务器3 查询B服务器上的日志条数测试结果表明,循环发送之后B服务器日志条数和运维切文 阅读全文
posted @ 2014-03-05 21:21 scofi 阅读(454) 评论(0) 推荐(0) 编辑