摘要: web服务器识别用户的几种方式:1 透过客户端ip来确定:多个用户可能在同一个电脑上使用,不能准备识别2 胖URL:服务器每次在生成URL的时候加入用户的识别码 ,常见就是就是 http://www.test.com/index.php;sessionid=1234563 通过http请求头部client-ip:client-ip并不是http定义的标准头部,并且在存在代理的情况也不会太准确4 通过httpauthentication 机制:web服务器生成304的响应 http/1.1 304 authentication required ,要求客户端输入用户名和密码,不能实现跨站点。并且 阅读全文
posted @ 2012-10-11 22:45 猫叔玩流量 阅读(315) 评论(0) 推荐(0) 编辑
摘要: web机器人要标示机器人 通过http User-Agent进行声明原理:通过root路径->页面中的anchor 递归下去,基本上root页面就是一个网站的首页web机器需要知道那些url已经爬过,由于url不规范,需要先规范化url,比如添加默认端口80,格式化url中的特殊字符用 %XX代替,去掉查询字符串中的#等等web机器人爬去页面主要注意:1 避免陷入环路,比如a包括b,b里面有包括a2 避免被恶意网站陷入死循环,比如动态页面,每爬取一次,重新新生成的动态内容,新的动态页面继续生成动态页面,循环下去3 url连接回路,比如http://www.test.com/index.h 阅读全文
posted @ 2012-10-11 21:31 猫叔玩流量 阅读(281) 评论(0) 推荐(0) 编辑
摘要: 这一几天一直在回顾事务相关的知识,也准备把以前了解皮毛的知识进行一些深入总结,虽然这一些知识并没有用到,但是了解其实现原理还是很有必要的,因为知道了原理,你也能把它实现出来。在上一节事务的编程模型里面,主要说明了三种编程模型,一般情况下,我们都接触的是单一资源的事务,也就是单独对一个数据库进行操作。如果需要跨多个资源保证事务一致性举个例子:在ATM机取钱的时候,需要对用户的账户进行扣款处理,然后发送一条消息给消息服务器(假设消息服务器是用JMS实现的),由消息服务器异步通过短信通知用户。如果用户取款失败,那么消息服务器不应该发送短信给用户。如何保证 用户帐务扣款 和 消息服务器的消息保持一致性 阅读全文
posted @ 2012-10-11 13:09 猫叔玩流量 阅读(10862) 评论(3) 推荐(2) 编辑
摘要: 原文地址http://www.infoq.com/cn/news/2012/10/big-company-disease-1?utm_source=infoq&utm_medium=related_content_link&utm_campaign=relatedContent_news_clkhttp://www.infoq.com/cn/news/2012/10/big-company-disease-2?utm_source=infoq&utm_medium=related_content_link&utm_campaign=relatedContent_ 阅读全文
posted @ 2012-10-11 09:43 猫叔玩流量 阅读(433) 评论(0) 推荐(0) 编辑