07 2013 档案

摘要:git使用记录一、windows下git服务器的安装http://www.cnblogs.com/ytliyang/archive/2012/02/12/2347987.html二、git使用入门常用命令简介http://rogerdudler.github.io/git-guide/index.z... 阅读全文
posted @ 2013-07-31 11:13 惡盈好謙 阅读(2214) 评论(0) 推荐(0) 编辑
摘要:在这个世界上,同一个事物,由于种种原因,在称呼上会存在细微的差别。比如“紫荆花酒店”和“紫荆花大酒店”指的是相同的一家酒店,但是在不同的OTA网站,或者酒店收录网站,可能使用的是不同名字。因此,在使用爬虫做酒店的数据库时,对酒店的去重就是一项很重要的任务。可以通过名字、地址和坐标进行酒店唯一性的判断根据名字和地址进行去重,较好的方式是使用simhash的方式进行名称的近似匹配(参考http://www.cnblogs.com/linecong/archive/2010/08/28/simhash.html)在这之后可以继续使用所在的坐标进行去重 阅读全文
posted @ 2013-07-29 19:00 惡盈好謙 阅读(351) 评论(0) 推荐(0) 编辑
摘要:环境vs2010,.net1、使用wsHttpBinding和basicHttpBinding对于loadrunner和是soapui会产生影响。在使用wsHttpBinding作为WCF的绑定(bindings)说明时,产生的WSDL协议和basicHttpBinding产生的协议不同。basicHttpBinding产生的是标准的webservice协议。使用wsHttpBinding时,将会导致loadrunner和soapui的调用发生错误2、在使用VS2010编程的时候,一定不要使用“Service References”进行WCF的服务添加,因为会在本地生成服务调用代理。一旦服务的 阅读全文
posted @ 2013-07-17 09:36 惡盈好謙 阅读(173) 评论(0) 推荐(0) 编辑
摘要:1、有限数据的同构运行2、对于无限数据,无限个有限数据的同构运行3、同构,数据相同,运行环境相同,最终目标得出的结果相同根据1,3,需要一个组件,知道范围内的同构节点,并使这些节点保持一致根据2,需要一个管理集群的组件,能够将数据判定为在哪个集群中应用 阅读全文
posted @ 2013-07-16 09:18 惡盈好謙 阅读(156) 评论(0) 推荐(0) 编辑