11 2013 档案

摘要:做完了分表之后,数据库里面的表从8张变成了8000张,我以为谷歌的抓取速度会降低为原来的一半,于是每天看一次谷歌抓取速度,结果实在是太失望了结果发现,分完表之后谷歌抓取等待的时间迅速上升了,对mysql不是很了解,查了一下mysql的一些配置信息,我的数据库默认是innodb,结果发现innodb默认是把所有的表放在一个文件里面,无论这个数据库里面有多少张表,也想起来sqlserver默认也是吧所有的表放在一个文件里面,sqlserver分表的时候自己可以新添加文件组,查了下mysql的配置,mysql 有这么个配置Innodb_file_per_table,不过设置完后必须从新导入一次数据, 阅读全文
posted @ 2013-11-16 20:33 互联网Fans 阅读(4230) 评论(29) 推荐(1)
摘要:1 简单工厂模式,适合建造模式固定的场合,例如计算加减乘除 方便记忆,一个运算基类,四个继承类,有一样的方法,通过swich判断实现那个类。 简单工厂模式,解决的是对象创建的问题 2策略模式,适合算法频繁变动的场合,礼盒打折促销类, 方便记忆,策略模式就是让算法可以相互替换,但是调用的人却看不出有什么变化, 策略模式,解决的是算饭频繁变化,但这种变化有事可以抽象的 3 ... 阅读全文
posted @ 2013-11-10 21:59 互联网Fans 阅读(235) 评论(0) 推荐(0)
摘要:给数据库分表,曾经是个离我很遥远的事情,入行这几年参与过别人主导的分表、分库工作,自己从未操刀,直到我自己的垃圾小站主表10多万记录,相关的其他表30~40万,孱弱的服务器面对谷歌和百度的抓取,导致下载一个页面的时间非常长(PS:谷歌的蜘蛛是我小站的主要用户)。因为我抓取的主要是stackoverflow、微软社区、雅虎问答等和计算机相关的数据库,存储比较简单,分这么几个表1:url表,记录每个问题原始的url地址 10万2:问题内容表,记录问题的主要内容 10万3:答案表;记录问题的答案 20万4:用户信息表 20万5:问题和tag的关系表 30万我存储的时候比较简单,用问题的title 的 阅读全文
posted @ 2013-11-08 21:50 互联网Fans 阅读(5677) 评论(4) 推荐(2)
摘要:根据我浅薄的经验,缓存、iframe、NoTalk 足矣 首先,是缓存,因为这个人人都会使,实施成本低,用了可以明显加快访问速度,降低数据库负担。 但是也存在以下几个缺点: 1:难以监控命中率。 通常的缓存有.NET ... 阅读全文
posted @ 2013-11-02 16:13 互联网Fans 阅读(2963) 评论(28) 推荐(8)