摘要: 给数据库分表,曾经是个离我很遥远的事情,入行这几年参与过别人主导的分表、分库工作,自己从未操刀,直到我自己的垃圾小站主表10多万记录,相关的其他表30~40万,孱弱的服务器面对谷歌和百度的抓取,导致下载一个页面的时间非常长(PS:谷歌的蜘蛛是我小站的主要用户)。因为我抓取的主要是stackoverflow、微软社区、雅虎问答等和计算机相关的数据库,存储比较简单,分这么几个表1:url表,记录每个问题原始的url地址 10万2:问题内容表,记录问题的主要内容 10万3:答案表;记录问题的答案 20万4:用户信息表 20万5:问题和tag的关系表 30万我存储的时候比较简单,用问题的title 的 阅读全文
posted @ 2013-11-08 21:50 互联网Fans 阅读(5645) 评论(4) 推荐(2) 编辑