随笔 - 55 文章 - 0 评论 - 452 阅读 - 60539

10亿记录的分区讨论，高手进

我们做的是一个问卷调查系统，每天新增的数据量在300万~500万（答卷表），总数据量已经接近10亿。

答卷表结构：

QID 问卷ID

JID 参与ID

TID 题目ID

AID 答案ID

已经用sql server针对QID做了分区，但是服务器还是有点扛不住。

因为数据经常需要做统计分析（统计每个选项被选择了多少次），同时又会被不断的写入。

所以考虑将历史数据转移到另一个服务器上。

暂定的方案是每天晚上执行作业，将3个月以前的记录移动到历史库里面。（历史库基本上用于统计分析）

后续会考虑用sql server 发布与订阅的方式来进行读写分离。

不知道大家有没有更好的方案？

posted on 2012-05-22 09:54 Ray Wu 阅读(1078) 评论(4) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· Linux系列：如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列（二）：开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识（上）

阅读排行：
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布：重大改进与新特性概览！
· AI与.NET技术实操系列（二）：开始使用ML.NET
· 单线程的Redis速度为什么快？
· Pantheons：用 TypeScript 打造主流大模型对话的一站式集成库

一直在做的一个

问卷调查

网站：问卷星 ，肯请大家多提点意见，多谢！

昵称： Ray Wu
园龄： 18年9个月
粉丝： 31
关注： 69

<

2012年5月

>

日

一

二

三

四

五

六

29

30

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

随笔分类 (37)

随笔档案 (54)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:非常怪异的服务器网络问题，请有经验的朋友帮忙看下
貌似你这问题已经被博客园团队解决了，根本原因是 Xen 的 Spinlock 中的壹個 BUG 引起的。
--Bairrfhoinn
2. Re:asp.net高性能之路：无缝切换HttpRuntime.Cache与Memcached，附代码
东西不错啊，有例子提供就更好了。
--Waters
3. Re:10亿记录的分区讨论，高手进
@ 吴峰嗯非常感谢你的回复。我现在是考虑将统计结果作为XML保存到磁盘去。这样之前的问卷基本上不会再有答卷增加，统计结果以后可以直接从磁盘读取。统计结果写到内存去怕不保险。...
--Ray Wu
4. Re:10亿记录的分区讨论，高手进
@ Ray Wu如果不用按被调查者的一些属性统计的话，加个表:QID 问卷IDTID 题目IDAID 答案IDCount 选择次数如果数据真的很大,不能承受多这点的读写，就把QID 问卷ID，TID ...
--吴峰
5. Re:10亿记录的分区讨论，高手进
@ 吴峰我需要按问卷进行统计，统计每道题的选项被选择的次数，如有多少用户选择了男性，有多少用户选择了女性。...
--Ray Wu