【转】如何设计或优化千万级别的大表提问的统一解答
[文章作者:金官丁 转载请注明原文出处: http://www.itpub.net/thread-1451464-1-1.html ]
知呼或ITPUB论坛上的提问:如何设计或优化千万级别的大表?此外无其他信息,个人觉得这个话题有点范,就只好简单说下该如何做,对于一个存储设计,必须考虑业务特点,收集的信息如下
知呼或ITPUB论坛上的提问:如何设计或优化千万级别的大表?此外无其他信息,个人觉得这个话题有点范,就只好简单说下该如何做,对于一个存储设计,必须考虑业务特点,收集的信息如下:
1)数据的容量:1-3年内会大概多少条数据,每条数据大概多少字节;
2)数据项:是否有大字段,那些字段的值是否经常被更新;
3)数据查询SQL条件:哪些数据项的列名称经常出现在WHERE、GROUP BY、ORDER BY子句中等;
4)数据更新类SQL条件:有多少列经常出现UPDATE或DELETE 的WHERE子句中;
5)SQL量的统计比,如:SELECT:UPDATE+DELETE:INSERT=多少?
6)预计大表及相关联的SQL,每天总的执行量在何数量级?
7)表中的数据:更新为主的业务 还是 查询为主的业务
8)打算采用什么数据库物理服务器,以及数据库服务器架构?
9)并发如何?
10)存储引擎选择InnoDB还是MyISAM?
大致明白以上10个问题,至于如何设计此类的大表,应该什么都清楚了!
至于优化若是指创建好的表,不能变动表结构的话,那建议InnoDB引擎,多利用点内存,减轻磁盘IO负载,因为IO往往是数据库服务器的瓶颈
另外对优化索引结构去解决性能问题的话,建议优先考虑修改类SQL语句,使他们更快些,不得已只靠索引组织结构的方式,当然此话前提是,索引已经创建的非常好,若是读为主,可以考虑打开query_cache,以及调整一些参数值:sort_buffer_size,read_buffer_size,read_rnd_buffer_size,join_buffer_size
我来说两句: