MySQL快速查询两个不同的索引,但组合成一个查询速度很慢.为什么?

我有一张200万行的表.我有两个索引(状态,性别)和(生日).

我觉得奇怪的是这个查询需要3.6秒或更长时间
QUERY N°1

SELECT COUNT(*) FROM ts_user_core
WHERE birthday BETWEEN '1980-01-01' AND '1985-01-01'
    AND status='ok' AND gender='female';

同样的:
QUERY N°2

SELECT COUNT(*) FROM ts_user_core
WHERE status='ok' AND gender='female'
    AND birthday between '1980-01-01' AND '1985-01-01';

虽然此查询需要0.140秒
QUERY N°3

select count(*) from ts_user_core where (birthday between '1990-01-01' and '2000-01-01');

此查询也需要0.2秒
QUERY N°4

select count(*) from ts_user_core where status='ok' and gender='female'

我希望第一个查询更快,这种行为怎么可能?我无法处理这个查询这么多时间.

这里的结果是:

我知道我可以添加一个包含3列的新索引,但有没有办法在不为每个where子句添加索引的情况下获得更快的查询?

谢谢你的建议

最佳答案

is there a way to optimize the query without adding an index for every possible where clause?

是的,有点.但它需要了解INDEX的工作原理.

让我们看看你目前提供的所有SELECT.

>要为SELECT构建最佳索引,请从WHERE子句中的所有=常量项开始.将这些列以任何顺序放入索引中.这给了我们INDEX(状态,性别,……)或INDEX(性别,状态……),但它们之间没有任何决定(尚未).
>添加一个范围或所有ORDER BY.在你的第一个SELECT中,那将是生日.现在我们有INDEX(状态,性别,生日)或INDEX(性别,状态,生日).对于前两个SELECT,这些中的任何一个都是“最佳”.

这些索引对于#4非常有效:从ts_user_core中选择count(*),其中status =’ok’,gender =’female’.所以不需要额外的索引.

现在,让我们继续#3:从ts_user_core中选择count(*),其中(‘1990-01-01’和’2000-01-01’之间的生日);

>它不能使用我们到目前为止的索引.
> INDEX(生日)基本上是唯一的选择.

现在,假设我们也有…… WHERE status =’foo’; (没有性别).这将迫使我们选择INDEX(状态,性别,生日)而不是它的变体.

结果:2个好的索引来处理所有5个选择:

INDEX(status, gender, birthday)
INDEX(birthday)

建议:如果最终有超过5个INDEX或其中包含超过5列的索引,则缩短某些索引可能是明智之举.事情变得非常模糊.如果您想向我提供十几个“现实”索引,我会引导您完成它.

其他评论说明:

>对于计时,运行每个查询两次并第二次 – 以避免缓存效果. (你的3.6 vs 0.140味道就像缓存索引一样.)
>对于计时,请关闭查询缓存或使用SQL_NO_CACHE.
>优化器很少在单个查询中使用两个索引.
>向我们展示EXPLAIN平原;我们可以帮你读一读.
>在多个INDEX中选择的额外时间通常是值得的.
>如果您有INDEX(a,b,c),则不需要INDEX(a,b).

转载注明原文:MySQL快速查询两个不同的索引,但组合成一个查询速度很慢.为什么? - 代码日志