sql – 用于超快速查询的数据库

我们有一个300 Gb数据阵列,我们希望尽快查询。传统的SQL数据库(特别是SQL Server)无法像我们需要的那样有效地处理这个卷(比如在10秒以内在where子句中执行10-20个条件的选择),所以我正在调查这个问题的其他解决方案。

我一直在读约NoSQL,这整个事情看起来很有希望,但我宁愿听到那些在现实生活中使用它的人。

你可以在这里建议

编辑以澄清我们以后的事情。

我们是一家开发应用程序的公司,用户可以搜索旅游并执行所述旅行的预订,并用他们的塑料卡支付费用。这整个事情肯定是与俄罗斯有关的,所以忍受我。

当用户登录网站时,会收到与此类似的表单:

alt text http://queenbee.alponline.ru/searchform.png

在这里,用户选择她离开的地点,以及她去哪里,日期,持续时间等等。

点击“搜索”后,请求发送到我们的DB服务器,无法处理这样的负载:查询包括各种参数。分片也不行。

所以我以后是一种伪数据库,它可以做闪电快速查询。

如果您想要进行报告或分析的特殊查询,那么您最好使用可以使用现成的报表工具进行优化的东西。否则,你很可能会发现自己被拖下来,写出很少的报告程序来查询数据。这是对NoSQL类型数据库的打击,但根据您的具体情况,它可能是或不是一个问题。

300GB不应该超越现代RDBMS平台的能力,甚至是MS SQL Server。此类型的大型数据库查询的其他选项有:

>查看是否可以使用SSAS多维数据集和聚合来减轻查询性能问题。基于使用的优化可能会使您获得足够的性能,而无需获得另一个数据库系统。 SSAS还可以在无共享配置中使用,允许您使用直接连接磁盘对具有相对便宜的服务器集群进行查询。如果您这样做,请查看前端ProClarity。
> Sybase IQ是一种RDBMS平台,它使用针对报表查询进行优化的底层数据结构。它的优点是可以很好的与各种常规的报告工具进行比较。存在这种类型的其他几个系统,例如Red Brick,Teradata或Greenplum(使用PostgreSQL的修改版本)。对这些系统的主要打击是它们不是正确的大众市场项目,而且可能相当昂贵。
> Microsoft有一个无共享版本的SQL Server在管道中,您可以使用它。不过他们把它绑定到第三方硬件制造商,所以你只能用专门的硬件(而且昂贵的硬件)来获得它。
>寻找使用聚合数据构建数据集市的机会,以减少部分查询的数量。
看看调整你的硬件。直接连接SAS阵列和RAID控制器可以很快地通过表扫描中使用的排序流式I / O。如果您通过大量镜像对分区表,您可以获得非常快的流式传输性能 – 轻松实现SAS通道饱和。实际上,如果您想要从I / O子系统获得10-20GB /秒您描述的性能目标,并且可以在不使用真正异乎寻常的硬件的情况下进行此操作。

http://stackoverflow.com/questions/2229420/database-for-super-fast-querying

本站文章除注明转载外,均为本站原创或编译
转载请明显位置注明出处:sql – 用于超快速查询的数据库