MySQLi性能,多个(单独的)查询与子查询


MySQLi performance, multiple (separate) queries vs subqueries

我需要计算不同(!)表中的行数,并将结果保存为某种统计数据。这个脚本非常简单,可以按预期工作,但我想知道是否最好使用一个带有8个子查询的单个查询,或者我是否应该使用单独的8个查询,或者是否有更好、更快、更高级的解决方案。。。

我将MySQLi与准备好的语句一起使用,因此单个查询可能如下所示:

$sql = 'SELECT
            (SELECT COUNT(cat1_id) FROM `cat1`),
            (SELECT COUNT(cat2_id) FROM `cat2`),
            (SELECT COUNT(cat2_id) FROM `cat2` WHERE `date` >= DATE(NOW())),
            (SELECT COUNT(cat3_id) FROM `cat3`),
            (SELECT COUNT(cat4_id) FROM `cat4`),
            (SELECT COUNT(cat5_id) FROM `cat5`),
            (SELECT COUNT(cat6_id) FROM `cat6`),
            (SELECT COUNT(cat7_id) FROM `cat7`)';
$stmt = $db->prepare($sql);
$stmt->execute();
$stmt->bind_result($var1, $var2, $var3, $var4, $var5, $var6, $var7, $var8);
$stmt->fetch();
$stmt->free_result();
$stmt->close();

而单独的查询看起来是这样的(x 8):

$sql = 'SELECT
            COUNT(cat1_id)
        FROM
            `cat1`';
$stmt = $db->prepare($sql);
$stmt->execute();
$stmt->bind_result($var1);
$stmt->fetch();
$stmt->free_result();
$stmt->close();

那么,与这种查询(例如统计信息、计数器..)相关的哪个更快或"更好的风格"

我倾向于尽可能将查询放入FROM而不是SELECT。在这个例子中,它需要表之间的交叉连接:

select c1.val, c2.val . . .
from (select count(cat1_id) as val from cat1) c1 cross join
     (select count(cat2_id as val from cat2) c2 cross join
     . . .

性能应该相同。然而,优势出现在您的cat2表中:

select c1.val, c2.val, c2.valnow, . . .
from (select count(cat1_id) as val from cat1) c1 cross join
     (select count(cat2_id) as val
             count(case when date >= date(now()) then cat2_id end)
      from cat2
     ) c2 cross join
     . . .

在这里,您不必扫描两次表就可以获得两个值,从而真正节省开支。当您意识到可能需要修改查询以返回多个值时,这也会有所帮助。

我相信交叉连接和选择中选择将具有相同的性能特征。真正确定的唯一方法是测试不同的版本。

更好的方法是只使用一个查询,因为与数据库只有一个连接,而不是,如果使用多个查询,则与数据库有多个连接,这个过程包括:连接和断开,而且速度更慢。

为了跟进您的评论,这里有一个使用我的一个DB的示例。在这里使用事先准备好的声明不会给你带来任何好处。这个多查询实际上只对D/B引擎执行一个RPC。所有其他调用都是PHP运行时系统的本地调用。

$db = new mysqli('localhost', 'user', 'password', 'blog');
$table  = explode( ' ', 'articles banned comments config language members messages photo_albums photos');
foreach( $table as $t ) {
   $sql[] = "select count(*) as count from blog_$t";
}
if ($db->multi_query( implode(';',$sql) )) {
  foreach( $table as $t ) {
    if  ( ($rs  = $db->store_result() ) &&
          ($row = $rs->fetch_row()    ) ) {
       $result[$t] = $row[0];
       $rs->free();
       $db->next_result(); // you must execute one per result set
    }
  }
}
$db->close();
var_dump( $result );

出于兴趣,我做了一个strace,相关的四行是

16:54:09.894296 write(4, "'211'1'0'0'3select count(*) as count fr"..., 397) = 397
16:54:09.895264 read(4, "'1'0'0'1'1'33'0'0'2'3def'0'0'0'5count'0'f?'0'25'0'0'0'10'201"..., 16384) = 544
16:54:09.896090 write(4, "'1'0'0'0'1", 5) = 5
16:54:09.896192 shutdown(4, 2 /* send and receive */) = 0

查询和对MySQLd进程的响应之间大约有1毫秒(这是因为这是在localhost上,结果在其查询缓存BTW中)。。0.8毫秒后执行DB关闭。这是在我4岁大的笔记本电脑上。

关于TerryE的例子和使用multi_query(!)的建议,我查看了手册并更改了脚本以满足我的需求。。最后我得到了一个看起来像这样的解决方案:

$sql  = 'SELECT COUNT(cat1_id) as `cat1` FROM `cat1`;';
$sql .= 'SELECT COUNT(cat2_id) as `cat2` FROM `cat2`;';
$sql .= 'SELECT COUNT(cat2_id) as `cat2_b` FROM `cat2` WHERE `date` >= DATE(NOW());';
$sql .= 'SELECT COUNT(cat3_id) as `cat3` FROM `cat3`;';
$sql .= 'SELECT COUNT(cat4_id) as `cat4` FROM `cat4`;';
$sql .= 'SELECT COUNT(cat5_id) as `cat5` FROM `cat5`;';
$sql .= 'SELECT COUNT(cat6_id) as `cat6` FROM `cat6`;';
$sql .= 'SELECT COUNT(cat7_id) as `cat7` FROM `cat7`;';
if ($db->multi_query($sql))
{ 
    do
    {
        if ($stmt = $db->store_result())
        {
            while ($row = $stmt->fetch_assoc())
            {
                foreach ($row as $key => $value)
                {
                    $count[$key] = $value;
                }
            }
            $stmt->free_result();
        }
    } while ($db->more_results() && $db->next_result());
}

TerryE的例子有一些不同,但结果是一样的。我知道开头有7行几乎相同,但只要我需要WHERE子句或其他内容,我就更喜欢这个解决方案,而不是foreach循环,在foreach循环中,我需要手动添加查询或使用if { ... }的异常。。。

在我看来,我的解决方案应该没有问题,或者我错过了什么?