Django小技巧03: 优化数据库查询

#Fast

翻译整理自: simpleisbetterthancomplex.com

本文介绍一个非常简单的技巧, 能够帮助你在使用 Django ORM 时优化数据库查询.

需要注意的是, Django QuerySets 是惰性查询的, 如果使用得当非常适用。

例如, 我们有一个叫做Invoice模型,并执行以下代码:

invoices = Invoice.objects.all()
unpaid_invoices = invoices.filter(status='UNPAID')
<\>Python

此时, Django ORM 还没有触及到数据库,也就是说没有执行操作。当我们调用这个 queryset(unpaid_invoices) 才会真正的执行到数据库查询。通常情况下, 当我们去遍历这个 Queryset 就会发生这种情况, 即 queryset 开始执行。如下面代码所示:

<table>
  <tbody>
  {% for invoice in unpaid_invoices %}
    <tr>
      <td>{{ invoice.id }}</td>
      <td>{{ invoice.description }}</td>
      <td>{{ invoice.status }}</td>
    </tr>
  {% endfor %}
  </tbody>
</table>
<\>Django

上面的代码, 看起来没有什么问题。只会执行一个数据库查询。 但是当您的模型有关系数据字段时, 比如ForeignKey, OneToOneFieldManyToManyField. 上面的查询就会发生变化了。

假设Invoice模型有一个vendor字段是个ForeignKey:

class Invoice(models.Model):
    description = models.CharField(max_length=255)
    status = models.CharField(max_length=10)
    vendor = models.ForeignKey(Vendor)
<\>Python

现在和上面的模板中一样去迭代这个 queyset, 但这次显示了供应商名称,Django ORM将对unpaid_invoices数据集每一条记录执行一次额外的查询.

<table>
  <tbody>
  {% for invoice in unpaid_invoices %}
    <tr>
      <td>{{ invoice.id }}</td>
      <td>{{ invoice.description }}</td>
      <td>{{ invoice.status }}</td>
      <td>{{ invoice.vendor.name }}</td>
    </tr>
  {% endfor %}
  </tbody>
</table>
<\>Django

如果unpaid_invoices数据集有100条记录, 那么将会有101条查询生成。检索invoices所有对象的一条查询, 和每个invoice供应商的一次查询, 共计101条。

当然, 可以使用select_related方法, 来减轻这种不期望的影响,以便在单次数据查询中,检索所有必要的信息。

所以,不要像上面那样过滤未付款的发票,可以这样做:

invoices = Invoice.objects.all()
unpaid_invoices = invoices.select_related('vendor').filter(status='UNPAID')
<\>Python

这样, Django ORM 将会在同一查询中为每个发票检索供应商数据.因此这种情况不需要额外的查询,这样可以为您的应用程序出色的性能提升。

推荐一个可以跟踪数据库查询的调试工具Django Debug Toolbar

阅读更多关于Django QuerySet API的文档. Django Documentation