From: | "A(dot) Kretschmer" <andreas(dot)kretschmer(at)schollglas(dot)com> |
---|---|
To: | pgsql-de-allgemein(at)postgresql(dot)org |
Subject: | Re: langsame "NOT IN" Subquery |
Date: | 2007-07-18 13:21:16 |
Message-ID: | 20070718132116.GF17772@a-kretschmer.de |
Views: | Raw Message | Whole Thread | Download mbox | Resend email |
Thread: | |
Lists: | pgsql-de-allgemein |
am Wed, dem 18.07.2007, um 13:16:54 +0200 mailte Steubesand, Thomas folgendes:
> Hallo zusammen,
>
> folgende Aufgabenstellung:
>
> Vorhanden sind 2 Tabellen mit 200.000 (table1) und
> 150.000 (table2) Datensätzen.
>
> Es sollen ALLE Datensätze aus table1 herausgefunden werden,
> die KEINEN entsprechenden Datensatz in der table2 haben:
>
> SELECT table1.id, ...
> FROM table1
> WHERE
> ...
> table1.id NOT IN (SELECT table2.t1_id FROM table2);
>
> Wenn ich dieses SQL-Kommando absetze, läuft es ziemlich lange -
> länger als 30 Minuten habe ich bisher noch nicht gewartet.
> Warum ist solch ein Kommando so zeitintensiv unter PostgreSQL 8.1.2
EXPLAIN würde Dir hier zeigen, daß es das NOT IN umformt in eine Folge
von einzelnen Vergleichen, welche AND-verknüpft sind. Also etwa 150.000
einzelne Bedingungen.
> (Unix) und unter 8.2.3 (XP)?
>
> Ein
>
> SELECT table1.id FROM table1
> EXCEPT
> SELECT table2.t1_id FROM table2;
>
> benötigt 5 bis 6 Sekunden.
Hier kann der Planner besser erkennen, was Du wirlich willst. Mag sein,
daß das vom Planner doof ist, daß NOT IN (..) so zu handhaben, aber er
macht es halt so. Mag wohl auch daran liegen, daß der Inhalt in der
Klammer nicht zwangsläufig in Tabellenform vorliegen muß sondern als
Aufzählung im SELECT.
Andreas
--
Andreas Kretschmer
Kontakt: Heynitz: 035242/47150, D1: 0160/7141639 (mehr: -> Header)
GnuPG-ID: 0x3FFF606C, privat 0x7F4584DA http://wwwkeys.de.pgp.net
From | Date | Subject | |
---|---|---|---|
Next Message | Thomas Markus | 2007-07-18 13:24:45 | Re: langsame "NOT IN" Subquery |
Previous Message | Rolf Schaufelberger | 2007-07-18 13:19:29 | Re: langsame "NOT IN" Subquery |