From: | Susanne Ebrecht <miracee(at)miracee(dot)de> |
---|---|
To: | "Steubesand, Thomas" <T(dot)Steubesand(at)rz(dot)fh-trier(dot)de> |
Cc: | pgsql-de-allgemein(at)postgresql(dot)org |
Subject: | Re: langsame "NOT IN" Subquery |
Date: | 2007-07-18 13:14:12 |
Message-ID: | 469E1224.6060404@miracee.de |
Views: | Raw Message | Whole Thread | Download mbox | Resend email |
Thread: | |
Lists: | pgsql-de-allgemein |
Hallo Thomas,
Steubesand, Thomas wrote:
> Hallo zusammen,
>
> folgende Aufgabenstellung:
>
> Vorhanden sind 2 Tabellen mit 200.000 (table1) und
> 150.000 (table2) Datensätzen.
>
> Schema:
> CREATE table1
> (
> id SERIAL,
> ...
> PRIMARY KEY(id)
> );
>
> CREATE table2
> (
> ...
> t1_id ÎNTEGER, -- kein foreign key!
> ...
> );
>
> CREATE INDEX i1 ON table2(t1_id);
>
> Es sollen ALLE Datensätze aus table1 herausgefunden werden,
> die KEINEN entsprechenden Datensatz in der table2 haben:
>
> SELECT table1.id, ...
> FROM table1
> WHERE
> ...
> table1.id NOT IN (SELECT table2.t1_id FROM table2);
>
> Wenn ich dieses SQL-Kommando absetze, läuft es ziemlich lange -
> länger als 30 Minuten habe ich bisher noch nicht gewartet.
> Warum ist solch ein Kommando so zeitintensiv unter PostgreSQL 8.1.2
> (Unix) und unter 8.2.3 (XP)?
>
Was sagt denn EXPLAIN ANALYZE zu Deiner Frage?
http://www.cul.de/data/freex22007pr.pdf
Subselects sind generell performancehemmend, weil hier natuerlich erst
die eine Tabelle durchsucht werden muss und dann die andere.
Ein geschickter Join statt eines Subselects würde das ganze schon viel
schneller machen.
SELECT tab1.id, ... FROM tab1 LEFT JOIN tab2 ON tab1.id = tab2.tab1_id
WHERE tab2.tab1_id IS NULL;
Susanne
> Ein
>
> SELECT table1.id FROM table1
> EXCEPT
> SELECT table2.t1_id FROM table2;
>
> benötigt 5 bis 6 Sekunden.
>
> Vielen Dank schon mal für Euere Hilfe
>
> Thomas
>
>
> ---------------------------(end of broadcast)---------------------------
> TIP 5: don't forget to increase your free space map settings
>
--
Susanne Ebrecht,
52066 Aachen, Germany
From | Date | Subject | |
---|---|---|---|
Next Message | Tobias Bußmann | 2007-07-18 13:15:59 | Re: langsame "NOT IN" Subquery |
Previous Message | Steubesand, Thomas | 2007-07-18 11:16:54 | langsame "NOT IN" Subquery |