Re: langsame "NOT IN" Subquery

From: Rolf Schaufelberger <rs(at)plusw(dot)de>
To: pgsql-de-allgemein(at)postgresql(dot)org
Subject: Re: langsame "NOT IN" Subquery
Date: 2007-07-18 13:19:29
Message-ID: 200707181519.29993.rs@plusw.de
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-de-allgemein

On Mittwoch 18 Juli 2007, Steubesand, Thomas wrote:
> Hallo zusammen,
>
> folgende Aufgabenstellung:
>
> Vorhanden sind 2 Tabellen mit 200.000 (table1) und
> 150.000 (table2) Datensätzen.
>
> Schema:
> CREATE table1
> (
> id SERIAL,
> ...
> PRIMARY KEY(id)
> );
>
> CREATE table2
> (
> ...
> t1_id ÎNTEGER, -- kein foreign key!
> ...
> );
>
> CREATE INDEX i1 ON table2(t1_id);
>
> Es sollen ALLE Datensätze aus table1 herausgefunden werden,
> die KEINEN entsprechenden Datensatz in der table2 haben:
>
> SELECT table1.id, ...
> FROM table1
> WHERE
> ...
> table1.id NOT IN (SELECT table2.t1_id FROM table2);
>
> Wenn ich dieses SQL-Kommando absetze, läuft es ziemlich lange -
> länger als 30 Minuten habe ich bisher noch nicht gewartet.
> Warum ist solch ein Kommando so zeitintensiv unter PostgreSQL 8.1.2
> (Unix) und unter 8.2.3 (XP)?
>
> Ein
>
> SELECT table1.id FROM table1
> EXCEPT
> SELECT table2.t1_id FROM table2;
>
> benötigt 5 bis 6 Sekunden.
>
> Vielen Dank schon mal für Euere Hilfe
>
> Thomas
>
>
> ---------------------------(end of broadcast)---------------------------
> TIP 5: don't forget to increase your free space map settings

Schreib doch mal ein Explain vor das Statement, dann siehst du wie die DB das
abrbeitet. Alternativ könntest du einen outer join versuchen
select tt1.* from tt1 left outer join tt2 on tt2.tt1_id = tt1.id where
tt2.tt1_id is null;

Rolf Schaufelberger

--
Mit freundlichen Grüßen
Rolf Schaufelberger

plusW
Rolf Schaufelberger
Beim Brünnele 6 Tel. 49 7181 994 35 50
73614 Schorndorf Fax. 49 7181 994 32 75
www.plusw.de
www.mypixler.com
www.imagewriter.de

In response to

Browse pgsql-de-allgemein by date

  From Date Subject
Next Message A. Kretschmer 2007-07-18 13:21:16 Re: langsame "NOT IN" Subquery
Previous Message Tobias Bußmann 2007-07-18 13:15:59 Re: langsame "NOT IN" Subquery