Skip site navigation (1) Skip section navigation (2)

langsame "NOT IN" Subquery

From: "Steubesand, Thomas" <T(dot)Steubesand(at)rz(dot)fh-trier(dot)de>
To: <pgsql-de-allgemein(at)postgresql(dot)org>
Subject: langsame "NOT IN" Subquery
Date: 2007-07-18 11:16:54
Message-ID: DCD6FA3E63F1F943BA333264400A96D6014F9D37@jabba.fh-trier.de (view raw or flat)
Thread:
Lists: pgsql-de-allgemein
Hallo zusammen,

folgende Aufgabenstellung:

Vorhanden sind 2 Tabellen mit 200.000 (table1) und 
150.000 (table2) Datensätzen.

Schema:
CREATE table1
(
	id		SERIAL,
	...
	PRIMARY KEY(id)
);

CREATE table2
(
	...
	t1_id		ÎNTEGER,	-- kein foreign key!
	...
);

CREATE INDEX i1 ON table2(t1_id);

Es sollen ALLE Datensätze aus table1 herausgefunden werden,
die KEINEN entsprechenden Datensatz in der table2 haben:

SELECT table1.id, ...
  FROM table1 
  WHERE 
    ...
    table1.id NOT IN (SELECT table2.t1_id FROM table2);

Wenn ich dieses SQL-Kommando absetze, läuft es ziemlich lange -
länger als 30 Minuten habe ich bisher noch nicht gewartet.
Warum ist solch ein Kommando so zeitintensiv unter PostgreSQL 8.1.2 
(Unix) und unter 8.2.3 (XP)?

Ein 

SELECT table1.id FROM table1 
EXCEPT
SELECT table2.t1_id FROM table2;

benötigt 5 bis 6 Sekunden.

Vielen Dank schon mal für Euere Hilfe

Thomas


Responses

pgsql-de-allgemein by date

Next:From: Susanne EbrechtDate: 2007-07-18 13:14:12
Subject: Re: langsame "NOT IN" Subquery
Previous:From: Oliver BaerDate: 2007-07-18 10:30:26
Subject: Re: Komplette Datenbank auf anderen Rechner

Privacy Policy | About PostgreSQL
Copyright © 1996-2014 The PostgreSQL Global Development Group