Re: SELECT ... WHERE ... IN (SELECT ...) -> SELECT ... WHERE (... OR ... )

From: "Alexander M(dot) Pravking" <fduch(at)antar(dot)bryansk(dot)ru>
To: Anton <anton200(at)gmail(dot)com>
Cc: pgsql-ru-general(at)postgresql(dot)org
Subject: Re: SELECT ... WHERE ... IN (SELECT ...) -> SELECT ... WHERE (... OR ... )
Date: 2006-12-05 07:34:07
Message-ID: 20061205073407.GA12175@dyatel.antar.bryansk.ru
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-ru-general

On Tue, 2006-12-05 at 11:47 +0500, Anton wrote:
> Может с этого надо было начать... Словом, потребность есть ВЫБРАТЬ
> ПОСЛЕДНЮЮ ДАТУ (поле collect_time) ИЗ ТАБЛИЦЫ ТРАФИКА (таблица
> n_traffic) ДЛЯ ВСЕХ ЛОГИНОВ (поле login_id) ЗАДАННОГО АККАУНТА (поле
> account_id).

Ммм, если последнюю, тогда уж ORDER BY collect_time DESC :)

> То есть из таблицы n_logins выбрать все login_id которые имеют
> заданный account_id, а потом из таблицы n_traffic выбрать самую
> последнюю дату из всех этих login_id.

Только PG делает выборку в другом порядке :) Сначала ищет все записи в
n_traffic, а потом отсеивает ненужные, для которых не нашлось требуемой
записи в n_logins.

> >Здесь явно неразумный план: выборка из большой таблицы всех (видимо)
> >записей по условию, которое всегда true. Здесь даже seq scan был бы
> >быстрее (ANALYZE давно делали?).
>
> VACUUM FULL ANALYZE делался буквально перед тем как. collect_time НЕ
> ВСЕГДА сравнивается с "1970-01-01 ...", а более чаще с датой начала
> текущего месяца. Но в определенных случаях (некоторые данные
> неизвестны) берется просто тот самый "1970-01-01 ...".
> Однако это дела не меняет, если даже убрать вообще условие с
> collect_time (см. планы внизу для nestloop ON и OFF).

Всё равно фильтр по дате, судя из условий задачи, не настолько сужает
поиск, как фильтр по login_id (одному или нескольким) плюс по дате.
У тебя PG почему-то совсем не хочет сначала искать login_id'ы, а потом
уже по ним -- записи из n_traffic.

> ...
> >порядок JOIN'а вручную. Насчёт восьмёрки вроде проскакивало, что
> >оптимизатор умничает даже в случае явного JOIN, хотя я не уверен, так
> >что можно попробовать и этот вариант.
> см. ниже, видимо это как раз то, о чём ты говоришь.

Нет, я имел в виду вместо
... FROM n_logins, n_traffic
WHERE n_traffic.login_id = n_logins.login_id ...

попробовать поменять порядок JOIN'а:

SELECT collect_time
FROM n_logins l
JOIN n_traffic t USING (login_id)
WHERE l.account_id = '1655'
ORDER BY collect_time LIMIT 1;

--
Fduch M. Pravking

In response to

Browse pgsql-ru-general by date

  From Date Subject
Next Message Alexander M. Pravking 2006-12-05 07:37:41 Re: SELECT ... WHERE ... IN (SELECT ...) ->
Previous Message Anton 2006-12-05 07:01:05 Re: SELECT ... WHERE ... IN (SELECT ...) ->