Re:

From: Konstantin Gerasimenko <kred(at)gmx(dot)net>
To: pgsql-ru-general(at)postgresql(dot)org
Subject: Re:
Date: 2015-03-11 18:24:57
Message-ID: 55008879.9050804@gmx.net
Views: Whole Thread | Raw Message | Download mbox | Resend email
Thread:
Lists: pgsql-ru-general

11.03.2015 05:56, Dmitry E. Oboukhov пишет:
> очень сомнительный совет. если на постгре такая задача отлично
> решается, то хадуп потребует где-то x20 ресурсов железных при том что
> только теоретически будет масштабируем. PS: у нас подобная задача:
> собираем координаты с тысяч устройств, но передают они их не раз в
> секунду а раз в 10 секунд (разница непринципиальная). поставили перед
> постгрисом аггрегатор (демончик) который либо ждет 10 секунд и
> сбрасывает данные в постгрис либо ждет накопления 1000 точек и так же
> льет. в итоге сейчас постгриска в контейнере OpenVZ на одном CPU
> вполне собирает за день где-то 2-4гига точек и при этом отвечает
> быстро на вопрос "дай мне ближайших к заданной" и отвечает
> относительно быстро на вопрос "дай мне трек машинки XXX со времени A
> по время B" партицируем тупо по датам: новый день - новая партиция.

Дмитрий у вас записей по максимуму 1000*6*60*24*365*3=9.460.800.000 (9.5
миллиарда.)

>Есть 5000 устройств присылающих информация примерное 1 раз в секунду.
>Хранить информацию в доступном резерве надо около 3-х лет.

5000*1*24*60*60*365*3 = 473.040.000.000 (473 миллиарда.)

Мне кажется разница видна не вооруженным взглядом.
К тому же предположение что потребуется х20 ресурсов как то ... слишком
пессимистически рассчитано.
На хадуп понадобиться минимум три сервера остальное точно по желанию, в
варианте с постгрестом
понадобиться минимум два мощных сервера или мы все надеемся что один
сервак никогда не сломается ?

Вы привели только два запроса к данным и сразу намекая что такой то
запрос "отвечает относительно быстро", а
сколько у вас рассчитываюся более сложные запросы ? а есть какая то
аналитика по данным или она не входит в задачу ?

Думаю дальше обсуждать не стоит.

ЗЫ делайте кластеризацию Ваших партиций по индексу "машинки_ид" и тогда
Ваш последний запрос тоже будет мухой рассчитываться.

In response to

  • Re: at 2015-03-11 04:56:45 from Dmitry E. Oboukhov

Responses

  • Re: at 2015-03-12 20:24:15 from Dmitry E. Oboukhov

Browse pgsql-ru-general by date

  From Date Subject
Next Message Dmitry E. Oboukhov 2015-03-12 20:24:15 Re:
Previous Message Dmitry E. Oboukhov 2015-03-11 04:56:45 Re: