Создание GIST индексам для сравнения картинок (intarray)

From: "leopard_ne(at)inbox(dot)ru" <leopard_ne(at)inbox(dot)ru>
To: pgsql-ru-general(at)postgresql(dot)org
Subject: Создание GIST индексам для сравнения картинок (intarray)
Date: 2011-02-06 11:05:38
Message-ID: 4D4E8082.6090601@inbox.ru
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-ru-general

Добрый день. Прошу совета у сообщества.
Есть простой метод сравнения картинок -
http://leopard.in.ua/2010/12/09/bystroe-sravnenie-izobrazhenij-s-pomoshhyu-rubyphp-i-postgresql/

В таблицу записывается в поле типа integer[] масив с числами (пусть поле
будет "diff_array" в таблице "some_table"). Далее происходит такой метод
поиска похожих картинок (пусть есть массив картинки "{1,3,4,5,...}"
размером 225, как в статье)

Select some_table.*, round((icount(some_table.diff_array::int[] &
'{1,3,4,5,...}'::int[])::numeric / (225)::numeric) * 100, 2) as
simillar_percentes FROM some_table WHERE
round((icount(some_table.diff_array::int[] &
'{1,3,4,5,...}'::int[])::numeric / (225)::numeric) * 100, 2) >= 60 AND
id != img_id ORDER BY round((icount(some_table.diff_array::int[] &
'{1,3,4,5,...}'::int[])::numeric / (225)::numeric) * 100, 2) DESC LIMIT 10

Проблемный кусок, который используется 3 раза тут в запросе:

round((icount(some_table.diff_array::int[] &
'{1,3,4,5,...}'::int[])::numeric / (225)::numeric) * 100, 2)

Хотелось бы как то по такому условию создать индекс, поскольку скорость
падает (индекс gist__intbig_ops добавлял, скорость все равно не
увеличивается).
Для простоты вычисления размера массива (чтобы не задать 225 = 15*15
матрица), можно сделать так функцию:

round((icount(some_table.diff_array::int[] &
'{1,3,4,5,...}'::int[])::numeric /
((icount(some_table.diff_array::int[]) + icount('{1,3,4,5,...}'::int[]))
/ 2)::numeric) * 100, 2)

Документацию
http://www.sai.msu.su/~megera/postgres/talks/gist_tutorial.html
<http://www.sai.msu.su/%7Emegera/postgres/talks/gist_tutorial.html> я
прочитал, но не работаю на C, и поэтому, возникло еще больше вопросов,
как все таки мне можно создать индекс на подобное условие. Буду
благодарен за любые советы или помощь.

Responses

Browse pgsql-ru-general by date

  From Date Subject
Next Message Oleg Bartunov 2011-02-06 12:55:42 Re: Создание GIST индексам для сравнения картинок (intarray)
Previous Message Mihail Nasedkin 2010-12-13 06:47:51 Re: [pgsql-ru-general] Re: Агрегация массивов