Это совпадение, созданное на небесах. Расширение Azure AI позволяет базе данных обращаться к различным сервисам Azure AI, таким как Azure OpenAI. В сочетании с pgvector вы можете выйти далеко за рамки полнотекстового поиска. Давайте узнаем подробности.
База данных Azure Database для PostgreSQL поставляется в двух режимах развертывания: Flexible Server и Single Server. Flexible Server - это полностью управляемая служба баз данных, предназначенная для обеспечения более детального контроля и гибкости функций управления базами данных и настроек конфигурации. Именно эта версия была дополнена новой функциональностью, предлагаемой расширением AzureAI для Postgres, которое напрямую интегрирует базу данных со службами OpenAI в Azure.
Вкратце это означает, что вы можете генерировать текстовые вкрапления с помощью SQL-запросов для вызова обеих служб Azure OpenAI без необходимости отдельного уровня приложений. Вкратце, вкрапления берут кусок текста и создают его числовое представление. Текст с похожим содержанием будет иметь схожие векторы в этом числовом пространстве. Это позволяет нам сравнивать эти векторы и находить похожие фрагменты текста.
Но одно дело - генерировать вкрапления, а другое - хранить их. Сначала нужно преобразовать текст в эмбеддинги, а затем загрузить их в хранилище векторов. Именно здесь на помощь приходит pg_vector, позволяющий заменить любой специализированный векторный движок на просто Postgres, чтобы вы могли хранить эмбеддинги вместе с данными JSON или отношениями под одной крышей.
Таким образом, хотя с помощью azure_ai вы генерируете эмбеддинги, вы все равно захотите использовать pgvector для хранения эмбеддингов (и вычислений расстояний) в Azure Database for PostgreSQL. Эта возможность позволит вам выполнять такие операции, как семантический поиск, рекомендации или обнаружение аномалий, быстрее и проще, чем когда-либо прежде - и без значительных изменений в приложениях.
Семантический поиск выходит за рамки возможностей полнотекстового поиска, поддерживаемых Postgres, и кратко объясняется в замечательном ключевом докладе, представленном на PASS Data Summit 2023 Клэр Джордано. В докладе рассказывается о том, как можно повысить релевантность результатов поиска на сайте с рецептами с помощью Azure OpenAI.
В начале доклада показано, как получить результаты с помощью обычного оператора LIKE в простом поиске по ключевому слову, ища рецепты с ингредиентом Avocado, и как можно получить гораздо лучшие результаты с помощью полнотекстового поиска Postgres. Однако даже fts не может ответить на вопросы типа "Дайте мне рецепты с высоким содержанием белка", поскольку эта информация никак не заложена в базу данных. Однако с помощью azure_ai вы можете обратиться к сервисам Azure OpenAI и сделать такой запрос, чтобы получить список с рецептами блюд с высоким содержанием белка, хранящихся в вашей базе данных!
Это выходит за рамки простого поиска. Другие возможности, доступные благодаря новому расширению, - это возможность вызывать службы Azure Language, чтобы, например, проводить анализ настроений прямо из базы данных. На презентации было показано, как это сделать на примере отзывов о рецептах, чтобы понять, какие из них были положительными, а какие отрицательными. Среди других возможностей - определение языка, на котором написан текст, или редактирование PII при извлечении данных из базы.
Суть в том, что благодаря возможности расширения Postgres без ущерба для ядра, Postgres действительно открыт для инноваций; а azure_ai в сочетании с pgvector расширяют Postgres до невиданных ранее возможностей. Воображению нет предела.
Понравилась новость? Тогда не забудь оставить свой комментарий.
А так же, добавь наш сайт в закладки (нажми Ctrl+D), не теряй нас.
Комментарии