Расширения, подобные pgai, ориентированы на "инженеров ИИ" - новую категорию разработчиков, которые, в отличие от исследователей, занимаются практическим применением ИИ (моделей, инструментов и API) для создания программного обеспечения.
Эти инженеры не хотят покидать свои любимые инструменты ради других инструментов, предназначенных для ИИ. Замените слово "инструмент" на Postgres, и вы поймете, к чему это приведет.
В статье "Azure AI And Pgvector Run Generative AI Directly On Postgres" мы наблюдали именно такой случай. Расширение Azure AI позволяет базе данных обращаться к различным службам Azure AI, таким как Azure OpenAI.
Вкратце это означает, что вы можете генерировать текстовые вкрапления с помощью SQL-запросов для вызова служб Azure OpenAI, не нуждаясь в отдельном слое приложения. Речь идет о том, чтобы облегчить жизнь разработчика, переложив нагрузку по машинному обучению на базу данных. То есть вы получаете возможность запускать ML-модели на ваших живых данных, не покидая базы данных.
Новое расширение pgai с открытым исходным кодом от Timescale именно это и делает. Оно приближает встраивание и генерацию моделей к базе данных, делая PostgreSQL еще лучшей базой данных для приложений ИИ, удовлетворяя потребности инженеров ИИ, как говорится в официальном анонсе:
Мы разговаривали с клиентом Timescale, которому было поручено создать приложение RAG в его компании. У этого инженера были десятилетия опыта работы с базами данных и языком Си, но он жаловался нам, что не может освоить Python, чтобы быстро создать доказательство концепции (PoC) для проверки основной идеи. "Я бы хотел делать все это на SQL", - часто слышали мы от этого и многих других инженеров, с которыми мы общались, что в итоге и послужило толчком к созданию pgai.
Желание исполнено!
Теперь с помощью pgai вы можете выполнять следующие действия непосредственно из PostgreSQL в SQL-запросе:
- Создавать вкрапления для ваших данных.
- Получение завершений чатов LLM из таких моделей, как OpenAI GPT4o и Llama 3.
- Генерировать ответы для таких моделей, как Ollama.
- Проанализируйте свои данные и упростите такие варианты использования, как классификация, обобщение и обогащение данных на основе существующих реляционных данных в PostgreSQL.
Например, завершение чата для возврата содержимого в виде текста из определенного сообщения:

Возвращаемые данные выглядят следующим образом:

На Github-репозитории расширения можно найти множество примеров для начала работы, например, использование pgai с OpenAI.
Первоначальный выпуск pgai поддерживает создание вкраплений OpenAI и получение завершений чатов OpenAI из таких моделей, как GPT4o, непосредственно из вашей базы данных PostgreSQL. В будущем планируется добавить поддержку других моделей, таких как Claude и Cohere.
На этом этапе я хотел бы отметить, что существует еще одно расширение, PostgresML, которое имеет очень похожую, если не ту же самую цель. Как мы уже рассматривали в статье "PostgresML - Bring Your ML Workload To The Database", PostgresML - это расширение машинного обучения для PostgreSQL, которое позволяет выполнять обучение и выводы на текстовых и табличных данных с помощью SQL-запросов. Поэтому обязательно ознакомьтесь с этой статьей, чтобы понять, какое из этих двух расширений лучше всего подходит для ваших целей.
Однако суть в том, что с помощью подобных расширений вы можете использовать PostgreSQL для ИИ, не выходя за рамки своих возможностей. Инженеры ИИ ликуют!
Понравилась новость? Тогда не забудь оставить свой комментарий.
А так же, добавь наш сайт в закладки (нажми Ctrl+D), не теряй нас.
Комментарии