Pgai переносит вашу рабочую нагрузку ML в базу данных

Расширения, подобные pgai, ориентированы на "инженеров ИИ" - новую категорию разработчиков, которые, в отличие от исследователей, занимаются практическим применением ИИ (моделей, инструментов и API) для создания программного обеспечения.

Эти инженеры не хотят покидать свои любимые инструменты ради других инструментов, предназначенных для ИИ. Замените слово "инструмент" на Postgres, и вы поймете, к чему это приведет.

В статье "Azure AI And Pgvector Run Generative AI Directly On Postgres" мы наблюдали именно такой случай. Расширение Azure AI позволяет базе данных обращаться к различным службам Azure AI, таким как Azure OpenAI.

Вкратце это означает, что вы можете генерировать текстовые вкрапления с помощью SQL-запросов для вызова служб Azure OpenAI, не нуждаясь в отдельном слое приложения. Речь идет о том, чтобы облегчить жизнь разработчика, переложив нагрузку по машинному обучению на базу данных. То есть вы получаете возможность запускать ML-модели на ваших живых данных, не покидая базы данных.

Новое расширение pgai с открытым исходным кодом от Timescale именно это и делает. Оно приближает встраивание и генерацию моделей к базе данных, делая PostgreSQL еще лучшей базой данных для приложений ИИ, удовлетворяя потребности инженеров ИИ, как говорится в официальном анонсе:

Мы разговаривали с клиентом Timescale, которому было поручено создать приложение RAG в его компании. У этого инженера были десятилетия опыта работы с базами данных и языком Си, но он жаловался нам, что не может освоить Python, чтобы быстро создать доказательство концепции (PoC) для проверки основной идеи. "Я бы хотел делать все это на SQL", - часто слышали мы от этого и многих других инженеров, с которыми мы общались, что в итоге и послужило толчком к созданию pgai.

Желание исполнено!

Теперь с помощью pgai вы можете выполнять следующие действия непосредственно из PostgreSQL в SQL-запросе:

  • Создавать вкрапления для ваших данных.
  • Получение завершений чатов LLM из таких моделей, как OpenAI GPT4o и Llama 3.
  • Генерировать ответы для таких моделей, как Ollama.
  • Проанализируйте свои данные и упростите такие варианты использования, как классификация, обобщение и обогащение данных на основе существующих реляционных данных в PostgreSQL.

Например, завершение чата для возврата содержимого в виде текста из определенного сообщения:

Возвращаемые данные выглядят следующим образом:

На Github-репозитории расширения можно найти множество примеров для начала работы, например, использование pgai с OpenAI.

Первоначальный выпуск pgai поддерживает создание вкраплений OpenAI и получение завершений чатов OpenAI из таких моделей, как GPT4o, непосредственно из вашей базы данных PostgreSQL. В будущем планируется добавить поддержку других моделей, таких как Claude и Cohere.

На этом этапе я хотел бы отметить, что существует еще одно расширение, PostgresML, которое имеет очень похожую, если не ту же самую цель. Как мы уже рассматривали в статье "PostgresML - Bring Your ML Workload To The Database", PostgresML - это расширение машинного обучения для PostgreSQL, которое позволяет выполнять обучение и выводы на текстовых и табличных данных с помощью SQL-запросов. Поэтому обязательно ознакомьтесь с этой статьей, чтобы понять, какое из этих двух расширений лучше всего подходит для ваших целей.

Однако суть в том, что с помощью подобных расширений вы можете использовать PostgreSQL для ИИ, не выходя за рамки своих возможностей. Инженеры ИИ ликуют!

Pgai переносит вашу рабочую нагрузку ML в базу данных
Понравилась новость? Тогда не забудь оставить свой комментарий.
А так же, добавь наш сайт в закладки (нажми Ctrl+D), не теряй нас.
15 июля 2024 г.
148
Теги: Pgai

Комментарии

Оставить комментарий:
* отправляя форму, я даю согласие на обработку персональных данных

Читайте еще

Microsoft исправляет ошибку, вызывающую проблемы с автоматизацией Windows Update

Компания Microsoft устранила известную проблему, вызванную предварительным обновлением KB5039302 от июня 2024 года, которая приводила к проблемам с обновлением при использовании сценариев автоматизации Windows Update в системах Windows 11.

13 июля 2024 г.
51

Обновление GitLab устраняет уязвимость выполнения конвейера

Компания GitLab выпустила критические обновления безопасности для устранения нескольких уязвимостей, в том числе дефекта высокой степени серьезности, который может позволить злоумышленникам запускать задания конвейера от имени произвольного пользователя.

13 июля 2024 г.
56