Компания Meta выпустила проект с открытым исходным кодом, который можно использовать для автоматического преобразования PDF-файла в подкаст. По словам Meta, Notebook Llama можно считать открытой версией NotebookLM от Google.
Google NotebookLM - это онлайн-инструмент, разработанный Google Labs для исследований и ведения заметок. Он использует искусственный интеллект Google Gemini и генерирует резюме и пояснения к документам. Он также может брать документы и создавать аудиообзоры, которые можно использовать в качестве разговорных подкастов.
Чтобы воспользоваться Notebook Llama, вы сначала загружаете файл с текстом, например PDF-файл с новостями или записью в блоге. Программа создает транскрипт на основе этого файла, а затем драматизирует его, чтобы «повысить его разговорную привлекательность для аудиоаудитории». На этом этапе добавляются прерывания и создается впечатление, что человек говорит, а не читает текст.
По словам разработчиков, проект предлагает структурированный подход с помощью блокнотов, что делает его подходящим для тех, кто практически не знаком с LLM, подсказками или аудиомоделями.
В документации говорится, что модель использует эффективную тонкую настройку по параметрам, а Meta также выложила в открытый доступ базовую модель и набор рецептов. Инструмент поддерживает многооборотные разговоры. В процессе использования тестеры отметили, что инструменту не хватает реалистичности NotebookLM, поскольку голоса звучат недостаточно реалистично, слишком компьютерно. Разработчики говорят, что качество звука можно улучшить с помощью более мощных моделей преобразования текста в речь, которые, по их словам, ограничивают естественность звучания.
Понравилась новость? Тогда не забудь оставить свой комментарий.
А так же, добавь наш сайт в закладки (нажми Ctrl+D), не теряй нас.
Комментарии