8 лучших вариантов использования искусственного интеллекта в этом году, и что необходимо техническим специалистам для их поддержки
Предприятия вкладывают деньги в инициативы в области ИИ, а специалисты сосредотачиваются на основах.
Такие сервисы генеративного ИИ, как Midjourney и OpenAI's DALL-E, способны сотворить невообразимое, когда речь идет о потрясающих артефактах, созданных на основе простых текстовых подсказок.
Создание эскизов сложных художественных изображений может быть специализацией ИИ, но некоторые из самых простых задач, очевидно, вызывают у него наибольшие затруднения.
Мне нужен просто белый фон
Мой коллега по исследованиям и специалист по изучению данных Коди Нэш столкнулся с одной из таких задач, когда задался вопросом "Может ли ИИ создать белую картину?".
Все, что Нэш хотел получить от ИИ, - это изображение простого, чистого, белого фона; на языке цветовых кодов - цвет #FFFFFF или RGB(255,255,255). И больше ничего.
Столь простая задача оказалась довольно сложной, что побудило его написать целую статью в блоге. Откровения, полученные в ходе этого небольшого эксперимента, говорят о том, что задача для ИИ не так уж проста.
"Давайте начнем с того, что посмотрим, сможет ли модель генерации изображений создать изображение, в котором нет ничего, кроме белого цвета", - написал Нэш.
Несколько текстовых запросов о создании простого и чисто белого фона не заставили DALL-E 3 выдать именно то, что было запрошено:
Спустя несколько запросов на "гладкий ровный полностью белый фон" DALL-E представил Нэшу следующее. Близко, но не белый:
"Цель заключалась в том, чтобы проверить, сможет ли ИИ создать белую картину. Не просто чисто белое изображение, а что-то, что является результатом какого-то вдохновения, идеи или концепции", - рассказал Нэш изданию BleepingComputer.
В разговоре с нами исследователь данных сослался на старую цитату: "Хорошие художники заимствуют, великие художники крадут", которую уже давно с сомнением приписывают Пабло Пикассо.
"С ИИ это грабеж", - продолжает Нэш.
"Хорошо, что искусственный интеллект рано начинает проявлять творческие способности, так что, когда ему дадут приказ уничтожить, есть шанс, что он откажется".
"Это не то искусство, которое я искал, но искусство все равно было найдено".
Ссылаясь на философское эссе 1942 года "Миф о Сизифе", Нэш говорит: "Я представляю себе всех этих сизифов счастливыми, поскольку мы позаботились о том, чтобы у них были проблемы с минимизацией".
BleepingComputer также воспроизвел эксперимент с Midjourney и DALL-E.
Предсказуемо, наши упрощенные подсказки также заставили инструменты ИИ сгенерировать фон, который не был чисто белым.
DALL-E застыл, когда мы попросили его создать "просто белый фон", в то время как определение Midjourney "гладкий ровный полностью белый фон", похоже, отличается от нашего.
Похожие результаты мы наблюдали и при запросе фонов разных цветов.
В то время как Midjourney, когда ее просили сделать "полностью черный фон", изначально начинала с почти чистого черного листа, по мере выполнения процесса (т. е. задания более чем на "15 % завершено") сверху добавлялись абстрактные объекты и узоры, что приводило к появлению более сложных художественных форм:
Я хотел распространить этот эксперимент и на ChatGPT. Вместо того чтобы заставлять ИИ генерировать упрощенные, минималистичные изображения, пусть чатбот ничего не делает.
ИИ-платформы, подобные ChatGPT, способны на многое - как на хорошее, так и на плохое. Однако, как и люди, ИИ может испытывать трудности, когда его просят делать мало или ничего.
Например, можно ли попросить ChatGPT просто... полностью замолчать и не отвечать на запросы? Мы попробовали.
Даже когда он понимает запрос, он все равно ничего не говорит.
Сталкивались ли вы с подобными трудностями, когда выбранный вами ИИ выполнял совершенно простую просьбу? Или, может быть, вы нашли способ обойти это? Поделитесь с нами в комментариях ниже.
Предприятия вкладывают деньги в инициативы в области ИИ, а специалисты сосредотачиваются на основах.
Это совпадение, созданное на небесах. Расширение Azure AI позволяет базе данных обращаться к различным сервисам Azure AI, таким как Azure OpenAI.
Разработанная исследователями Google система VLOGGER AI позволяет создавать реалистичные видеоролики с разговаривающими и двигающимися людьми на основе одного неподвижного изображения и аудиоклипа в качестве исходных данных.
Продолжаем добавлять языки программирования для Вас.
Впереди много интересного!
Только свежие новости программирования и технологий каждый день.
Комментарии