Завершился конкурс "Везувий", в рамках которого трио студентов, успешно расшифровавших текст на физически непроницаемом папирусном свитке 2000-летней давности, который был погребен под грязью и пеплом во время извержения вулкана, уничтожившего Геркуланум в 79 году нашей эры, получило 700 000 долларов.
В моем первом отчете о "Везувийском вызове" был задан вопрос: "Может ли ML раскрыть секреты свитков Геркуланума?" И теперь у нас есть ответ - да, может. Продемонстрировав эту возможность, мы должны прочесть по крайней мере 90 % еще четырех свитков.

Нат Фридман, бывший генеральный директор GitHub, который стал одержим свитками во время блокировки Ковида в 2020 году, первоначально объявил о "Вызове Везувия" сообщением в Twitter. Он использовал тот же канал, теперь уже X, чтобы сообщить о своем успехе:

Как было указано в самом начале конкурса, до 31 декабря 2023 года необходимо было прислать изображения виртуального развернутого папируса с видимым и разборчивым текстом, а также подробное техническое описание работы решения. В первоначальном задании было указано "четыре отрывка" текста, а победила работа, содержащая больше - пятнадцать колонок с самого конца первого свитка.
Никто не знал заранее, о чем будет этот текст, но оказалось, что это восхитительные размышления о музыке, еде и о том, как наслаждаться жизненными удовольствиями, автором которых, вероятно, был эпикурейский философ Филодем.
В команду-победительницу вошли Люк Фарритор, студент Университета Небраски-Линкольна, Юссеф Надер, египетский аспирант в Берлине, и Джулиан Шиллигер, швейцарский студент-робототехник в Цюрихе. Эти трое никогда не встречались лично, но все они получили призы за достижение определенных целей ранее на конкурсе. Как подробно описано в статье Exciting Progress In Vesuvius Challenge, Фарритор и Надер независимо друг от друга сумели прочитать самый первый текст, а Шиллигер выиграл три приза Segmentation Tooling за возможность 3D-картографирования папируса.

Объединив свои таланты в борьбе за главный приз, их работа была признана самой читаемой. В нем содержались результаты трех различных архитектур моделей, каждая из которых подтверждала выводы других и использовала самый сильный подход к автосегментации. Разработанный Шиллигером и названный ThaumatoAnakalyptor (примерно: Miracle Uncoverer), он генерирует массивные сегменты папируса из нескольких свитков. Победившая работа, включая код, размещена на GitHub, как и работы трех победителей - Шао-Цянь Маха, Луиса Шлессингера и Арефеха Шерафати, а также команды из 9 человек под руководством Элиана Рафаэля Даль Пра, каждая из которых получит по 50 000 долларов.
Несмотря на то что конкурс "Везувий 2023" завершен, идея использования конкуренции для дальнейшего развития продолжается. По словам Ната Фридмана:
В 2024 году наша цель - перейти от чтения нескольких отрывков текста к целым свиткам, и мы объявляем новый главный приз в 100 000 долларов для первой команды, которая сможет прочитать хотя бы 90 % всех четырех отсканированных нами свитков".
После этого основатели Vesuvius Challenge надеются, что в течение следующих нескольких лет им удастся вскрыть и прочитать полностью все 800 свитков, которые были найдены на сегодняшний день. Более того, поскольку вилла, где были найдены свитки, раскопана лишь частично, они надеются, что успех проекта Vesuvius Challenge послужит катализатором дальнейших археологических работ и главная библиотека будет обнаружена.
Как отметил Гарретт Райан в разделе истории сайта Vesuvius Challenge:
"Эта библиотека, с ее тысячами или даже десятками тысяч свитков, должна быть все еще погребена. Если эти тексты будут обнаружены, и если хотя бы небольшая их часть все еще может быть прочитана, они изменят наши знания о классической жизни и литературе в масштабах, невиданных со времен Ренессанса".
Удивительно, на что способно машинное обучение и что так часто бывает неожиданным.
Понравилась новость? Тогда не забудь оставить свой комментарий.
А так же, добавь наш сайт в закладки (нажми Ctrl+D), не теряй нас.
Комментарии