Amazon Bedrock добавляет поддержку Jamba-Instruct
Jamba-Instruct, большая языковая модель, разработанная компанией AI21Labs, теперь доступна в Amazon Bedrock.
В Snowflake добавили поддержку формата таблиц Iceberg, и в результате появилась возможность работать с данными, которые часто встречаются в озерах и хранилищах данных.
В последнее время много разговоров вокруг Apache Iceberg. Что же делает его таким особенным?
Предприятия часто выходят за рамки реляционных хранилищ данных и размещают данные в объектных хранилищах, подходящих для их озер данных. Если вы используете Amazon S3 в качестве базового объектного хранилища, вы можете хранить на нем практически любые объемы данных, вплоть до экзабайтов. Iceberg - это спецификация формата открытых таблиц, которая позволяет запрашивать данные S3 как таблицы SQL.
Важно отметить, что Iceberg - это не механизм запросов или хранения данных, а спецификация. На место механизма запросов ставится Snowflake. Iceberg позволяет Snowflake работать с этими файлами с соблюдением следующих требований:
Примером из Postgres, который изначально не может работать с такими форматами, является расширение pg_lakehouse, которое позволяет Postgres работать с Iceberg, взяв на себя роль DuckDB. DuckDB - это, конечно же, альтернатива SQLite для аналитических нагрузок; локальная первая, встраиваемая и подходящая для работы с наукой о данных.
С помощью pg_lake PostgreSQL получает возможность использовать высокопроизводительный аналитический механизм запросов.
Запросы передаются в DuckDB для обработки таких данных, как события, метрики, исторические снимки, данные о поставщиках, но это только одна часть уравнения - механизм запросов. Другая - это возможность получать данные из внешних хранилищ объектов, таких как S3, и таблиц в форматах Iceberg или Delta Lake.
Теперь настала очередь Snowflakes тоже перейти на Iceberg. Для этого файлы, совместимые с Iceberg, рассматриваются как таблицы Snowflake и предоставляют возможность напрямую взаимодействовать с базовыми данными. Таблицы Iceberg сочетают в себе производительность и семантику запросов обычных таблиц Snowflake с внешним облачным хранилищем, которым управляют клиенты. Поэтому они считаются идеальным решением для существующих озер данных, которые клиенты не могут или не хотят хранить в Snowflake; Snowflake в этом случае подключается к вашему хранилищу с помощью внешнего тома, а таблицы Iceberg не требуют затрат на хранение данных в Snowflake.
Чтобы создать таблицу Iceberg, сначала создается внешний том, на который делается ссылка в операторе CREATE таблицы.
CREATE OR REPLACE ICEBERG TABLE customer_iceberg (
c_custkey INTEGER,
c_name STRING,
c_address STRING,
c_nationkey INTEGER,
c_phone STRING,
c_acctbal INTEGER,
c_mktsegment STRING,
c_comment STRING
)
CATALOG='SNOWFLAKE'
EXTERNAL_VOLUME='iceberg_lab_vol'
BASE_LOCATION='';
После этого вы сможете выполнять над ним операции Sql DML.
Хотя добавление Iceberg является нововведением, впереди еще много работы, о которой говорится в дорожной карте:
В заключение следует отметить, что использование Iceberg растет, и поставщики интегрируют или планируют интегрировать его в свои продукты. В частности, для Snowflake поддержка Iceberg очень удобна, поскольку некоторые организации с нормативными или другими ограничениями либо не могут хранить все свои данные в Snowflake, либо предпочитают хранить их снаружи в открытых форматах.
Кроме того, Snowflake может стать хорошим выбором для тех, кто уже использует эту платформу, или для тех, кто ищет полностью управляемый механизм запросов.
Jamba-Instruct, большая языковая модель, разработанная компанией AI21Labs, теперь доступна в Amazon Bedrock.
Компания Microsoft выпустила новую бета-версию Windows 10 22H2 (KB5041582) с исправлениями утечки памяти и сбоев для инсайдеров в каналах Beta и Release Preview.
MariaDB Foundation объявила о выходе предварительной версии MariaDB 11.6 Vector. Новая функциональность описывается как результат совместной работы сотрудников MariaDB plc, MariaDB Foundation и соавторов, в частности Amazon AWS.
Продолжаем добавлять языки программирования для Вас.
Впереди много интересного!
Только свежие новости программирования и технологий каждый день.
Комментарии