dbt Core v2.0 в стадии Alpha
Индустрия данных летит вперед на огромной скорости, и новости начала июня 2026 года - это, пожалуй, самый масштабный тектонический сдвиг в экосистеме dbt за последние годы.
Если коротко: dbt Core v2.0 официально в стадии Alpha, архитектура переписана с нуля. Это уже не та утилита на Python, к которой многие привыкли.
Команда dbt Labs совершила переход, о котором давно просили инженеры.
Главные архитектурные изменения:
-
Новый движок на Rust (Fusion Engine): dbt попрощался с Python-движком. Теперь ядро компиляции и выполнения (dbt Core v2.0) написано на Rust. Это дает колоссальный прирост производительности при парсинге DAG’ов и компиляции моделей.
-
Установка без Python (Бинарники): больше никаких “танцев с бубнами” вокруг виртуальных окружений Python, конфликтов зависимостей и ломающихся
pip install. dbt Core 2.0 теперь можно ставить напрямую как скомпилированный бинарник (черезbrew,wingetи т.д.). -
Parquet вместо огромных JSON: артефакты компиляции (тот самый тяжеловесный
manifest.json, который мог “вешать” CI/CD на больших проектах) теперь формируются в формате Parquet. Локальная документация генерируется и читается в разы быстрее (по крайней мере об этом заявляет разработчик), в том числе за счет встроенной интеграции с DuckDB. -
Строгая валидация YAML: новый строгий парсер больше не прощает опечаток. Если раньше некорректный ключ (например,
desciptinвместоdescription) мог быть просто проигнорирован, то в v2.0 проект сразу упадет с ошибкой парсинга. -
Разделение дистрибутивов: теперь единый движок работает для двух версий:
-
dbt Core v2.0: все тот же Open-Source (Apache 2.0);
-
dbt Fusion: проприетарный дистрибутив с расширенными функциями (SQL comprehension, column-level lineage и интеграция с AI-агентами).
-
В качестве заключения…
Анонс конечно впечатляющий, не терпится проверить обновление.
К сожалению, прямо сейчас (на этапе альфы) новый Rust-движок Fusion поддерживает только “большую четверку”: Snowflake, BigQuery, Databricks и Redshift. Например, адаптер dbt-postgres, который я чаще всего использую, пока не поддерживается в архитектуре v2.0, так как требует переписывания под новый стандарт. Поэтому если ваша БД тоже не в списке “четверки”, ожидаем обновление адаптеров. А пока работаем на стабильной ветке v1.x (например, 1.11 или 1.12).