Индустрия данных летит вперед на огромной скорости, и новости начала июня 2026 года - это, пожалуй, самый масштабный тектонический сдвиг в экосистеме dbt за последние годы.

Если коротко: dbt Core v2.0 официально в стадии Alpha, архитектура переписана с нуля. Это уже не та утилита на Python, к которой многие привыкли.

Команда dbt Labs совершила переход, о котором давно просили инженеры.

Главные архитектурные изменения:

  1. Новый движок на Rust (Fusion Engine): dbt попрощался с Python-движком. Теперь ядро компиляции и выполнения (dbt Core v2.0) написано на Rust. Это дает колоссальный прирост производительности при парсинге DAG’ов и компиляции моделей.

  2. Установка без Python (Бинарники): больше никаких “танцев с бубнами” вокруг виртуальных окружений Python, конфликтов зависимостей и ломающихся pip install. dbt Core 2.0 теперь можно ставить напрямую как скомпилированный бинарник (через brew, winget и т.д.).

  3. Parquet вместо огромных JSON: артефакты компиляции (тот самый тяжеловесный manifest.json, который мог “вешать” CI/CD на больших проектах) теперь формируются в формате Parquet. Локальная документация генерируется и читается в разы быстрее (по крайней мере об этом заявляет разработчик), в том числе за счет встроенной интеграции с DuckDB.

  4. Строгая валидация YAML: новый строгий парсер больше не прощает опечаток. Если раньше некорректный ключ (например, desciptin вместо description) мог быть просто проигнорирован, то в v2.0 проект сразу упадет с ошибкой парсинга.

  5. Разделение дистрибутивов: теперь единый движок работает для двух версий:

    • dbt Core v2.0: все тот же Open-Source (Apache 2.0);

    • dbt Fusion: проприетарный дистрибутив с расширенными функциями (SQL comprehension, column-level lineage и интеграция с AI-агентами).

В качестве заключения…

Анонс конечно впечатляющий, не терпится проверить обновление.

К сожалению, прямо сейчас (на этапе альфы) новый Rust-движок Fusion поддерживает только “большую четверку”: Snowflake, BigQuery, Databricks и Redshift. Например, адаптер dbt-postgres, который я чаще всего использую, пока не поддерживается в архитектуре v2.0, так как требует переписывания под новый стандарт. Поэтому если ваша БД тоже не в списке “четверки”, ожидаем обновление адаптеров. А пока работаем на стабильной ветке v1.x (например, 1.11 или 1.12).