dbt: смена парадигмы разработки хранилищ данных

Более 15 лет я работал с продуктами семейства SAP. Это был путь глубокой экспертизы в рамках одного вендора. Но сегодня рынок BI-решений в России оказался на развилке: либо продолжать эксплуатацию “застывших” систем без поддержки, либо искать альтернативу в open-source.

В своих поисках я открыл для себя dbt (data build tool). Но это не просто инструмент, это смена подхода и процессов разработки хранилищ данных.

Почему dbt?

  • Уход от vendor lock-in: Построение аналитики на базе open-source решений (например, связка dbt + PostgreSQL) дает все-таки большую свободу в построении надежных аналитических решений.
  • Трансформация как код: dbt превращает SQL-запросы в управляемые модели с контролем версий и тестированием.
  • Автоматизация документирования: Каждый проект автоматически документируется, исключая рассинхрон между реализацией и базой знаний.

Это лишь малая часть преимуществ использования dbt.

Я опубликовал подробное практическое руководство по dbt, где на примере прототипа хранилища данных для каршеринговой компании разбираю все этапы: от развертывания проекта до создания витрин и оркестрации.