dbt: смена парадигмы разработки хранилищ данных
Более 15 лет я работал с продуктами семейства SAP. Это был путь глубокой экспертизы в рамках одного вендора. Но сегодня рынок BI-решений в России оказался на развилке: либо продолжать эксплуатацию “застывших” систем без поддержки, либо искать альтернативу в open-source.
В своих поисках я открыл для себя dbt (data build tool). Но это не просто инструмент, это смена подхода и процессов разработки хранилищ данных.
Почему dbt?
- Уход от vendor lock-in: Построение аналитики на базе open-source решений (например, связка dbt + PostgreSQL) дает все-таки большую свободу в построении надежных аналитических решений.
- Трансформация как код: dbt превращает SQL-запросы в управляемые модели с контролем версий и тестированием.
- Автоматизация документирования: Каждый проект автоматически документируется, исключая рассинхрон между реализацией и базой знаний.
Это лишь малая часть преимуществ использования dbt.
Я опубликовал подробное практическое руководство по dbt, где на примере прототипа хранилища данных для каршеринговой компании разбираю все этапы: от развертывания проекта до создания витрин и оркестрации.