Вебинар от dbt Labs: 2026 State of Analytics Engineering
Вчера прошел вебинар от dbt Labs на тему 2026 State of Analytics Engineering. Поделюсь некоторыми своими заметками и мыслями.
Факт, что использование ИИ оказывает значительное влияние пусть пока не на все, но на многие професии. Сфера работы с данными не является каким-то исключением. Поэтому тектонический сдвиг зафиксирован и в нашей индустрии.
Но не всё здесь так гладко и однозначно. Многие дата-команды столкнулись с “парадоксом производительности”.
На мероприятии была приведена интересная статистика: 72% дата-команд используют ИИ для написания SQL и Python кода - производительность выросла в разы, что вполне закономерно. Но качество такого кода значительно ухудшилось. Количество инцидентов, связанных с качеством данных (в том числе из-за “галлюцинаций” ИИ), также возросло. Отмечено, что только 24% команд используют ИИ для тестов и валидации данных. Другими словами, многие инженеры даже не проверяют то, что сгенерировал им ИИ и слепо ему доверяют.
Были интересные мысли по поводу самой роли Analytics Engineer. Это больше уже не кодер (хотя это можно отнести, на мой взягляд, и к другим ролям дата-команд). Написание SQL или Python кода теперь является задачей ИИ. Основной фокус инженеров сместился на проектирование, выявление различного рода ошибок, чистота данных и т.д.
Были затронуты вопросы навыков инженеров-аналитиков. В частности, хороший специалист, не смотря ни на что, всё ещё должен обладать уверенной технической базой. Например, тот же SQL нужно знать лучше, чем когда-либо, но не для написания кода, а для проведения экспертного code review того, что выдал ИИ. Я бы добавил здесь ещё навык быстрого погружения в предметную область (домен). Об этом не говорили на вебинаре, но считаю, что это критичным навыком.
Мой вывод на основе информации вебинара и в целом по настроениям в сообществе.
ИИ не заменит полностью инженера (по крайней мере, пока), но он окончательно разделит рынок на тех, кто просто пишет код и создаёт модели, и тех, кто гарантирует проектирует системы и гарантирует качество данных. Прошло время измерения продуктивности количеством таблиц и пришел черёд измерения отсутствием ошибок. Но игнорировать ИИ уже тоже не получится. Это серёзный фактор, который необходимо учитывать и стараться максимально осознанно применять в своей работе.