- Регистрация
- 24.06.19
- Сообщения
- 61,725
- Реакции
- 345,460
Последние темы автора:
- [Клуб трёх запятых] Миллион на Airdrop (2025)
- [Клиника Калинченко] Ольга Самбурская ― Здоровье желудочно-кишечного тракта как фундамент здоровья человека - новые данные, о которых забыли (2025)
- [Udemy] Антон Воронюк ― Полное руководство по Vibe-программированию для непрограммистов (2025)
- [Яна Нетреба] [Labfood] Гайд Ягодный сезон (2025)
- [Ольга Фандорина] Мастер-класс по деньгам (13.07.2025)
- #1
Голосов: 0
dbt для инженеров данных - learndataengineering (2025)
dbt (data build tool) - это инструмент трансформации данных с приоритетом SQL. Он позволяет просто и прозрачно преобразовывать, тестировать и документировать данные прямо внутри хранилища. Благодаря dbt, команды могут создавать надёжные наборы данных для аналитики, машинного обучения и бизнес-процессов - без необходимости выгружать данные наружу. Именно поэтому dbt становится ключевым инструментом в работе инженеров данных, и этот курс - идеальная отправная точка для его освоения.
Введение в dbt
Перед практикой вы узнаете:
Для практики вы:
Вы создадите цепочку моделей (pipelines), используя e-commerce-датасет. Вы будете использовать dbt Core, dbt Cloud и Snowflake для пошагового преобразования данных.
Материализации в dbt
После построения моделей вы научитесь сохранять результаты трансформаций:
Тестирование моделей dbt
Вы научитесь тестировать модели - это ключевая часть надежной работы с данными:
Теперь, когда модели работают локально, вы научитесь:
Расширенные возможности dbt
В завершении курса:
Подробнее:
dbt для инженеров данных - learndataengineering (2025) - Описание курса
dbt (data build tool) - это инструмент трансформации данных с приоритетом SQL. Он позволяет просто и прозрачно преобразовывать, тестировать и документировать данные прямо внутри хранилища. Благодаря dbt, команды могут создавать надёжные наборы данных для аналитики, машинного обучения и бизнес-процессов - без необходимости выгружать данные наружу. Именно поэтому dbt становится ключевым инструментом в работе инженеров данных, и этот курс - идеальная отправная точка для его освоения.
Введение в dbt
Перед практикой вы узнаете:
- В чём разница между ETL и ELT,
- Какие вызовы стоят перед современными пайплайнами,
- Чем dbt Core и dbt Cloud отличаются и каковы их ключевые преимущества.
Для практики вы:
- создадите репозиторий на GitHub,
- заведёте аккаунт в dbt Cloud и настроите хранилище данных в Snowflake,
- выполните базовую настройку проекта в dbt и определите структуру модели (SQL или Python-файл).
Вы создадите цепочку моделей (pipelines), используя e-commerce-датасет. Вы будете использовать dbt Core, dbt Cloud и Snowflake для пошагового преобразования данных.
Материализации в dbt
После построения моделей вы научитесь сохранять результаты трансформаций:
- в таблицы,
- представления (views),
- инкрементальные или эфемерные модели.
Тестирование моделей dbt
Вы научитесь тестировать модели - это ключевая часть надежной работы с данными:
- Схемные (generic) и пользовательские (bespoke) тесты,
- Проверка качества и консистентности данных на всех этапах пайплайна.
Теперь, когда модели работают локально, вы научитесь:
- делиться ими с командой,
- запускать их по расписанию,
- обновлять модели автоматически.
Расширенные возможности dbt
В завершении курса:
- настроите CI/CD-процессы прямо в dbt Cloud,
- сгенерируете полноценную документацию проекта и поймёте, как использовать её в команде,
- узнаете о лучших практиках работы с dbt в продакшене.
- Репозиторий с исходным кодом (GitHub)
- E-commerce-датасет
- Пошаговые видеоуроки
- Подборка полезных ссылок и дополнительных материалов
- Базовые знания реляционных баз данных
- Умение работать с SQL
- Рекомендуется: базовый опыт с Git и облачными платформами (Snowflake, dbt Cloud)
Подробнее:
Для просмотра ссылок пройдите регистрацию
Скачать курс - dbt для инженеров данных - learndataengineering (2025)
Вы должны Войти на форум чтобы увидеть контент.