bart
PRO
- Сообщения
- 52.242
- Реакции
- 28.422
Современные хранилища данных и Data Lakes
Modern Data Warehouses & Data Lakes
learndataengineering
В роли инженера данных вы будете регулярно работать с аналитическими платформами, где компании хранят данные в Data Lakes и Data Warehouses для построения визуализаций и создания моделей машинного обучения.
Современные хранилища данных, такие как AWS Redshift, Google BigQuery и Snowflake, позволяют загружать данные напрямую из файлов в Data Lake. Эта интеграция делает работу с хранилищами гибкой и удобной для аналитических задач.
В этом курсе вы научитесь:
Этот курс поможет вам освоить современные подходы к построению систем хранения и обработки данных и научиться эффективно использовать возможности Data Lakes и Data Warehouses для аналитики.
Материал на английском языке
Продажник:
Скачать:
Modern Data Warehouses & Data Lakes
learndataengineering
В роли инженера данных вы будете регулярно работать с аналитическими платформами, где компании хранят данные в Data Lakes и Data Warehouses для построения визуализаций и создания моделей машинного обучения.
Современные хранилища данных, такие как AWS Redshift, Google BigQuery и Snowflake, позволяют загружать данные напрямую из файлов в Data Lake. Эта интеграция делает работу с хранилищами гибкой и удобной для аналитических задач.
В этом курсе вы научитесь:
- Как использовать Data Lakes, Data Warehouses и BI-инструменты в единой системе
- Как загружать данные в Data Lakes и визуализировать их в отчётах
- Как строить интеграции в Google Cloud Platform и AWS
- Как работает архитектура ETL/ELT и как её применять в современных хранилищах данных
- Роль хранилищ данных в аналитических платформах
- Как данные загружаются в Data Warehouse через ETL/ELT
- Что такое Data Lakes и как их использовать
- Как работать с файлами напрямую в озере данных
- Настройка Cloud Storage, создание таблицы в BigQuery
- Визуализация данных в Data Studio
- Понимание общих принципов работы облачных платформ
- Создание интеграции данных через S3, Athena и Quicksight
- Настройка Glue Data Catalog для управления данными
- Подробная настройка и интеграция Glue
- Подведение итогов курса
- Дополнительный модуль по работе с Redshift Spectrum, используя подготовленный Data Catalog из AWS-проекта
- Основы работы с Data Warehouses (рекомендуется пройти курс «Хранилища данных» в академии)
- Базовые знания AWS Athena и Redshift (для блока с Redshift Spectrum используется подготовленный Data Catalog из проекта AWS)
Этот курс поможет вам освоить современные подходы к построению систем хранения и обработки данных и научиться эффективно использовать возможности Data Lakes и Data Warehouses для аналитики.
Материал на английском языке
Продажник:
Для просмотра вы должны войти или зарегистрироваться.
Скачать:
Скрытое содержимое могут видеть только пользователь группы: PRO
Качать без ограничений Купить доступ к 1 теме
Качать без ограничений Купить доступ к 1 теме
Скрытое содержимое для пользователей: Ferr