BigData
Практики по анализу больших данных, ML, классификации и кластеризации.
Редактировать источникBigData - обзор
В этом разделе собраны практические работы по дисциплине BigData в формате MDX. Материалы охватывают вводную часть, анализ данных, регрессию, прикладные кейсы со страховыми данными, классификацию, кластеризацию, ансамблевые методы и итоговую работу.
Что внутри
- ввод в BigData и организацию практических работ;
- анализ и подготовка данных;
- регрессионные задачи и работа с датасетами;
- классификация, кластеризация и ансамблевое обучение;
- итоговая практика с оформлением результата.
Практики
- Практика 1. Введение в BigData - вводная часть, цели курса и структура дальнейшей работы.
- Практика 2. Аналитика данных - базовый анализ и интерпретация данных.
- Практика 3. Регрессия и наборы данных - построение регрессионных моделей и работа с источниками данных.
- Практика 4. Анализ данных страхования - прикладной разбор страхового датасета.
- Практика 5. Классификация - методы классификации и сравнение результатов.
- Практика 6. Кластеризация - группировка данных и анализ кластеров.
- Практика 7. Ансамблевое обучение - ансамбли моделей и повышение качества прогноза.
- Практика 8. Итоговая работа - финальное оформление и сбор результатов по разделу.
Как проходить раздел
- Идите по порядку: практики выстроены от базового знакомства к более сложным моделям.
- Для задач с данными держите рядом материалы из
resources/bigdataи используйте их как входные датасеты. - После изучения
Практики 7удобно переходить кПрактике 8для сборки итогового отчета.
Ресурсы
Файлы с датасетами и дополнительными материалами лежат в папке: