BigData

Практики по анализу больших данных, ML, классификации и кластеризации.

Редактировать источник

BigData - обзор

В этом разделе собраны практические работы по дисциплине BigData в формате MDX. Материалы охватывают вводную часть, анализ данных, регрессию, прикладные кейсы со страховыми данными, классификацию, кластеризацию, ансамблевые методы и итоговую работу.

Что внутри

  • ввод в BigData и организацию практических работ;
  • анализ и подготовка данных;
  • регрессионные задачи и работа с датасетами;
  • классификация, кластеризация и ансамблевое обучение;
  • итоговая практика с оформлением результата.

Практики

Как проходить раздел

  • Идите по порядку: практики выстроены от базового знакомства к более сложным моделям.
  • Для задач с данными держите рядом материалы из resources/bigdata и используйте их как входные датасеты.
  • После изучения Практики 7 удобно переходить к Практике 8 для сборки итогового отчета.

Ресурсы

Файлы с датасетами и дополнительными материалами лежат в папке: