WorldSkills University в МГУ им. Н. П. Огарёва

О развитии движения WorldSkills в Национальном исследовательском Мордовском государственном университете им. Н. П. Огарёва

Машинное обучение и большие данные

Машинное обучение – это анализ данных без использования четких детерминированных алгоритмов. За последнее десятилетие машинное обучение применяется для создания беспилотных автомобилей, эффективных поисковых систем, в распознавании речи и т.п. Сегодня машинное обучение прочно вошло в повседневную жизнь. С помощью современных инструментальных средств можно выполнить прогнозирование и использовать графику для моделирования проблем. Эта компетенция формирует навыки корректной обработки данных, эффективного обмена данными и проведения базовой разведки больших сложных наборов данных.

В рамках компетенции применяются наиболее эффективные алгоритмы машинного обучения, реализуется опыт их практического применения. Благодаря большому практическому опыту работы с большими данными, накопленному в индустрии, а также новым инструментам и системам, появилась возможность применения этого опыта для решения широкого круга задач. К примеру, используя Hadoop с MapReduce, Spark, Pig и Hive специалистам этой компетенции практически не требуется глубокого знания программирования.

Машинное обучение и большие данные – инновационная специализация, обучение которой проводится не во всех ВУЗах. Вместе с тем продвинутые компании осознают перспективы использования данной компетенции, все чаще прибегая к технологиям машинного обучения в банковском секторе, государственном управлении, сельском хозяйстве.

Описание задания

  • очистка и форматирование данных (предобработка);
  • разведочный анализ данных;
  • конструирование и выбор признаков;
  • сравнение метрик нескольких моделей машинного обучения;
  • гиперпараметрическая настройка лучшей модели;
  • оценка лучшей модели на тестовом наборе данных;
  • интерпретирование результатов работы модели;
  • разработка пользовательского приложения;
  • выводы и работа с документами.

Критерии оценки

  • подготовка репозитория хранения данных;
  • предобработка больших данных;
  • подготовка обучающей и тестовой выборок;
  • разработка математического аппарата;
  • разработка прикладного решения;
  • документирование.