Для себя Нужно сделать проект и объяснить мне его. в Jupyter, на выходе нужен файл ipnb срок к 25.08.2022 описание доступны исторические данные о продажах игр, оценки пользователей и экспертов, жанры и платформы (например, Xbox или PlayStation). Вам нужно выявить определяющие успешность игры закономерности. Перед Вами данные до 2016 года. Представим, что сейчас декабрь 2016 г., и Вы планируете кампанию на 2017-й. Нужно отработать принцип работы с данными. В наборе данных попадается аббревиатура ESRB (Entertainment Software Rating Board) — это ассоциация, определяющая возрастной рейтинг компьютерных игр. ESRB оценивает игровой контент и присваивает ему подходящую возрастную категорию, например, «Для взрослых», «Для детей младшего возраста» или «Для подростков» Описание признакового пространства Имя поля Описание поля Name название игры Platform платформа Year_of_Release год выпуска Genre жанр игры NA_sales продажи в Северной Америке (миллионы проданных копий) EU_sales продажи в Европе (миллионы проданных копий) JP_sales продажи в Японии (миллионы проданных копий) Other_sales продажи в других странах (миллионы проданных копий) Critic_Score оценка критиков (максимум 100) User_Score оценка пользователей (максимум 10) Rating рейтинг от организации ESRB (англ. Entertainment Software Rating Board). Эта ассоциация определяет рейтинг компьютерных игр и присваивает им подходящую возрастную категорию Инструкция по выполнению проекта Шаг 1. Откройте файл с данными и изучите общую информацию Шаг 2. Подготовьте данные Замените названия столбцов; Преобразуйте данные в нужные типы. Обработайте пропуски при необходимости: Обратите внимание на аббревиатуру 'tbd' в столбцах с рейтингом. Отдельно разберите это значение и опишите, как его обработать; Посчитайте суммарные продажи во всех регионах и запишите их в отдельный столбец. Шаг 3. Проведите исследовательский анализ данных Сколько игр выпускалось в разные годы. Важны ли данные за все периоды? Как менялись продажи по платформам. Выберите платформы с наибольшими суммарными продажами и постройте распределение по годам. За какой характерный срок появляются новые и исчезают старые платформы? Возьмите данные за соответствующий актуальный период. Актуальный период определите самостоятельно в результате исследования предыдущих вопросов. Основной фактор — эти данные помогут построить прогноз на 2017 год Не учитывайте в работе данные за предыдущие годы. Какие платформы лидируют по продажам, растут или падают? Выберите несколько потенциально прибыльных платформ. Постройте график «ящик с усами» по глобальным продажам игр в разбивке по платформам. Посмотрите, как влияют на продажи внутри одной популярной платформы отзывы пользователей и критиков. Постройте диаграмму рассеяния и посчитайте корреляцию между отзывами и продажами. Соотнесите выводы с продажами игр на других платформах. Посмотрите на общее распределение игр по жанрам. Что можно сказать о самых прибыльных жанрах? Выделяются ли жанры с высокими и низкими продажами? Шаг 4. Составьте для каждого региона Самые популярные платформы (топ-5). Самые популярные жанры (топ-5). Шаг 5. Проверьте гипотезы Средние пользовательские рейтинги платформ Xbox One и PC одинаковые; Средние пользовательские рейтинги жанров Action (англ. «действие», экшен-игры) и Sports (англ. «спортивные соревнования») разные.