IT-аутсорсинг — удалённая работа в Москве
Дата: 2025-07-29
Детали
Регион
Москва
Занятость
дистанционно
Стоимость
договорная
Дата публикации
2025-07-29
Описание
выполнить проект. Необходимо выполнить проект на python в jupiter. Что нужно сделать Ваша задача — познакомиться с данными, проверить их корректность и провести предобработку, получив необходимый срез данных. Перед анализом вам необходимо дополнительно сделать следующее: Отобрать данные по времени выхода игры. Вам нужен период с 2000 по 2013 год включительно. Категоризовать игры по оценкам пользователей и экспертов. Выделите три категории: высокая оценка — с оценкой от 8 до 10 и от 80 до 100, включая правые границы интервалов. средняя оценка — с оценкой от 3 до 8 и от 30 до 80, не включая правые границы интервалов. низкая оценка — с оценкой от 0 до 3 и от 0 до 30, не включая правые границы интервалов. Выделить топ-7 платформ по количеству игр, выпущенных за весь требуемый период. Описание данных Данные /datasets/new_games.csv содержат информацию о продажах игр разных жанров и платформ, а также пользовательские и экспертные оценки игр: Name — название игры. Platform — название платформы. Year of Release — год выпуска игры. Genre — жанр игры. NA sales — продажи в Северной Америке (в миллионах проданных копий). EU sales — продажи в Европе (в миллионах проданных копий). JP sales — продажи в Японии (в миллионах проданных копий). Other sales — продажи в других странах (в миллионах проданных копий). Critic Score — оценка критиков (от 0 до 100). User Score — оценка пользователей (от 0 до 10). Rating — рейтинг организации ESRB (англ. Entertainment Software Rating Board). Эта ассоциация определяет рейтинг компьютерных игр и присваивает им подходящую возрастную категорию. Подробнее о категориях рейтинга ESRB RP (Rating Pending) — используется в рекламных материалах для игр, которым ещё не присвоен окончательный рейтинг ESRB. Принят в 1994 году и действует до сих пор. EC (Early Childhood)— игры, ориентированные на дошкольную аудиторию. Не содержат материалов, которые родители могли бы считать неприемлемыми. Принят в 1994 году и действовал до 2018 года. E (Everyone) — игры для всех возрастов. Могут содержать незначительное количество насилия и сленга. До 1998 года рейтинг был известен как Kids to Adults (K-A). Принят в 1994 году и действует до сих пор. E10+ (Everyone 10 and older) — игры для людей от 10 лет и старше. Могут содержать более высокий уровень насилия, грубую разговорную речь. Принят в 2005 году и действует до сих пор. T (Teen) — игры для людей от 13 лет и старше. Могут содержать умеренное количество насилия, включая небольшие количества крови, грубую разговорную речь и юмор, сексуальное содержание. Принят в 1994 году и действует до сих пор. M (Mature) — игры для лиц от 17 лет и старше. Могут содержать более интенсивные или реалистичные изображения насилия, включая кровь, ужасы, увечья и изображения смерти, непристойные сексуальные сцены, частичную наготу и грубую ненормативную лексику. Принят в 1994 году и действует до сих пор. AO (Adults Only)— игры для людей от 18 лет и старше. Содержат материалы с более высоким уровнем воздействия, чем рейтинг M. Принят в 1994 году и действует до сих пор. Как выполнять проект Проект вы будете выполнять на платформе в среде Jupyter Notebook. При выполнении проекта следуйте инструкциям в шаблоне тетрадки и следите за оформлением проекта. В случае трудностей возвращайтесь к теме спринта, посвящённой Jupyter Notebook. Если вы уже установили Jupyter Notebook, вы можете решить проект локально и загрузить готовый файл, нажав «Загрузить и отправить». Теперь последовательно расскажем о задачах, которые вам предстоит выполнить. Загрузка и знакомство с данными Загрузите необходимые библиотеки Python и данные датасета /datasets/new_games.csv. Скачать датасет Познакомьтесь с данными: выведите первые строки и результат метода info(). Сделайте вывод о полученных данных: данные какого объёма вам предоставили, соответствуют ли они описанию, встречаются ли в них пропуски, используются ли верные типы данных. Отметьте другие особенности данных, которые вы обнаружили и на которые стоит обратить внимание при предобработке. Например, вы можете проверить названия столбцов: все ли названия отражают содержимое данных и прописаны в удобном для работы виде. Проверка ошибок в данных и их предобработка Это самая объёмная и важная часть проекта. Теперь вам нужно внимательно изучить данные и провести их предобработку. Что нужно проверить: Названия, или метки, столбцов датафрейма: Выведите на экран названия всех столбцов датафрейма и проверьте их стиль написания. Приведите все столбцы к стилю snake case. Названия должны быть в нижнем регистре, а вместо пробелов — подчёркивания _. Типы данных: Если встречаются некорректные типы данных, предположите их причины. При необходимости проведите преобразование типов данных. Помните, что столбцы с числовыми данными и пропусками нельзя преобразовать к типу int64. Сначала вам понадобится обработать пропуски, а затем преобразовать типы данных. В числовых столбцах могут встретиться строковые значения, например,unknown или другие. Приводите такие столбцы к числовому типу данных, заменив строковые значения на пропуски. Наличие пропусков в данных: Посчитайте количество пропусков в каждом столбце в абсолютных и относительных значениях. Изучите данные с пропущенными значениями. Напишите промежуточный вывод: для каких столбцов характерны пропуски и сколько их. Предположите, почему пропуски могли возникнуть. Укажите, какие действия с этими данными можно сделать и почему. Обработайте пропущенные значения. Для каждого случая вы можете выбрать оптимальный, на ваш взгляд, вариант: заменить на определённое значение, оставить как есть или удалить. Если вы решите заменить пропуски на значение-индикатор, то убедитесь, что предложенное значение не может быть использовано в данных. Если вы нашли пропуски в данных с количеством проданных копий игры в том или ином регионе, их можно заменить на среднее значение в зависимости от названия платформы и года выхода игры. Явные и неявные дубликаты в данных: Изучите уникальные значения в категориальных данных, например с названиями жанра игры, платформы, рейтинга и года выпуска. Проверьте, встречаются ли среди данных неявные дубликаты, связанные с опечатками или разным способом написания. При необходимости проведите нормализацию данных с текстовыми значениями. Названия или жанры игр можно привести к нижнему регистру, а названия рейтинга — к верхнему. После того как нормализуете данные и устраните неявные дубликаты, проверьте наличие явных дубликатов в данных. Напишите промежуточный вывод: укажите количество найденных дубликатов и действия по их обработке. В процессе подготовки данных вы могли удалять данные, например строки с пропусками или ошибками, дубликаты и прочее. В этом случае посчитайте количество удалённых строк в абсолютном и относительном значениях. После проведения предобработки данных напишите общий промежуточный вывод. Фильтрация данных Коллеги хотят изучить историю продаж игр в начале XXI века, и их интересует период с 2000 по 2013 год включительно. Отберите данные по этому показателю. Сохраните новый срез данных в отдельном датафрейме, например df_actual. Категоризация данных Проведите категоризацию данных: Разделите все игры по оценкам пользователей и выделите такие категории: высокая оценка (от 8 до 10 включительно), средняя оценка (от 3 до 8, не включая правую границу интервала) и низкая оценка (от 0 до 3, не включая правую границу интервала). Разделите все игры по оценкам критиков и выделите такие категории: высокая оценка (от 80 до 100 включительно), средняя оценка (от 30 до 80, не включая правую границу интервала) и низкая оценка (от 0 до 30, не включая правую границу интервала). Выделите топ-7 платформ по количеству игр, выпущенных за весь актуальный период. В конце напишите основной вывод и отразите, какую работу проделали. Не забудьте указать описание среза данных и новых полей, которые добавили в исходный датасет.
Похожие заказы
IT-аутсорсинг
дистанционно
договорная
фронтенд-разработчик. Написание клиентской части на TypeScript и JavaScript для мессенджера. Подразумевается работа в группе с Full-Stack разработчиком занимающимся созданием серверной части приложения. У заказчика имеется исходный код аналогичного мессенджера написанный на TypeScript и Java, на его основе необходимо создать свой не допуская плагиата.
Москва
Фрилансеры
2025-08-25
IT-аутсорсинг
договорная
Обслуживание оборудования. Установка рабочих мест (3 шт), прокладка кабеля до рабочих мест, подключение МФУ на объекте в Ульяновской области. Сроки работы 3-4 дня по 8 часов работы.
Санкт-Петербург
Фрилансеры
2025-08-22
Другие услуги
дистанционно
договорная
Доработка сайта. Системное программирование. Доработка существующего продукта. Пожелания и особенности: Все подробности после отклика.
Санкт-Петербург
Фрилансеры
2025-08-22
IT-аутсорсинг
дистанционно
договорная
Ментор по системному росту на фрилансе. Ищу наставника до 20.000 рублей за сессию, который заработал более 300.000 рублей в месяц, продавая свои услуги на профи ру и теперь передает свою системность людям (есть успешные и неуспешные кейсы) Я работаю на профи ру около года: выполняю лабораторные работы, IT задачи, занимаюсь репетиторством по программированию и Data Science. Мой текущий доход около 160.000-200.000 рублей в месяц при высокой загруженности. Хочу повысить доход, сократив при этом объем рутины и количество рабочих часов, чтобы интегрировать это в рабочую рутину в найме. Требуется экспертная помощь для выявления и исправления ошибок в подходе, введения системности в работу и перехода к более высокооплачиваемым и ценным задачам. Был бы признателен за наставничество, рекомендации по стратегиям роста.
Москва
Фрилансеры
2025-08-21
Другие услуги
договорная
Настройка ПО. Мне нужна помощь в настройке стрима через ОБС. Из составляющих ПС5, карта захвата, макбук, второй монитор. Очень нуждаюсь в помощи настройки, что бы мог запускать стрим и ничего не мешало записи. У меня есть карта захвата и пс5, нужно настроить стрим на маке через обс, что бы все работало без лишних проблем.
Москва
Фрилансеры
2025-08-21
IT-аутсорсинг
договорная
Создание и увеличение потока рекламы, авито, привличение по отклику или по ключевому слову откликов. Добрый день, нужен айти специалист для создания и увеличения потока рекламы авито, привлечение по отклику или по ключевому слову откликов.
Москва
Фрилансеры
2025-08-21