Разработка на Python — удалённая работа в Москве

Дата: 2025-12-10

Детали

Регион

Москва

Занятость

дистанционно

Стоимость

договорная

Дата публикации

2025-12-10

Описание

Data Science. Разработка с нуля. Пожелания и особенности: Нужно разработать код на Python в рамках проекта по цифровым компетенциям, которая анализирует данные. Что именно требуется сделать в коде (общий принцип) Нужно написать программу на Python, которая выполняет определённую задачу по выбранной теме и по итогам работы создаёт .txt-файл с результатами. Важно: входные данные не должны быть прописаны внутри кода. То есть нельзя делать так: input_text = “hello my name is Vicky...“ Вместо этого входные данные должны быть в отдельном файле (.txt или .csv), загруженном в Google Colab. Код должен читать этот файл с диска и далее работать только с ним. В коде обязательно должны быть комментарии, объясняющие ключевые действия программы: # читает файл, # считает количество слов, # очищает текст, # создаёт словарь частот, и т.п. Комментариев должно быть достаточно, чтобы выполнялись требования преподавателя. Их нужно писать через # Также работа проходит антиплагиат, поэтому должна быть уникальной.

Откликнуться

Похожие заказы

Data scientist

дистанционно

договорная

Санкт-Петербург Фрилансеры

2026-05-14 Откликнуться

Data scientist

дистанционно

договорная

Выполнить задание. Задание 1 . По индивидуальному заданию (скачать интересующий датасет https://www.kaggle.com/datasets?search=retail) выполнить в Power BI ряд действий: 1. Произведите расширение модели данных с использованием таблиц календаря. 2. Создайте выражения KPI с использованием выражений анализа данных (DAX) и языка M Power Query. 3. Разработайте интерактивные отчеты. 4. Результат работы (отчет строго в формате pdf – в документе должны быть представлены описание датасета, ссылки на выполненное задание, скриншоты с пояснениями и выводы) . Задание 2. По индивидуальному заданию (скачать интересующий датасет https://www.kaggle.com/datasets?search=retail) выполнить в Tableau ряд действий: 1. Постройте дашборды. 2. Выявите инсайты. 3. Оформите истории (Story). 4. Опубликуйте в своем аккаунте в Tableau Public. 5. Внедрите визуальную аналитику в Google Colab https://colab.research.google.com/ (Jupyter Notebook https://jupyter.org/) или блоги и сайты". 6. Результат работы (отчет строго в формате pdf – в документе должны быть представлены описание датасета, ссылки на выполненное задание, скриншоты с пояснениями и выводы) И итоговая работа . 2. Источник и описание данных Необходимо: • указать источник данных (собственные данные или открытые наборы) • описать структуру данных (количество таблиц, строк, ключевые признаки) • обозначить предметную область Допускается использование: • собственных данных • открытых датасетов (включая Kaggle: https://www.kaggle.com/datasets?fileType=csv) • любых публичных источников Вы не ограничены одним конкретным ресурсом. 3. ETL и подготовка данных (обязательная часть) Работа выполняется в любой аналитической платформе (Loginom, Knime, RapidMiner или аналогичной). Консолидация данных Если используются несколько таблиц: • объединить данные • описать ключи соединения • проверить корректность объединения Очистка и трансформация (ETL) • обработать пропуски • устранить дубликаты • исключить малоинформативные признаки • привести данные к корректным типам • рассчитать производные показатели (при необходимости) Preprocessing Подготовка данных выполняется в логике методологии CRISP-DM: https://www.sveurope.com/crisp-dm-methodology/ • обработка выбросов • кодирование категориальных признаков • нормализация или стандартизация (при необходимости) • подготовка данных к моделированию Каждый этап должен сопровождаться пояснением: что сделано ? зачем это выполнено ? какой результат получен. 4. Исследовательский анализ данных (EDA) — обязательная часть Необходимо: • построить описательные статистики • создать несколько типов визуализаций • выявить закономерности • определить аномалии • сформулировать аналитические наблюдения EDA должен содержать интерпретацию, а не только графики. 5. Дополнительная аналитика (рекомендуется) Для получения высокого балла рекомендуется выполнить расширенную аналитику: • ABC-XYZ анализ • RFM-анализ • классификацию • регрессию • кластеризацию Можно реализовать один или несколько методов — исходя из структуры данных. 6. Машинное обучение (при наличии задачи) Если данные позволяют: • разделить данные на обучающую и тестовую выборки • обучить одну или несколько моделей • оценить качество по метрикам • сравнить результаты • обосновать выбор алгоритма Важно описать: • какие признаки использовались • какие метрики применялись • почему выбран конкретный алгоритм 7. BI-визуализация (обязательная часть) Необходимо реализовать визуализацию результатов в одной из BI-платформ: • Power BI – использовать подготовленный датасет или обработать «сырые» данные через Power Query – создать KPI – применить DAX – разработать несколько интерактивных отчётов или • Tableau Public – построить дашборды – оформить Story – выявить инсайты или • Yandex DataLens https://datalens.yandex.cloud/ – создать интерактивный отчёт – настроить ключевые показатели – визуализировать основные аналитические выводы Визуализация должна подтверждать аналитические выводы. 8. Заключение В заключении необходимо: • сформулировать ключевые выводы • обосновать полученные результаты • при необходимости предложить рекомендации • обозначить возможные направления развития проекта ?? Критерии оценивания Оценка формируется по следующим параметрам: • полнота аналитического цикла • корректность логики решения • качество обработки данных • обоснованность выбора методов • глубина аналитических выводов • корректность визуализации • структурированность и аккуратность оформления Максимальный балл выставляется при условии: ? реализованы все обязательные этапы ? каждый этап сопровождается аналитическими пояснениями ? выводы аргументированы ? выполнена расширенная аналитика Снижение баллов возможно при: • формальном выполнении без интерпретации • пропуске обязательных этапов • логических или методических ошибках.

Краснодар Фрилансеры

2026-05-13 Откликнуться

Data scientist

дистанционно

договорная

Доработка существующего продукта, разработка с нуля. Срок выполнения 14 мая 2026 г.изм. Антиплагиат не требуется Текст задания Нужна помощь с подбором датасета для диплома и кратким обоснованием, почему выбран именно он Тема диплома: кредитный скоринг на основе альтернативных данных Нужно подобрать датасет, который подойдет для моей логики работы: • построить базовую модель на традиционных признаках • построить гибридную модель на традиционных + альтернативных признаках • затем сравнить их по метрикам Для меня особенно важен именно вопрос альтернативных данных: • какие признаки можно корректно считать альтернативными • как их лучше выделить, собрать, смоделировать или обосновать • как сделать это так, чтобы тема диплома выглядела логично и без натяжки Важно: в дипломе не нужно доказывать, что альтернативные данные лучше традиционных • акцент должен быть на исследовании применимости альтернативных данных как дополнения к классическим признакам в гибридной модели Нужен: • подходящий датасет • понимание, какие признаки в нем взять как традиционные, а какие как альтернативные • краткое объяснение в 2–3 предложениях для диплома, почему этот датасет подходит • проверка, насколько этот датасет вообще ляжет на мой текущий код Код у меня уже частично есть, но его при необходимости можно сгенерировать или доработать отдельно — это не основная проблема • главная задача сейчас — подобрать нормальный датасет и понять, как корректно обосновать в нем альтернативные данные Я отдельно скину то, что у меня уже есть по диплому и по коду, чтобы можно было подстроиться под текущую логику работы.

Москва Фрилансеры

2026-05-13 Откликнуться

Программисты

дистанционно

договорная

Data Science. Разработка с нуля, доработка существующего продукта. Необходимо описать концепцию проекта (AI-доноры, система предиктивной аналитики поведения доноров некоммерческих организаций), описать функции, технологии и какие данные нужны, разбить данные на категории и отобразить первичную архитектуру проекта.

Москва Фрилансеры

2026-05-13 Откликнуться

Программисты

дистанционно

договорная

Data Science. Разработка с нуля. Требуется: 1. Доработка концепции ИТ-архитектуры для SaaS (верификация текущей версии). 2. Развертывание в 2 независимых друг от друга провайдерах: VC + Яндекс.

Москва Фрилансеры

2026-05-13 Откликнуться