Разработка с нуля. Есть большой массив текстовых данных (не цифры). Необходимо провести анализ по параметрам для научного исследования. Все детали - специалисту.
Разработка с нуля. Построить ETL процесс загрузки данных из источника в Pg/ClickHouse с помощью Airflow, dbt от src до ods Источник: БД (Postgres, MySQL, MongoDB) или API Захват изменений (каждый пункт считается) Snapshot - 1 балл Increment - 1 балл CDC - 2 балла Обработка данных в базе stg to raw - 1 балл raw to ODS - 1 балл Использование dbt - 2 балла Разложение по dim/fct - 1 балл SCD2 dim - 1 балл сделать приватный репо в гитхабе и docker-compose, который запуcnbncz и получтся финальая база с ODS. для CDC использовать источник и таргет одинаковый (postgres) скрипт для подключения к бд предоставлю.
Подготовка к собеседованию в магистратуру. Мне необходимо подготовиться с теоретической и с практической точки зрения к собеседованию в магистратуру "Data science" (есть бэкграунд). Файл с полным перечнем прикреплен Блок 1. Математика 1. Линейное пространство (ЛП). Линейная зависимость и независимость. Базис и размерность ЛП, их связь. Замена базиса, матрица перехода, преобразование координат при замене базиса. (А. Г. Курош. Курс высшей алгебры) 2. Матрицы. Ранг матрицы, ранг произведения матриц, ранг транспонированной матрицы. Определитель матрицы. Определитель произведения. (А. Г. Курош. Курс высшей алгебры) 3. Евклидовы и унитарные пространства. Свойства скалярного произведение, неравенство Коши — Буняковского. (А. Г. Курош. Курс высшей алгебры) 4. Норма, ортонормированный базис. Разложение пространства в прямую сумму подпространства и его ортогонального дополнения. (А. Г. Курош. Курс высшей алгебры) 5. Линейный оператор и его матрица. Преобразование матрицы при замене базиса, характеристический многочлен. Собственные векторы и значения, геометрический смысл. (А. Г. Курош. Курс высшей алгебры) 6. Квадратичные формы, их знакоопределенность и канонический вид. Унитарные и нормальные операторы. (А. Г. Курош. Курс высшей алгебры) 7. Производные. Необходимое и достаточное условия дифференцируемости функции. Частные производные. Полный дифференциал. Дифференцирование сложной функции. (Г. М. Фихтенгольц. Курс дифференциального и интегрального исчисления) 8. Градиент функции. Безусловный экстремум функции многих переменных. Необходимые и достаточные условия экстремума функции многих переменных. Условный экстремум. (Г. М. Фихтенгольц. Курс дифференциального и интегрального исчисления) и др. Блок 2. Информационные технологии 1. Высокоуровневые языки программирования. Переменные, условия, циклы, массивы, функции, рекурсия. Реализация в машинном коде. Компиляторы и интерпретаторы. (Б. Страуструп язык программирования С++) 2. Язык программирования Python. Хранение данных в памяти, копирование, скалярные типы данных и правила работы с ними. Приведение типов. Приоритеты операций. (Лутц, М. Изучаем Python) 3. Строки в Python. Операции со строками. Основные функции и функция str(). Форматный ввод/вывод. Спецификации формата: правила их записи и использования. (Лутц, М. Изучаем Python) 4. Циклы и условия в языке программирования Python. Функция range(). (Лутц, М. Изучаем Python) 5. Списки, кортежи, словари, множества в Python. Особенности, назначение и основные методы работы. (Лутц, М. Изучаем Python) 6. Функции в Python. Области видимости, рекурсия, lambda функции. (Лутц, М. Изучаем Python) 7. Многомодульные программы. Связь программных модулей. Области видимости. Операторы import, from …import и from…import *. Менеджер пакетов pip и правила работы с ним. Установка библиотек, версии. Работа с requirements.txt. (Лутц, М. Изучаем Python) и др. Пример практического задания: Реализовать сортировку методом пузырька на любом языке программирования.
Data Science. Простой пайплайн с ОСR старославянских текстов из сканов. Работаю над созданием кастомной OCR-модели под старославянский текст XVI–XVII вв. Есть проблема, которую стандартные движки не решают: – 10–15 типов надстрочных знаков, – нестандартная раскладка, – редкие кириллические и греческие символы, – проблема сегментации (диакритика «уезжает» в отдельную строку). Нужен специалист, который понимает как решать и имеет практический опыт работы с задачами: 1. Разметка строк вручную/полуавтоматически. 2. Создание датасета пар «скан ? текст». 3. Тестирование Kraken (обязательно)/Calamari(по возможности): – line segmentation, – training alphabets, – ground truth mapping. 4. Построение минимального прототипа пайплайна: папка A (исходные сканы) + CLI-скрипт -> папка B (текстовый результат в правильной раскладке). 5. Создание краткого аргументированного отчёта о том, какой путь обучения модели реалистичен и оптимален для решения поставленной задачи. На первом этапе — пилот за начальную сумму Это R&D-этап. Если подходим друг другу — продолжение проекта: обучение основной модели (кратно больший бюджет). От вас нужны: – опыт OCR или ML; – понимание сегментации строк; – умение работать с нестандартными алфавитами. Для пилота дам 5–10 страниц сканов и эталоны. Пишите кратко: с какими OCR-движками работали, 2-3 примера похожих решенных задач. Вышлю дополнительные вопросы и материалы. Желаю всем взаимовыгодных проектов! С уважением, Алексей.
Настройка. 1. Настроить метрику покупку eCommerce 2. Поправить капчу на cms Joomla 3. Проверить остальные Цели и Сегменты в метрике. Основное: настроить корректную передачу eCommerce-события purchase из JoomShopping в Яндекс.Метрику через dataLayer + GTM. На данный момент purchase-данные не отправляются, Метрика не получает данные, цель «Ecommerce: покупка» пустая. Что нужно сделать! ШАГ 1. Добавить dataLayer.push на страницу завершения заказа ШАГ 2. Настроить GTM ШАГ 3. Проверить отображаются ли заказы. Проверка обязательно. Развернутое тз есть Специалисты с опытом!.
Data Science. Разработка с нуля, настройка. Пожелания и особенности: Требуется эксперт с опытом конфигурации пайплайна на dagster с dbt для on-prem BI системы.
Data Science. Разработка с нуля, Решение олимпиадной задачи на python. Асимметричный диалог (26 баллов) Ограничение времени 1 с Ограничение памяти 64.0 Мб Ввод стандартный ввод Вывод стандартный вывод [анализ кода; автономное управление] Умный робот-пылесос фирмы «АБ-Мур» несколько лет прекрасно справлялся со своей основной задачей, как в один прекрасный день перестал реагировать на команды и вместо этого тихо мигал красным огоньком. Коля Четвёркин поискал в интернете и узнал, что недавно на центральном сервере обновили ключи шифрования, и если пылесос не успел их синхронизировать, нужно сделать это вручную. А именно – зайти в консоль прошивки и запустить утилиту синхронизации. Её название отличается от пылесоса к пылесосу, но известно, файл утилиты имеет расширение«.FLG» и лежит в начальном каталоге. Да, в пылесосе есть настоящая операционная система, и у неё есть много команд. Нас будут интересовать шесть: DIR – выводит построчно названия файлов в текущем каталоге. EXEC a – запускает файл a (если он существует и исполняемый). если файл не существует, система ответит ERROR NOT EXIST. если файл не исполняемый, система ответит ERROR NOT EXECUTABLE. COPY a b – копирует файл a в файл b (если a существует, а b – не существует). если b существует, система ответит ERROR EXIST. DEL a – удаляет файл a (если он существует и не исполняемый). если файл нельзя удалить, система ответит ERROR CANT DELETE TRUE – ничего не делает. EXIT – завершает сеанс. Если команда не существует, система отвечает ERROR SYNTAX. Если количество параметров не совпадает с необходимым для команды, система отвечает "ERROR PARAMETER". Если указанный файл не существует, система отвечает ERROR NOT FOUND, если не указано иначе. Если команда выполнена успешно, то последней отдельной строкой (после вывода самой команды) возвращается OK. Все эти команды работают благодаря интерпретатору команд, который тоже лежит в начальном каталоге. И его название тоже отличается между моделями пылесосов. В интернете пишут, что варианта три – COMMAND.COM, EXECUTOR.EXE или INTERPRT.INT. Но подключившись и выполнив первую команду, вместо файлов Коля увидел странные названия. Оказалось, что буквы и цифры в выводе перемешаны. То ли генератор вывода сломан, из-за чего вместо одной буквы выводится другая, то ли производитель специально подстроил шифрование. В пользу последней версии играет вычитанное в интернете предупреждение: если попытаться обратиться к интерпретатору не той версии или выполнить более10 команд за сеанс, система заблокируется, и пылесос точно придётся нести в сервисный центр. Коля очень не хочет нести пылесос в сервис и надеется отремонтировать его своими силами. Помогите Коле пробиться через защиты от производителя и напишите программу, которая запускает утилиту (или хотя бы интерпретатор команд). Задача проверяет навык анализа кодов и реализации автономного управления, что потребуется при решении финальной задачи. Для решения этой задачи у вашей команды есть 20 попыток. Протокол взаимодействия Это интерактивная задача. Ваша программа взаимодействует с проверочной системой посредством стандартных потоков ввода и вывода. Каждое входящее и исходящее сообщение должно сопровождаться переносом строки и очисткой буфера. Иными словами, после отправки сообщения программа должна очистить буфер (выполнить flush) и считать ответ от системы (прочесть строку или несколько строк). В случае некорректного поведения решения, проверка прерывается с вердиктом PE (Presentation Error). Ваше решение отправляет команду согласно условия задачи. Одна команда – одна строка. Проверочная система отвечает произвольным числом строк. Система оценивания Решение проходит проверку на наборе пылесосов. Если решение запускает интерпретатор команд, за пылесос присуждается 50%. Если же запускается утилита синхронизации, за пылесос ставится полный балл. Примечание Каждое входящее и исходящее сообщение должно сопровождаться переносом строки. Очистка буфера в Python делается функцией sys.stdout.flush(), в Java – System.out.flush(), в C++ – std::flush.
Data Science. Доработка существующего продукта, тестирование, настройка. Радио-поиск 2D (20 баллов) Ограничение времени 1 с Ограничение памяти 64.0 Мб Ввод стандартный ввод Вывод стандартный вывод [канал связи; математические модели] Задача является прямым продолжением задачи «Радио-поиск». Теперь на том же поле сыграем в охоту на «тень». Внутри поля, представленного декартовой плоскостью в виде квадрата с углами в точках (0; 0) и (1000; 1000), находится «радио-тень» в виде круга диаметром 300 м. Вы можете установить излучатель и приёмник в двух точках поля, выполнить передачу сигнала и получить обратную связь: пришёл сигнал или не пришёл. Если между микрофоном и динамиком есть тень, сигнал не придёт. Если микрофон или динамик в тени – сигнал также не придёт. Ваша задача – определить координаты центра тени с точностью до 3 м. Задача проверяет навык реализации автономного управления и работы с пространственными моделями, что потребуется при решении финальной задачи. Для решения этой задачи у вашей команды есть 20 попыток. Протокол взаимодействия Это интерактивная задача. Ваша программа взаимодействует с проверочной системой посредством стандартных потоков ввода и вывода. Каждое входящее и исходящее сообщение должно сопровождаться переносом строки и очисткой буфера. Иными словами, после отправки сообщения программа должна очистить буфер (выполнить flush) и считать ответ от системы (прочесть строку или несколько строк). В случае некорректного поведения решения, проверка прерывается с вердиктом PE (Presentation Error). Формат ввода Ваше решение отправляет одно из двух сообщений. Выполнение передачи: восклицательный знак, пробел и четыре вещественных числа через пробел – координаты излучателя и приёмника. Проверка координаты: «собачка», пробел и два вещественных числа через пробел – предполагаемые координаты центра. После этой команды решение должно завершить работу Формат вывода Выполнение передачи: одна строка с одним из двух слов, пришёл ли сигнал – YES или NO. Проверка координаты: одна строка со словом OK. Система оценивания Балл за решение выставляется по сумме баллов за обнаружение каждой тени. Один запуск – одна тень. Полный балл выставляется, если для обнаружения тени понадобилось не более, чем на три передачи больше авторского решения. Если разница составит больше 3 передач, или точность определения составит от 3 до 10 метров, выставляется 50%. После 100 передач решение прерывается досрочно. Примечание Каждое входящее и исходящее сообщение должно сопровождаться переносом строки. Очистка буфера в Python делается функцией sys.stdout.flush(), в Java – System.out.flush(), в C++ – std::flush.
Data Science. Разработка с нуля, тестирование, настройка. Cement Hydration Engine (Production-Ready V2.2)1. Суть Задачи (MUST-HAVE):Разработка и валидация высокопроизводительного, численно устойчивого программного ядра (Core Engine) на Python, которое моделирует кинетику гидратации цементного раствора и рассчитывает ключевые механические/акустические параметры ($\alpha$, $\rho$, $G_{eff}$, $K_{eff}$, $Z$, $\sigma_c$) в реальном времени. 2. Требуемое Решение и KPI (Кратко): 1.Высокая Производительность (KPI): Реализация чистых вычислительных функций с использованием Numba JIT-компиляции. Среднее время расчета на шаг $\le 1 \text{ мс}$. 2.Численная Устойчивость: Интеграция и проверка CFL-условия (Куранта–Фридрихса–Леви) в Runtime для термодинамической модели. Обязательный контроль NaN/Inf после каждого JIT-расчета. 3.Математическая Строгость: Точная реализация связанных ОДУ (для $\theta(t)$ и $T(t)$) и микрометрических моделей (например, Hashin-Shtrikman) с защитой от деления на ноль. 4.Архитектура: Чистый код, структурированный по принципам SOLID, с системой логирования (logging) и Unit-тестами (Pytest), проверяющими численные инварианты.Предиктивный Модуль: Разработка статистического модуля для прогноза конечной прочности ($\sigma_{c, final}$) с расчетом интервалов неопределенности (95%, 75%). Требуемые Компетенции: Программирование Python (Senior/Expert), Numba JIT, NumPy. Математика/Физика Численные методы (Explicit Euler, ОДУ), анализ устойчивости (CFL). Инженерия/Моделирование Гидратация цемента (кинетика, JMAK), Микромеханика (Hashin-Shtrikman), Акустика (P/S-волны, импеданс Z). Разработка Pytest (написание тестов на численные инварианты), JSON-сериализация, стандарты кода (логирование, docstrings).
Data Science. Разработка с нуля. Необходимо разработать сервис интеграции с AI-агентами (Yandex GPT или DeepSeek) или собственное решение по обработке текстового, графического, аудио и видео контента на предмет наличия: - нарушения законов РФ - нецензурных, токсичных, оскорбительных выражений - порнография и потенциально неприятный для просмотра/прослушивания контент На первом этапе требуется работа только с обработкой текста и обработкой изображений. Приоритет будет отдан исполнителю, который сможет в перспективе развить решение для обработки аудио и видео файлов (списков форматов ограничен), а так же работает хотя бы с одним из языков или фреймворков .NET / Go / Python Уже имеющаяся инфраструктура, которая может помочь с выполнением задачи: K8s, Gitlab, S3. В случае наличия альтернативных стеков технологий для реализации задачи - пишите.
Data Science. Разработка с нуля. Необходимо разработать сервис интеграции с AI-агентами (Yandex GPT или DeepSeek) или собственное решение по обработке текстового, графического, аудио и видео контента на предмет наличия: - нарушения законов РФ - нецензурных, токсичных, оскорбительных выражений - порнография и потенциально неприятный для просмотра/прослушивания контент На первом этапе требуется работа только с обработкой текста и обработкой изображений. Приоритет будет отдан исполнителю, который сможет в перспективе развить решение для обработки аудио и видео файлов (списков форматов ограничен), а так же работает хотя бы с одним из языков или фреймворков .NET / Go / Python Уже имеющаяся инфраструктура, которая может помочь с выполнением задачи: K8s, Gitlab, S3. В случае наличия альтернативных стеков технологий для реализации задачи - пишите.
Data Science. Разработка с нуля. Необходимо разработать сервис интеграции с AI-агентами (Yandex GPT или DeepSeek) или собственное решение по обработке текстового, графического, аудио и видео контента на предмет наличия: - чувствительного текстового контента - потенциально неприятный для просмотра/прослушивания контент На первом этапе требуется работа только с обработкой текста и обработкой изображений. Приоритет будет отдан исполнителю, который сможет в перспективе развить решение для обработки аудио и видео файлов (списков форматов ограничен), а так же работает хотя бы с одним из языков или фреймворков .NET / Go / Python Уже имеющаяся инфраструктура, которая может помочь с выполнением задачи: K8s, Gitlab, S3. В случае наличия альтернативных стеков технологий для реализации задачи - пишите.
Data Science. выполнение проекта в университете с ТЗ. Тема: Анализ эффективности онлайн-рекламы. Описание: Оценка эффективности различных форматов цифровой рекламы и факторов, влияющих на клики и конверсии. ДАнные содержат информацию о платформе размещения, времени показа, целевой аудитории, количестве показов, кликов, конверсий. Проект нацелен помочь маркетологам оптимизировать рекламные кампании и повысит RQI.
Data Science. Разработка с нуля. Пожелания и особенности: Предложен датасет "САВ Проект 2 Данные.xlsx", на основе которого необходимо будет сделать исследовательский отчет по клиентской базе. Отчет должен отвечать на следующие вопросы: 1. На какие сегменты делится клиентская база и какими характеристиками обладает каждый сегмент 2. Какие товары пользуются популярностью у каждого потребительского сегмента Результатом работы должен являться Jupiter-notebook, содержащий в себе исследовательский отчет. Допустимо (и рекомендуется) использовать Google Colab cсылка на него должна располагаться в Google таблице Ответ на каждый вопрос подразумевает наличие: 1. Программного кода обработки данных 2. Результатов обработки данных в виде таблиц и графиков 3. Текстовое описание результатов обработки данных В ответе на первый вопрос обязательно наличие кода модели кластеризации Кроме того, отчет должен содержать общий вывод и рекомендации для собственника бизнеса Также важна аккуратность отчета: отсутствие орфографических и пунктуационных ошибок, отсутствие промежуточных вычислений в итоговом файле отчета, наличие подписей под графиками, грамотное оформление таблиц с помощью программного кода.
Data Science. Разработка с нуля. Пожелания и особенности: Нужно разработать код на Python в рамках проекта по цифровым компетенциям, которая анализирует данные. Что именно требуется сделать в коде (общий принцип) Нужно написать программу на Python, которая выполняет определённую задачу по выбранной теме и по итогам работы создаёт .txt-файл с результатами. Важно: входные данные не должны быть прописаны внутри кода. То есть нельзя делать так: input_text = "hello my name is Vicky..." Вместо этого входные данные должны быть в отдельном файле (.txt или .csv), загруженном в Google Colab. Код должен читать этот файл с диска и далее работать только с ним. В коде обязательно должны быть комментарии, объясняющие ключевые действия программы: # читает файл, # считает количество слов, # очищает текст, # создаёт словарь частот, и т.п. Комментариев должно быть достаточно, чтобы выполнялись требования преподавателя. Их нужно писать через # Также работа проходит антиплагиат, поэтому должна быть уникальной.
Data Science. Разработка с нуля, Консультация. Работаю на runpod serverless. Необходима queue-based через воркер от runpod (vLLM) или разработка собственной точки для очереди. Load Balanced не понятно как работает. Мне необходимо найти хорошие модели llm для 24Gb и 48Gb VRAM и помочь с деплоем. Были множество проблем с использованием worker-vllm от runpod, настройки довольно скудны и возникают ошибки, скорее всего из-за использования старой версии vllm. Также если вы разрабатывает свои serverless точки, хотел бы тоже услышать цену.
Тестирование. Проект из двух частей: 1 - проверка корректности А\Б тестирования 2 - Проверка гипотез методами математической статистики подробности в лс (работа объемная).
Data Science. Разработка с нуля, доработка существующего продукта. Необходимо разработать модуль(главный класс) фонового сервера одноранговой децентрализованной сети.
Настройка, доработка существующего продукта. Сайт собран на Тильде. Хотим подключить его к партнерской сети (CPA-сети) для рекламных кампаний. Функционал Postback есть у всех крупных партнёрских программ, CPA-сетей и сервисов для онлайн-обучения. Смысл работы Postback такой: * настраиваем отправку Postback уведомлений о наступлении определённых событий на указанные URL (указываем ссылку с необходимыми макросами) * при наступлении этих событий, отправляется постбек на указанный URL Для аналитики трафика достаточно уведомлений об этих событиях: * новая регистрация (новый подписчик) * заказ создан * заказ оплачен (частично или полностью) * возврат заказа (не обязательно) Т.е. на каждое событие можно указать разный URL. Главный вопрос — понять можно ли реализовать этот функционал на тильде, или с привлечением других сервисов. Пожалуйста откликайтесь с ответом — можно ли это реализовать По деталям отвечу в чате.
Data Science. Разработка с нуля. Всем привет! Требуется написать парсер для Маркетплейса Озон исходя из тех методов которые мне нужны. Пользуюсь для работы гугл таблицами, но сталкиваюсь с ограничением хранения данных. Что мне нужно: Написать парсер который будет выгружать отчеты и складывать их в базу данных, чтобы я мог либо в гугл таблицы тянуть их сразу, либо выводить в Яндекс Datalens. В идеале чтобы Вы могли настроить и Datalens так чтобы получились рабочие таблицы по той структуре которая есть у меня. Прошу писать ставку за час и примерное количество часов, которое Вам потребуется на решение задачи.
Data Science. Разработка с нуля. Есть облако точек, полученное после чканировани лидером. Необходимо делать эталонное сканирование и потом находить толщину остаточную объекта на основе сравнения двух облак точек.
Разработка с нуля. Запросить написание статьи о (Методы и алгоритмы прогнозирования энергобаланса РФ на основе искусственного интеллекта и статистики ) Статья будет опубликована ВАК.
Написать проект в университет. Пожелания и особенности: Скину подробное описание самому кандидату. Проект по анализу данных — это командная работа, где вы выбираете подходящий датасет, согласовываете его с ассистентом, а затем полностью анализируете. Вам нужно взять таблицу с минимум 100 наблюдениями, в которой есть и числовые, и категориальные признаки, а также одна целевая переменная, по которой можно строить линейную или логистическую регрессию. После выбора данных вы загружаете их в Jupyter Notebook и проводите разведочный анализ. В ходе EDA вы описываете признаки, определяете их типы, проверяете наличие пропусков и дубликатов и очищаете данные. Затем вы строите графики распределений количественных и категориальных признаков, находите и удаляете выбросы двумя методами — по стандартным отклонениям и по межквартильному размаху. После этого считаете описательные статистики, интерпретируете их и перекодируете категориальные признаки с помощью OneHotEncoder и LabelEncoder. Далее начинается исследовательский этап: вы рассчитываете корреляции между целевой переменной и предикторами, строите корреляционную матрицу, выбираете наиболее связанные признаки и при желании масштабируете числовые данные. Затем вы строите модель регрессии: делите данные на тренировочную и тестовую выборки, обучаете модель, записываете уравнение регрессии в LaTeX, интерпретируете коэффициенты и оцениваете качество модели по метрикам. После этого вы проводите все статистические тесты, которые проходили на курсе, формулируете гипотезы, оформляете их в LaTeX и интерпретируете результаты. Также для бонуса можно выполнить бутстрап-тест. Весь проект должен быть оформлен в одном Jupyter Notebook формата .ipynb и содержать код, графики, выводы и пояснения в markdown. Потом вы защищаете проект: каждому участнику задают по пять вопросов по любому месту проекта, и количество правильных ответов влияет на итоговую оценку. В итоге проект — это полный анализ выбранного датасета от его подготовки до построения модели и статистических выводов, оформленный в ноутбуке и устно защищённый перед преподавателем. ДАТАСЕТ УЖЕ ВЫБРАН.
Написать проект по анализу данных. Пожелания и особенности: Проект по анализу данных — это работа, где вы выбираете подходящий датасет, а затем полностью анализируете. Вам нужно взять таблицу с минимум 100 наблюдениями, в которой есть и числовые, и категориальные признаки, а также одна целевая переменная, по которой можно строить линейную или логистическую регрессию. После выбора данных вы загружаете их в Jupyter Notebook и проводите разведочный анализ. В ходе EDA вы описываете признаки, определяете их типы, проверяете наличие пропусков и дубликатов и очищаете данные. Затем вы строите графики распределений количественных и категориальных признаков, находите и удаляете выбросы двумя методами — по стандартным отклонениям и по межквартильному размаху. После этого считаете описательные статистики, интерпретируете их и перекодируете категориальные признаки с помощью OneHotEncoder и LabelEncoder. Далее начинается исследовательский этап: вы рассчитываете корреляции между целевой переменной и предикторами, строите корреляционную матрицу, выбираете наиболее связанные признаки и при желании масштабируете числовые данные. Затем вы строите модель регрессии: делите данные на тренировочную и тестовую выборки, обучаете модель, записываете уравнение регрессии в LaTeX, интерпретируете коэффициенты и оцениваете качество модели по метрикам. После этого вы проводите все статистические тесты, которые проходили на курсе, формулируете гипотезы, оформляете их в LaTeX и интерпретируете результаты. Также для бонуса можно выполнить бутстрап-тест. Весь проект должен быть оформлен в одном Jupyter Notebook формата .ipynb и содержать код, графики, выводы и пояснения в markdown.
Data Science. лабораторная с чатом гпт. Есть лабы изичные, чисто с чатом гпт делаются. Там тяжелее отчёт даже сделать, ну в плане просто нужно сделать нормальный отчёт по примеру. Есть 3 лабы, по два варианта(они +- похожи). На один вариант 500р, то есть лаба 1000р. Если интересно, можно сразу в тг@Есть пример отчетов, сделанных лаб. Например вот Составить программу, которая, с использованием алгоритмов оптимизации (генетическому и по варианту), аппроксимирует функции, задаваемые по варианту. В отчёте отразить: + общие этапы функционирования системы; + предлагаемый генетический алгоритм (выбранные функции мутаций, скрещивания и пр.); + описание второго алгоритма (по варианту); + особенности реализации (рекомендуется использовать готовые библиотеки); + результаты работы (среднеквадратичная ошибка; время вычислений); + результаты сравнения генетического алгоритма и по-варианту; P.S. ГА необходимо реализовать всем участникам этой лабораторной работы, но дополнительно попадётся эволюционный алгоритм Очевидно, что пользоваться готовыми реализациями НУЖНО Вариант: f(x) = sin(x)*(sin(x)+cos(x)), x\in [-2\pi; +2\pi], g(x) = x^2 + x -5, искусственного косяка рыб.
Data Science. Тестирование, доработка существующего продукта. Нужна помощь с заданием по программированию, есть 3-4 дня чтобы подготовить код, презентацию сделаю сам.
Data Science. Разработка с нуля. Необходимо подготовить проект по теме "Прогнозирование продаж продуктов компании с использованием временных рядов" c разработкой сервиса по требованиям.
Почему стоит искать работу для фриласнеров по профилю data scientist в России у нас?
🔸 Более 1 предложений о работе за сегодня в тематике data scientist
🔸 Работа и подработка на бирже фриланса от прямых заказчиков, которым нужна помощь специалистов по профилю data scientist уже сегодня!
🔸 Свежих заказов на data scientist в России для фрилансеров на апрель 2026 года — 104 шт.
Как найти удалённую работу для фриланс-специалистов по профилю data scientist в России?
Вы специалист по data scientist и ищете проекты и заказы на удалёнке в России? Нам всегда есть что вам предложить. Ежедневно мы публикуем новые проекты и заказы по вашей специальности. Найдите интересную работу уже сегодня
Сколько проектов для IT-специалистов по профилю data scientist в России?
На апрель 2026 года опубликовано 104 предложений удалённой работы от прямых заказчиков для исполнителей по специализации data scientist
Сколько можно заработать выполняя проекты по data scientist?
Специалисты по профилю data scientist зарабатывают от 0.00 рублей с заказа. Хотите больше? Выполняйте как можно больше заказов и зарабатывайте сколько пожелаете