Для себя Во всех заданиях данного раздела запрещено использовать циклы и list comprehensions. Под вектором и матрицей в данных заданиях понимается одномерный и двумерный numpy.array соответственно. In [ ]: import numpy as np 1. (0.5 балла) Реализуйте функцию, возвращающую максимальный элемент в векторе x среди элементов, перед которыми стоит нулевой. Для x = np.array([6, 2, 0, 3, 0, 0, 5, 7, 0]) ответом является 5. Если нулевых элементов нет, функция должна возвращать None. In [ ]: def max_element(arr): # Your code here 2. (0.5 балла) Реализуйте функцию, принимающую на вход матрицу и некоторое число и возвращающую ближайший к числу элемент матрицы. Например: для X = np.arange(0,10).reshape((2, 5)) и v = 3.6 ответом будет 4. In [ ]: def nearest_value(X, v): # Your code here 3. (0.5 балла) Реализуйте функцию scale(X), которая принимает на вход матрицу и масштабирует каждый ее столбец (вычитает выборочное среднее и делит на стандартное отклонение). Убедитесь, что в функции не будет происходить деления на ноль. Протестируйте на случайной матрице (для её генерации можно использовать, например, функцию numpy.random.randint). In [ ]: def scale(X): # Your code here 4. (0.5 балла) Реализуйте функцию, которая для заданной матрицы находит: определитель след наименьший и наибольший элементы норму Фробениуса собственные числа обратную матрицу Для тестирования сгенерируйте матрицу с элементами из нормального распределения N (10,1) In [ ]: def get_stats(X): # Your code here 5. (0.5 балла) Повторите 100 раз следующий эксперимент: сгенерируйте две матрицы размера 10x10 из стандартного нормального распределения, перемножьте их (как матрицы) и найдите максимальный элемент. Какое среднее значение по экспериментам у максимальных элементов? 95-процентная квантиль? In [ ]: for exp_num in range(100): # Your code here Pandas Ответьте на вопросы о данных по авиарейсам в США за январь-апрель 2008 года. Данные и их описание In [ ]: import pandas as pd %matplotlib inline 6. (0.3 балла) Какая из причин отмены рейса (CancellationCode) была самой частой? (расшифровки кодов можно найти в описании данных) In [ ]: # Your code here 7. (0.3 балла) Найдите среднее, минимальное и максимальное расстояние, пройденное самолетом. In [ ]: # Your code here 8. (0.3 балла) Не выглядит ли подозрительным минимальное пройденное расстояние? В какие дни и на каких рейсах оно было? Какое расстояние было пройдено этими же рейсами в другие дни? In [ ]: # Your code here 9. (0.3 балла) Из какого аэропорта было произведено больше всего вылетов? В каком городе он находится? In [ ]: # Your code here 10. (0.3 балла) Найдите для каждого аэропорта среднее время полета (AirTime) по всем вылетевшим из него рейсам. Какой аэропорт имеет наибольшее значение этого показателя? In [ ]: # Your code here 11. (1 балл) Найдите аэропорт, у которого наибольшая доля задержанных (DepDelay > 0) рейсов. Исключите при этом из рассмотрения аэропорты, из которых было отправлено меньше 1000 рейсов (используйте функцию filter после groupby). In [ ]: # Your code here Линейная регрессия В этой части мы разберемся с линейной регрессией, способами её обучения и измерением качества ее прогнозов. Будем рассматривать датасет из предыдущей части задания для предсказания времени задержки отправления рейса в минутах (DepDelay). Отметим, что под задержкой подразумевается не только опоздание рейса относительно планируемого времени вылета, но и отправление до планируемого времени. Подготовка данных 12. (1 балл) Считайте выборку из файла при помощи функции pd.read_csv и ответьте на следующие вопросы: Имеются ли в данных пропущенные значения? Сколько всего пропущенных элементов в таблице "объект-признак"? Сколько объектов имеют хотя бы один пропуск? Сколько признаков имеют хотя бы одно пропущенное значение? In [ ]: # Your code here Как вы понимаете, также не имеет смысла рассматривать при решении поставленной задачи объекты с пропущенным значением целевой переменной. В связи с этим ответьте на следующие вопросы и выполните соответствующие действия: Имеются ли пропущенные значения в целевой переменной? Проанализируйте объекты с пропущенными значениями целевой переменной. Чем вызвано это явление? Что их объединяет? Можно ли в связи с этим, на ваш взгляд, исключить какие-то признаки из рассмотрения? Обоснуйте свою точку зрения. Исключите из выборки объекты с пропущенным значением целевой переменной и со значением целевой переменной, равным 0, а также при необходимости исключите признаки в соответствии с вашим ответом на последний вопрос из списка и выделите целевую переменную в отдельный вектор, исключив её из матрицы "объект-признак". In [ ]: # Your code here 13. (0.5 балла) Обратите внимание, что признаки DepTime, CRSDepTime, ArrTime, CRSArrTime приведены в формате hhmm, в связи с чем будет не вполне корректно рассматривать их как вещественные. Преобразуйте каждый признак FeatureName из указанных в пару новых признаков FeatureName_Hour, FeatureName_Minute, разделив каждое из значений на часы и минуты. Не забудьте при этом исключить исходный признак из выборки. В случае, если значение признака отсутствует, значения двух новых признаков, его заменяющих, также должны отсутствовать. Например, признак DepTime необходимо заменить на пару признаков DepTime_Hour, DepTime_Minute. При этом, например, значение 155 исходного признака будет преобразовано в значения 1 и 55 признаков DepTime_Hour, DepTime_Minute соответственно. In [ ]: # Your code here 14. (1 балл) Некоторые из признаков, отличных от целевой переменной, могут оказывать чересчур значимое влияние на прогноз, поскольку по своему смыслу содержат большую долю информации о значении целевой переменной. Изучите описание датасета и исключите признаки, сильно коррелирующие с ответами. Ваш выбор признаков для исключения из выборки обоснуйте. Кроме того, исключите признаки TailNum и Year. In [ ]: # Your code here 15. (0.5 балла) Приведем данные к виду, пригодному для обучения линейных моделей. Для этого вещественные признаки надо отмасштабировать, а категориальные — привести к числовому виду. Также надо устранить пропуски в данных. В первую очередь поймем, зачем необходимо применять масштабирование. Следующие ячейки с кодом построят гистограммы для 3 вещественных признаков выборки. In [ ]: X['DepTime_Hour'].hist(bins=20) In [ ]: X['TaxiIn'].hist(bins=20) In [ ]: X['FlightNum'].hist(bins=20) Какую проблему вы наблюдаете на этих графиках? Как масштабирование поможет её исправить? Некоторые из признаков в нашем датасете являются категориальными. Типичным подходом к работе с ними является бинарное, или one-hot-кодирование. Реализуйте функцию transform_data, которая принимает на вход DataFrame с признаками и выполняет следующие шаги: Замена пропущенных значений на нули для вещественных признаков и на строки 'nan' для категориальных. Масштабирование вещественных признаков с помощью StandardScaler. One-hot-кодирование категориальных признаков с помощью DictVectorizer или функции pd.get_dummies. Метод должен возвращать преобразованный DataFrame, который должна состоять из масштабированных вещественных признаков и закодированных категориальных (исходные признаки должны быть исключены из выборки). In [ ]: def transform_data(data): # Your code here Примените функцию transform_data к данным. Сколько признаков получилось после преобразования? In [ ]: # Your code here 16. (1 балл) Разбейте выборку и вектор целевой переменной на обучение и контроль в отношении 70/30 (для этого можно использовать, например, функцию train_test_split). In [ ]: # Your code here Scikit-learn Теперь, когда мы привели данные к пригодному виду, попробуем решить задачу при помощи метода наименьших квадратов. Напомним, что данный метод заключается в оптимизации функционала MSE Заметим, что решение данной задачи уже реализовано в модуле sklearn в виде класса LinearRegression. 17. (1 балл) Обучите линейную регрессию на 1000 объектах из обучающей выборки и выведите значения MSE и R2 на этой подвыборке и контрольной выборке (итого 4 различных числа). Проинтерпретируйте полученный результат — насколько качественные прогнозы строит полученная модель? Какие проблемы наблюдаются в модели? Подсказка: изучите значения полученных коэффициентов w, сохраненных в атрибуте coef_ объекта LinearRegression. In [ ]: # Your code here Для решения описанных вами в предыдущем пункте проблем используем L1- или L2-регуляризацию, тем самым получив Lasso и Ridge регрессии соответственно и изменив оптимизационную задачу одним из следующих образов: где α — коэффициент регуляризации. Один из способов его подбора заключается в переборе некоторого количества значений и оценке качества на кросс-валидации для каждого из них, после чего выбирается значение, для которого было получено наилучшее качество. 18. (1 доп. балл) Обучите линейные регрессии с L1- и L2-регуляризатором, подобрав лучшее значение параметра регуляризации из списка alpha_grid при помощи кросс-валидации c 5 фолдами на тех же 1000 объектах, что и в п.17. Выведите значения MSE и R2 на обучающей и контрольной выборках. Удалось ли решить указанные вами ранее проблемы? Для выполнения данного задания вам могут понадобиться реализованные в библиотеке объекты LassoCV, RidgeCV и KFold. In [ ]: # Your code here Срок 20.05, оплата после проверки на работоспособность и правильность кода
Для себя Нужна помощь кодера (Python), который разбирается в криптографии. Требуется помощь в выполнении следующих заданиях (на выбор): 1) написать программную реализацию одной из следующих хэш-функций (по выбору): - ГОСТ Р 34.11-2012 (или его международный вариант ГОСТ 34.11-2018) с длиной хэш-значения 256 или 512 бит по выбору; - SHA-3 (вариант алгоритма по выбору); 2) написать программную реализацию алгоритмов на выбор: - ASCON-128 в режиме AEAD; - PRESENT в режиме AEAD в стандарте GCM mode; - CLEFIA в режиме AEAD в стандарте GCM mode; Требования по программной реализации вышлю.
Написание кода для диплома Написать код для обнаружения, детекции и классификации транспортных средств с помощью YOLOv4 либо обучить нейронную сеть взяв уже готовый датасет. 1. Решение задач обнаружения и классификации движущихся ТС. 2. Отслеживание траектории движения ТС. 3. Анализ характеристики транспортных потоков. 4. Разработка алгоритмов обработки видеоданных на языке Python с применением библиотеки OpenCV.
учеба Помощь с выполнением нескольких заданий по машинному обучению в питоне через юпитер ноутбук в течение 1-1,5 месяца. Также помощь в разборе выполненных заданий, с их пониманием и усвоением.
Для работы На основе таблицы, с помощью Python нужно рассчитать основные статистики: по типу рассчитать коэффициент корреляции, построить гистограмму, построить регрессионную модель.
Для себя Статистический анализ таблицы: т.е. На основе таблицы, с помощью Python нужно рассчитать: коэффициент корреляции, построить гистограмму, построить регрессионную модель.
преподаватель в онлайн университет **Чем предстоит заниматься:** - Проведение вебинаров до 6 раз в неделю продолжительностью 1-2 часа с пояснением теоретического материала - Консультирование учеников и ответы на их вопросы - Составление домашних заданий для учеников - Проверка домашних заданий учеников - Обеспечение поддержки ученикам по курсу и другим связанным вопросам - Установление связи с учениками, которые испытывают затруднения с пониманием материала и предоставление более детальных объяснений **Что важно для нас:** - Умение ясно объяснять сложные концепции и взаимодействовать с учениками - Хорошие коммуникативные и организационные навыки - Ответственность и терпение при работе с учениками разного уровня подготовки - Плюсом будет-Опыт преподавания Phyton и связных предметов **Мы предлагаем:** - Конкурентную заработную плату от 60000 рублей (+ дополнительный вебинар оплачивается 2000 руб) - График работы 5/2 с 10-22:00 - Оформление по самозанятости/ИП (паспорт РФ-обязательно) - Выплату заработной платы 1 раз в месяц 15 числа
преподаватель в онлайн университет **Чем предстоит заниматься:** - Проведение вебинаров до 6 раз в неделю продолжительностью 1-2 часа с пояснением теоретического материала - Консультирование учеников и ответы на их вопросы - Составление домашних заданий для учеников - Проверка домашних заданий учеников - Обеспечение поддержки ученикам по курсу и другим связанным вопросам - Установление связи с учениками, которые испытывают затруднения с пониманием материала и предоставление более детальных объяснений **Что важно для нас:** - Умение ясно объяснять сложные концепции и взаимодействовать с учениками - Хорошие коммуникативные и организационные навыки - Ответственность и терпение при работе с учениками разного уровня подготовки - Плюсом будет-Опыт преподавания Phyton и связных предметов **Мы предлагаем:** - Конкурентную заработную плату от 60000 рублей (+ дополнительный вебинар оплачивается 2000 руб) - График работы 5/2 с 10-22:00 - Оформление по самозанятости/ИП (паспорт РФ-обязательно) - Выплату заработной платы 1 раз в месяц 15 числа
Написание программы для студенческой работы Необходимо написать программу, которая будет открываться на ноутбуке. Пользователь загружает фотографию / видео в определенном формате и получает на выход русский текст, содержащийся в файле. Необходимо использовать CV и создать элементарный интерфейс.
Для работы Нам нужна помощь с практической частью (Составление опроса, интерпретация результатов, код в R Studio/Python, проверка статистических гипотез). Мы на стадии рассылки опроса, он готов, но лучше перепроверить данные для создания моделей (линейная/логистическая регрессия)
Для себя Воплотить мат модель с использованием алгоритма пчелиной колонии. Есть псевдокод. Нужен специалист, который сделает и потом объяснит на готовом результате.
Как мне найти учеников по профилю python в России?
Зарегистрируйтесь и создайте привлекательный профиль с упоминанием вашей специализации. Обратите внимание на количество доступных заявок от учеников, которое на июнь 2026 года составляет 608
Какие требования к преподавателям на вашем сайте?
На нашем сайте приветствуются преподаватели с любым уровнем квалификации. Мы рекомендуем указать все свои сертификаты и образование, чтобы увеличить шансы на нахождение учеников
Могу ли я установить гибкий график работы?
Вы полностью контролируете свой график и можете обсуждать его напрямую с учениками, чтобы найти удобное время для обеих сторон
Каков потенциальный заработок для репетитора Python?
Заработок зависит от количества занятий и квалификации. В среднем, за одно занятие можно заработать 322.13 рублей с занятия. Больше занятий в неделю – выше доход