Для себя 1. Нужно найти и проанализировать данные на определеную тему. 2. Создать блокнот –> загрузить туда найденные данные –> вывести первые 5 строчек датафрейма –> На 2-3 абзаца в ячейке типа Markdown (это было на основах питона) описать, что за данные, откуда, какие переменные там есть 3. Применить фильтрацию минимум по 5 условиям. Сделать содержательные выводы. 4. Отсортировать данные минимум по 3 условиям. Сделать содержательные выводы 5. Создать частотные таблицы по тем переменным, по которым это возможно. Прокомментировать результаты в ячейке типа Markdown. 6. По имеющимся данным создать свою собственную переменную. 7. Для всех переменных (если очень много, то для пяти) рассчитать подходящие меры центральной тенденции (мода/медиана/среднее), проинтерпретировать их. Для разных шкал можно считать разные МЦТ (например, для возраста можно хоть все три посчитать можете, а для цвета только моду). 8. Посмотреть на выбросы хотя бы по двум переменным. Визуализируйте с помощью ящика с усами. Проинтерпретируйть весь график. 9. Хотя бы для одной переменной посчитать выбросы как с помощью межквартильного размаха, так и с помощью среднеквадратичного отклонения от среднего. Отличаются ли результаты? Проинтерпретируйте их. 10. Если выбросы есть, удалить их (если данных много) или заменить на среднее/медиану (если данных мало) и посмотреть, как поменялись меры центральной тенденции в рассматриваемой переменной. 11. Если в данных есть пропущенные значения, указать, в каких переменных и сколько их. 12. Построить корреляционную матрицу только по тем признакамм, которые можно интерпретировать. (Если таких пар очень много, построить по 5 любым) 13. Интепретировать каждое значение корреляции в матрице. 14. Построить графики рассеяния по этим признакам. 15. Во всех графиках, которые делались на предыдущих этапах: изменить цвета, добавить заголовки, подписать оси. Если по каким-то причинам не был построен ни одного график, построить их (минимум 5) и добавить заголовки, название осей и свой цвет Окончательный дедлайн 10.12.2023