Уточните категорию: программисты. Data Science. Помощь в решении одной задачи. Поднять кластер локально с помощью контейнеров в Docker (делали на семинаре); Загрузите датасет по ценам на жилье Airbnb, доступный на kaggle.com: https://www.kaggle.com/dgomonov/new-york-city-airbnb-open-data; Используя Python, реализуйте скрипт mapper.py и reducer.py для расчета, и с помощью MapReduce расчитайте среднее значение и дисперсию по признаку “price” (возможно потребуются ассимптотические формулы для дисперсии); Подсчитайте среднее значение и дисперсию по признаку “price” в Hive; Сравните результаты, какой вариант предпочтительнее? Быстрее?.