Разрабатывается диплом по анализу производственных данных по ОКВЭД 29.3 “Производство комплектующих и принадлежностей для автотранспортных средств“, в котором хочу использовать машинное обучение (catboost). Предварительно выделив основные процессы (логистика, планирование и управление производством, производство комплектующих, контроль качества) выявил примерные целевые параметры для анализа (процент брака, время простоя, время задержки и поставок). Для тренировки нужны датасеты, включающие целевой параметр и набор параметров, его характеризующий, - выходит, предполагается три модели. Диплом делается без доступа к реальным данным, а в интернете не нашлось подходящих датасетов. Кроме того, идея информационной системы - натренировать модель и поместить её в ИС, чтобы в последствии различные организации, работающие по 29.3, могли внедрить эту ИС и загонять в неё записи для прогноза, - это создаёт проблему того, что модель тренируется на одних категориальных данных, входящих в параметры целевого показателя, а на прогноз могут поступить совсем другие значения, - непонятно, как это проверять. Нужна помощь в поиске/разработке данных, а также в понимании работы с моделью (опыта почти нет).