Задачи чат-бота: Проверка орфографии и пунктуации в pdf-файлах. Платформа: Telegram. Продукт: Типография. Техзадание есть. Меня зовут Дмитрий, занимаюсь продюсированием IT-проектов. Ищу разработчика. Задача: доработка OCR-сервиса для проверки орфографии и пунктуации на PDF-этикетках. Нужен Python-разработчик, который поможет повысить точность распознавания текста и проверки орфографии/пунктуации по PDF-файлам (этикетки, исходники, сканы). Сейчас используется OCR-распознавание (Яндекс Vision) и базовые проверки, но качество нестабильное: сервис находит ошибки, которых нет, и пропускает реальные. Цель — добиться максимального результата точности от 97% при проверке текстов на русском языке. Что нужно сделать: • Настроить и доработать пайплайн распознавания (OCR) для PDF/изображений; • Предобработка изображений (очистка, контраст, выравнивание, шумы); • Настроить проверку орфографии и пунктуации (Speller / LanguageTool / кастомные правила); • Добавить возможность использовать собственный словарь (бренды, термины и т.д.); • Сформировать API или модуль, который можно подключить к боту/веб-сервису; • Добиться точности ≥ 97 % на тестовых примерах. Требования: • Уверенный Python 3, опыт с OCR (Tesseract, Yandex Vision, ABBYY SDK); • Опыт работы с текстовой обработкой и морфологией русского языка; Условия: Формат: удалённо, проектная занятость. Ожидаемый результат: стабильная система, которая выдаёт корректные результаты с точностью 97 %+. Кто может реализовать, пишите мне в личку обсудим более детально@dmitrii_chas 🤗.