Data Science. Разработка с нуля. Пожелания и особенности: Python backend-разработчик для AI-сервиса (Telegram-бот + анализ тендерной документации) О ПРОЕКТЕ Разрабатываю сервис, который автоматически разбирает техническую и закупочную документацию (PDF, Word, Excel, сканы, чертежи) и по запросу формирует готовые рабочие документы: перечень оборудования с расчётом (Excel), аналитическую записку (PDF), документы по шаблону (Word). Клиент работает через Telegram-бота. Внутри — AI-ядро на базе LLM, которое извлекает данные с указанием источника и уровня доверия. Есть подробный технический бриф сборки, схемы архитектуры и JSON-контракты. Работаем по готовому ТЗ, а не «придумай сам». ЧТО НУЖНО СДЕЛАТЬ (MVP) • Telegram-бот: диалог, проекты, загрузка файлов, статусы • Загрузка документов через SFTP с жёсткой изоляцией по клиентам • Фоновый разбор документов: парсинг, OCR, дедупликация, классификация, эмбеддинги, векторный поиск • AI-ядро: оркестрация пайплайна на Python (Anthropic/Claude API), извлечение в структурированный JSON, проверки, self-check • Детерминированный расчётный модуль на Python + генерация Excel/PDF/Word строго по шаблонам • Учёт расхода, логирование, аудит • Админ-панель: статусы, ошибки, очередь ручной проверки СТЕК Python 3.12, aiogram 3, FastAPI, PostgreSQL 16 + pgvector, SQLAlchemy, Redis + ARQ, Azure Document Intelligence (OCR), Anthropic SDK, openpyxl / WeasyPrint / docxtpl, Docker, Hetzner (Ubuntu 24.04), Caddy, OpenSSH SFTP. ОБЯЗАТЕЛЬНЫЕ НАВЫКИ • Python (асинхронный), от 3 лет коммерческого backend-опыта • PostgreSQL + SQLAlchemy, проектирование схемы; pgvector или готовность быстро освоить • Redis + очереди задач (ARQ/Celery), фоновая обработка • FastAPI, REST API, опыт с админками • Telegram-боты на aiogram 3 (или сильный опыт с другим ботовым фреймворком + готовность перейти на aiogram) • Docker, Linux (Ubuntu), деплой на VPS, reverse proxy, HTTPS, systemd • Реальный опыт интеграции LLM через API (Anthropic / OpenAI / др.): структурированный вывод JSON, RAG / retrieval, эмбеддинги — не разовый вызов, а рабочий пайплайн • Безопасность и мультитенантность: изоляция данных между клиентами, управление секретами, контроль доступа. Это критично — в системе хранятся коммерчески чувствительные данные • Git / GitHub, аккуратные коммиты БУДЕТ ПЛЮСОМ • OCR-интеграция (Azure Document Intelligence или аналог), парсинг PDF / Word / Excel • Генерация документов: openpyxl, WeasyPrint / ReportLab, docxtpl / python-docx • SFTP + chroot, 2FA • Опыт с AI-агентами / многошаговыми LLM-пайплайнами (Flowise / LangChain — опционально) • Продакшен-LLM: контроль стоимости, кэширование, лимиты запросов • Опыт в тендерах / закупках или в документоёмких системах ФОРМАТ РАБОТЫ • Проектно, поэтапно (по этапам брифа); возможно долгосрочное сотрудничество • Свой репозиторий на GitHub, фиксация всех изменений • Сдача по end-to-end критериям приёмки (прописаны в брифе), а не «вроде отвечает» • Связь и документация на русском ЧТО ПРИСЛАТЬ В ОТКЛИКЕ 1. Кратко: похожие проекты — боты, LLM-интеграции, мультитенантные системы (ссылки или описание) 2. 2–3 предложения: как обеспечивали изоляцию данных между клиентами и как работали с LLM (structured output / RAG) 3. Ваша оценка сроков и стоимости по описанному объёму (можно вилкой).