e768d30fb6
Backend pipeline:
- POST /api/templates/import (multipart, max 25 MB)
- extract.ts: DOCX→mammoth, PDF→pdf-parse, fallback to OCR via tesseract+poppler-utils
(pdftoppm renders pages to PNG, tesseract reads with rus+eng)
- deepseek.ts: chat completions client with strict JSON response_format
- recognize.ts: structured prompt that produces simplified DocBody (string text),
postprocessor wraps text in TipTap-compatible JSON, validates with zod schema
- prompt enforces placeholder substitution: {{customer.*}}, {{executor.*}},
{{contract.number}}, {{contract.date}}, {{today}}
- error codes: NO_OCR / NO_DEEPSEEK_KEY / UNSUPPORTED_MIME / INVALID_DOC_BODY
Dockerfile: apk add tesseract-ocr (+rus +eng data), poppler-utils, imagemagick
Frontend:
- Templates page: ⤴ Загрузить документ → file picker (.docx,.pdf,.png,.jpg)
- doc type selector (contract/invoice/act/upd)
- import-banner with spinner shows uploading→analyzing stages
- on success navigates to /templates/:id (TemplateEdit) for review
Reuses DEEPSEEK_API_KEY pattern from Hall-planer.
Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
48 lines
2.0 KiB
Bash
48 lines
2.0 KiB
Bash
# --- API server ---
|
||
NODE_ENV=development
|
||
PORT=3030
|
||
HOST=127.0.0.1
|
||
|
||
# --- Database ---
|
||
DATABASE_URL=postgresql://docmanager:docmanager@localhost:5432/docmanager?schema=public
|
||
|
||
# --- SSO via auth.queo.ru ---
|
||
AUTH_ISSUER=https://auth.queo.ru
|
||
AUTH_AUDIENCE=queo.ru
|
||
AUTH_JWKS_URL=https://auth.queo.ru/.well-known/jwks.json
|
||
AUTH_COOKIE_NAME=q_at
|
||
AUTH_LOGIN_URL=https://auth.queo.ru/login
|
||
|
||
# --- CORS ---
|
||
# Допустимые источники для браузера (запятая). На проде: https://doc.queo.ru
|
||
CORS_ORIGINS=http://localhost:5173
|
||
|
||
# --- Tochka API ---
|
||
# 32 случайных байта в base64 — ключ AES-256-GCM для шифрования JWT-токенов Точки в БД.
|
||
# Генерация: node -e "console.log(require('crypto').randomBytes(32).toString('base64'))"
|
||
TOCHKA_JWT_KEY=
|
||
|
||
# --- Webhook secret для Точки ---
|
||
# Случайная строка, попадает в URL: /webhooks/tochka/<TOCHKA_WEBHOOK_SECRET>
|
||
TOCHKA_WEBHOOK_SECRET=
|
||
|
||
# --- Default organization (single-tenant v1) ---
|
||
# UUID единственной организации — сидится в M2.
|
||
DEFAULT_ORGANIZATION_ID=00000000-0000-0000-0000-000000000001
|
||
|
||
# DaData — заполнение карточки клиента/реквизитов компании по ИНН из ЕГРЮЛ.
|
||
# Получить «API-ключ для приложения» (не secret-key): https://dadata.ru/api/find-party/
|
||
# Бесплатно до 10000 запросов/сутки.
|
||
DADATA_API_KEY=
|
||
|
||
# DeepSeek — разбор загруженных шаблонов (DOCX/PDF/скан) в DocBody-структуру.
|
||
# Получить ключ: https://platform.deepseek.com/api_keys
|
||
DEEPSEEK_API_KEY=
|
||
# DEEPSEEK_BASE_URL=https://api.deepseek.com
|
||
# DEEPSEEK_MODEL=deepseek-chat
|
||
|
||
# --- Dev-only ---
|
||
# Если 1 — пропускает проверку JWT и подсовывает фейкового admin'а.
|
||
# В production отказывается стартовать с этой переменной.
|
||
DEV_BYPASS_AUTH=0
|