Manual-Workflow

Diese Datei beschreibt, was du als Nutzer tust, wenn du eine neue PDF-Seite oder ein ganzes Kapitel ins Projekt bringst. Den Rest (OCR, Diagramm-Aufbereitung, Übersetzung, Vault-Pflege) macht Claude Code.

1. Neue PDF reinbringen

PDF in 01_manual/original/ ablegen. Dateiname am besten klein und sprechend, z.B. section_6C_exhaust_manifolds.pdf.
In den Chat: „Neue PDF in original/, bitte verarbeiten.”
Claude erkennt Section/Kapitel, OCR-iert, extrahiert Roh-Diagramme, sucht Tabellen, uebersetzt und legt 01_manual/de_uebersetzt/<NX>_<name>.md an.

Wenn Diagramm-Crops noetig sind (haeufig der Fall), liefert Claude zuerst die rohen Page-Renderings in 01_manual/diagramme/raw/<pdf>/ und meldet zurueck, welche Seiten Diagramme enthalten — du croppst manuell und legst sie nach 01_manual/diagramme/ mit Namensschema {bild-id}_{kurz}.jpg.

2. Status pruefen

python3 scripts/manual_pipeline.py --status

Zeigt alle Sections mit Status, OCR-Qualitaet, Diagramm-Flag und welchen Rohmaterialien vorhanden sind.

Master-Statustabelle aller Sections (auch noch nicht digitalisierte): index.

3. Korrekturen an Übersetzung anbringen

Wenn dir bei einer Übersetzung etwas auffaellt, setze einen HTML-Kommentar-Marker direkt im .md:

... Originaltext ...
<!-- KORREKTUR: "Anlasser" statt "Starter", weil im Schaltplan
     so beschriftet -->
... naechster Satz ...

Dann im Chat: „Uebernimm Korrekturen in 01A_general_information.md.”

Claude:

findet alle KORREKTUR-Marker
setzt die Aenderungen um
entfernt die Marker
aktualisiert Glossar / Stilleitfaden, falls die Korrektur eine generelle Regel impliziert
commitet mit Nachricht „Korrekturen in Section XYZ eingearbeitet”

4. Fachfrage offen halten

Wenn beim Übersetzen oder Reparieren etwas unklar ist, das besser im Chat-Interface geklaert wird (Bezugsquelle, Modellunterschied, Foren-Erfahrungswert): Eintrag in offene_fragen mit Frage und Kontext.

Du nimmst die Frage in den Chat, holst Antwort, gibst sie hier zurueck. Claude Code uebernimmt die Antwort in den Vault und hakt die Frage ab.

5. Validierung einzelner Dateien

python3 scripts/manual_pipeline.py --validate \
  01_manual/de_uebersetzt/01A_general_information.md

Prueft Frontmatter, Pflichtfelder, Status-Wert, Body-Struktur, Dateiname-Konvention. Exit-Code 0 = ok, 1 = Fehler.

6. Häufige Befehle

# OCR + Volltextdump fuer eine PDF (idempotent, mehrfach unbedenklich)
python3 scripts/manual_pipeline.py --ocr \
  01_manual/original/section_6C_exhaust_manifolds.pdf
 
# Seitenrenderings als JPG 300 dpi fuer manuelles Croppen
python3 scripts/manual_pipeline.py --extract-diagrams \
  01_manual/original/section_6C_exhaust_manifolds.pdf
 
# Tabellen-Heuristik (nach --ocr ausfuehren)
python3 scripts/manual_pipeline.py --extract-tables \
  01_manual/ocr_raw/section_6C_exhaust_manifolds.pdf
 
# Status aller Sections
python3 scripts/manual_pipeline.py --status
 
# Validierung einer Übersetzung
python3 scripts/manual_pipeline.py --validate <pfad/zur/datei.md>

7. Was die Pipeline NICHT macht

Bewusst manuell gehalten, weil Automatik zu fehleranfaellig:

Finales Diagramm-Cropping — die Pipeline liefert Seiten-JPGs; Du oder Claude croppst pro Diagramm und vergibt den finalen Namen.
Tabellen-Korrektur — pdfplumber-Heuristik produziert Rohgeruest bei Scans; finale Bereinigung erfolgt manuell beim Übersetzen.
Schaltplaene (Section 4E) — separater Workflow, vor Bearbeitung abstimmen. Auflösung 600 dpi PNG, ggf. mehrseitiges Stitching.

8. Workflow-Anpassungen

Wenn der Stil-Leitfaden weiterentwickelt wird (z.B. neue Frontmatter-Felder, andere Tabellen-Konvention): die Aenderung landet in uebersetzungs_stil. Bei Konflikt zwischen diesem Workflow und dem Stil-Leitfaden gewinnt der Stil-Leitfaden.

Mercruiser 3.0 LX — Reparaturbegleiter

Bereiche

WORKFLOW