Manual-Workflow
Diese Datei beschreibt, was du als Nutzer tust, wenn du eine neue PDF-Seite oder ein ganzes Kapitel ins Projekt bringst. Den Rest (OCR, Diagramm-Aufbereitung, Übersetzung, Vault-Pflege) macht Claude Code.
1. Neue PDF reinbringen
- PDF in
01_manual/original/ablegen. Dateiname am besten klein und sprechend, z.B.section_6C_exhaust_manifolds.pdf. - In den Chat: „Neue PDF in original/, bitte verarbeiten.”
- Claude erkennt Section/Kapitel, OCR-iert, extrahiert
Roh-Diagramme, sucht Tabellen, uebersetzt und legt
01_manual/de_uebersetzt/<NX>_<name>.mdan.
Wenn Diagramm-Crops noetig sind (haeufig der Fall), liefert Claude
zuerst die rohen Page-Renderings in 01_manual/diagramme/raw/<pdf>/
und meldet zurueck, welche Seiten Diagramme enthalten — du croppst
manuell und legst sie nach 01_manual/diagramme/ mit Namensschema
{bild-id}_{kurz}.jpg.
2. Status pruefen
python3 scripts/manual_pipeline.py --statusZeigt alle Sections mit Status, OCR-Qualitaet, Diagramm-Flag und welchen Rohmaterialien vorhanden sind.
Master-Statustabelle aller Sections (auch noch nicht digitalisierte): index.
3. Korrekturen an Übersetzung anbringen
Wenn dir bei einer Übersetzung etwas auffaellt, setze einen
HTML-Kommentar-Marker direkt im .md:
... Originaltext ...
<!-- KORREKTUR: "Anlasser" statt "Starter", weil im Schaltplan
so beschriftet -->
... naechster Satz ...Dann im Chat: „Uebernimm Korrekturen in
01A_general_information.md.”
Claude:
- findet alle KORREKTUR-Marker
- setzt die Aenderungen um
- entfernt die Marker
- aktualisiert Glossar / Stilleitfaden, falls die Korrektur eine generelle Regel impliziert
- commitet mit Nachricht „Korrekturen in Section XYZ eingearbeitet”
4. Fachfrage offen halten
Wenn beim Übersetzen oder Reparieren etwas unklar ist, das besser im Chat-Interface geklaert wird (Bezugsquelle, Modellunterschied, Foren-Erfahrungswert): Eintrag in offene_fragen mit Frage und Kontext.
Du nimmst die Frage in den Chat, holst Antwort, gibst sie hier zurueck. Claude Code uebernimmt die Antwort in den Vault und hakt die Frage ab.
5. Validierung einzelner Dateien
python3 scripts/manual_pipeline.py --validate \
01_manual/de_uebersetzt/01A_general_information.mdPrueft Frontmatter, Pflichtfelder, Status-Wert, Body-Struktur, Dateiname-Konvention. Exit-Code 0 = ok, 1 = Fehler.
6. Häufige Befehle
# OCR + Volltextdump fuer eine PDF (idempotent, mehrfach unbedenklich)
python3 scripts/manual_pipeline.py --ocr \
01_manual/original/section_6C_exhaust_manifolds.pdf
# Seitenrenderings als JPG 300 dpi fuer manuelles Croppen
python3 scripts/manual_pipeline.py --extract-diagrams \
01_manual/original/section_6C_exhaust_manifolds.pdf
# Tabellen-Heuristik (nach --ocr ausfuehren)
python3 scripts/manual_pipeline.py --extract-tables \
01_manual/ocr_raw/section_6C_exhaust_manifolds.pdf
# Status aller Sections
python3 scripts/manual_pipeline.py --status
# Validierung einer Übersetzung
python3 scripts/manual_pipeline.py --validate <pfad/zur/datei.md>7. Was die Pipeline NICHT macht
Bewusst manuell gehalten, weil Automatik zu fehleranfaellig:
- Finales Diagramm-Cropping — die Pipeline liefert Seiten-JPGs; Du oder Claude croppst pro Diagramm und vergibt den finalen Namen.
- Tabellen-Korrektur — pdfplumber-Heuristik produziert Rohgeruest bei Scans; finale Bereinigung erfolgt manuell beim Übersetzen.
- Schaltplaene (Section 4E) — separater Workflow, vor Bearbeitung abstimmen. Auflösung 600 dpi PNG, ggf. mehrseitiges Stitching.
8. Workflow-Anpassungen
Wenn der Stil-Leitfaden weiterentwickelt wird (z.B. neue Frontmatter-Felder, andere Tabellen-Konvention): die Aenderung landet in uebersetzungs_stil. Bei Konflikt zwischen diesem Workflow und dem Stil-Leitfaden gewinnt der Stil-Leitfaden.