Leistung · KI
KI da, wo sie wirklich Arbeit abnimmt.
Nicht "lass uns ChatGPT im Browser haben". Sondern: ein LLM dort einbauen, wo in deinem Tagesgeschäft täglich Zeit verbrennt. Klassifikation, Extraktion, Generierung, Suche - in deinen bestehenden Tools, mit klaren Schemas und Audit-Trail.
Typische Einsatzgebiete
- Mail- und Ticket-Klassifikation: eingehende Anfragen automatisch nach Intent, Dringlichkeit, Tonalität sortiert. Mit Confidence-Score und Audit.
- Dokumenten-Extraktion: PDFs, Rechnungen, Verträge, Bestellungen in strukturierte Felder gewandelt - mit Validierung gegen dein Schema.
- Semantische Suche: Wissensdatenbank, FAQ, Produkt-Doku per Embeddings durchsuchbar. Antwort mit Quellen-Belegen, nicht halluziniert.
- Generierung im Brand-Ton: Vorschlags-Texte für Mails, Angebote, Social-Posts - mit Few-Shot aus deinen bestehenden Beispielen.
- Lead-Scoring und Anreicherung: Anfragen automatisch priorisiert, mit Begründung in der Sprache, in der dein Sales redet.
Modell-Auswahl: Cloud oder lokal
Cloud-LLMs (Claude, GPT, Gemini): höchste Antwort-Qualität, schnellste Iteration, EU-Endpoints mit Auftragsverarbeitungsvertrag verfügbar. API-Inhalte werden bei Pay-as-you-go nicht für Training verwendet.
Lokale Modelle (Llama, Mistral, Qwen) auf deinem Server via Ollama, llama.cpp oder vLLM: volle Datenkontrolle, air-gapped-Setups möglich, Kostenfix statt Token-Variable. Etwas geringere Antwort-Qualität als Frontier- Modelle, je nach Use-Case aber mehr als ausreichend.
Welches Modell für deinen Use-Case sinnvoll ist, entscheiden wir gemeinsam mit echten Test-Daten - nicht aus Marketing-Folien.
Was wir technisch mitliefern
- Strukturierte Outputs via JSON-Schema oder Tool-Use - keine "extract everything"-Prompts
- Halluzinations-Härtung: Schema-Validierung, Confidence-Threshold, Human-in-the-Loop bei Low-Confidence
- Cost-Control: Caching, Modell-Routing (kleines Modell für 80% der Fälle, großes nur wenn nötig), Budget-Limits
- Evals und Regressionstests: damit du bei Modell-Updates oder Prompt-Änderungen siehst, ob die Qualität hält
- DSGVO-Setup: AVV, EU-Endpoints, Personendaten-Filter, Audit-Logs
Beispiel-Use-Case: Rechnungs-Extraktion
Buchhaltungs-Setup, das wir typischerweise bauen: PDF-Rechnungen landen per Mail im Posteingang, ein Workflow zieht sie raus, ein KI-Schritt extrahiert IBAN, Rechnungsnummer, Beträge, MwSt., Fälligkeit gegen ein striktes Schema. Validiert wird gegen bekannte Lieferanten in der Stamm-DB. Confidence unter 90% landet zur manuellen Prüfung; alles drüber geht direkt in die Buchhaltungs-Software. Spart 3-5 Minuten pro Rechnung.
Preis und Dauer
KI-Integrationen starten bei 4.000 EUR für klar umrissene Use-Cases (z. B. Mail-Klassifikation, Dokumenten- Extraktion). Aufwendigere Setups mit mehreren Modellen, Evals und Custom-Pipelines liegen typisch bei 8.000-15.000 EUR. Iteration in Wochen-Modulen.
Welches Modell passt zu deinem Use-Case?
Erstgespräch ist kostenlos, dauert eine Stunde, und du bekommst konkrete Empfehlung mit Aufwand und Preis.
