Wissen
Tool-Use bei LLMs
Tool-Use ist die Fähigkeit eines Large Language Models, statt einer Text-Antwort einen strukturierten Funktions-Call gegen ein vordefiniertes Schema auszugeben. Das ist die Grundlage für jeden KI-Agent, der mehr machen soll als reden.
Wie es technisch abläuft
- Du definierst eine Liste verfügbarer Tools mit Name, Beschreibung und JSON-Schema für die Argumente.
- Du sendest die Tool-Liste mit der User-Anfrage ans Modell.
- Das Modell antwortet entweder mit Text oder mit einem Tool-Call:
{ name: 'search', arguments: { query: 'x' } }. - Deine Anwendung führt den Call aus und schickt das Resultat zurück.
- Das Modell entscheidet, ob es einen weiteren Tool-Call macht oder die finale Text-Antwort gibt.
Was Tool-Use gut macht
- Modell muss nichts Syntaktisches "raten" - die Schemas erzwingen valides JSON
- Permissions und Validierung passieren bei dir, nicht beim Modell
- Side-Effects sind nachvollziehbar - jeder Tool-Call ist im Audit-Log
- Du kannst kleine, billige Tools definieren und das Modell kombiniert sie sinnvoll
Wo Tool-Use schief geht
- Vage Tool-Beschreibungen: das Modell ruft das falsche Tool. Beschreibungen sollten klar sagen, wann man das Tool nutzt.
- Zu viele Tools: bei 30+ verfügbaren Tools sinkt die Genauigkeit. Lieber thematisch gruppieren.
- Schwammige Schemas: lockere Typen erlauben dem Modell, schlechte Argumente zu liefern. Strenge Typen und Enums helfen.
- Keine Loop-Begrenzung: Modell ruft im Kreis Tools auf. Max-Loops und Timeout sind Pflicht.
- Halluzinierte Tools: Modell erfindet ein Tool, das nicht existiert. Fail-fast bei unbekanntem Tool-Namen.
Wie wir Tool-Use härten
- Zod- oder JSON-Schema-Validierung jeder Tool-Eingabe
- Permissions pro Tool, nicht pauschal
- Idempotency-Keys bei schreibenden Operationen
- Max-Loops + Timeout + Cancel-Token
- Audit-Log in DB, jeder Call mit Modell-Response verknüpft
- Test-Suite, die echte Tool-Sequenzen replay-bar macht
Tool-Use ist die Basis für unsere Custom AI Agents:Zur Leistung →
Welche Tools sollte ein Agent für dich aufrufen können?
Im Erstgespräch identifizieren wir den Use-Case und die richtige Tool-Liste.
