multiversemediamultiversemedia

Wissen

Tool-Use bei LLMs

Tool-Use ist die Fähigkeit eines Large Language Models, statt einer Text-Antwort einen strukturierten Funktions-Call gegen ein vordefiniertes Schema auszugeben. Das ist die Grundlage für jeden KI-Agent, der mehr machen soll als reden.

Wie es technisch abläuft

  1. Du definierst eine Liste verfügbarer Tools mit Name, Beschreibung und JSON-Schema für die Argumente.
  2. Du sendest die Tool-Liste mit der User-Anfrage ans Modell.
  3. Das Modell antwortet entweder mit Text oder mit einem Tool-Call: { name: 'search', arguments: { query: 'x' } }.
  4. Deine Anwendung führt den Call aus und schickt das Resultat zurück.
  5. Das Modell entscheidet, ob es einen weiteren Tool-Call macht oder die finale Text-Antwort gibt.

Was Tool-Use gut macht

  • Modell muss nichts Syntaktisches "raten" - die Schemas erzwingen valides JSON
  • Permissions und Validierung passieren bei dir, nicht beim Modell
  • Side-Effects sind nachvollziehbar - jeder Tool-Call ist im Audit-Log
  • Du kannst kleine, billige Tools definieren und das Modell kombiniert sie sinnvoll

Wo Tool-Use schief geht

  • Vage Tool-Beschreibungen: das Modell ruft das falsche Tool. Beschreibungen sollten klar sagen, wann man das Tool nutzt.
  • Zu viele Tools: bei 30+ verfügbaren Tools sinkt die Genauigkeit. Lieber thematisch gruppieren.
  • Schwammige Schemas: lockere Typen erlauben dem Modell, schlechte Argumente zu liefern. Strenge Typen und Enums helfen.
  • Keine Loop-Begrenzung: Modell ruft im Kreis Tools auf. Max-Loops und Timeout sind Pflicht.
  • Halluzinierte Tools: Modell erfindet ein Tool, das nicht existiert. Fail-fast bei unbekanntem Tool-Namen.

Wie wir Tool-Use härten

  • Zod- oder JSON-Schema-Validierung jeder Tool-Eingabe
  • Permissions pro Tool, nicht pauschal
  • Idempotency-Keys bei schreibenden Operationen
  • Max-Loops + Timeout + Cancel-Token
  • Audit-Log in DB, jeder Call mit Modell-Response verknüpft
  • Test-Suite, die echte Tool-Sequenzen replay-bar macht
Tool-Use ist die Basis für unsere Custom AI Agents:Zur Leistung →

Welche Tools sollte ein Agent für dich aufrufen können?

Im Erstgespräch identifizieren wir den Use-Case und die richtige Tool-Liste.