Ich habe meinen KI-Agenten nützlich gemacht (Hier ist wie) Agent 101

📖 14 min read•2,606 words•Updated Mar 29, 2026

Hallo zusammen, Agenten-Schöpfer! Hier ist Emma, zurück von einer weiteren bereichernden Codierungssitzung, angetrieben von lauwarmem Kaffee und der puren Freude zu sehen, dass etwas, das ich gebaut habe… nun ja, *etwas tut*. Heute möchte ich über etwas sprechen, das wahrscheinlich vielen von euch im Kopf herumgeht, besonders wenn ihr gerade erst beginnt, die Welt der KI-Agenten zu erkunden: Wie genau bringt man einen KI-Agenten dazu, etwas Nützliches zu tun, anstatt einfach nur generischen Text oder Fehlermeldungen auszugeben?

Genauer gesagt möchte ich mich auf ein häufiges Hindernis konzentrieren, das ich sehe und ehrlich gesagt, dem ich selbst vor nicht allzu langer Zeit begegnet bin: Die Kunst, Ihrem Agenten Werkzeuge zu geben. Das scheint einfach zu sein, oder? „Hier, Agent, benutze das.“ Aber es gibt eine Nuance, einen subtilen Tanz, ihm genügend Fähigkeiten zu geben, ohne ihn zu überlasten, und sicherzustellen, dass er weiß, *wann* er das verwenden soll, was man ihm gegeben hat. Lassen Sie uns für einen Moment die neuesten Frameworks beiseitelegen; zurück zu den Grundlagen. Wenn Ihr Agent nicht mit der realen Welt interagieren kann (oder zumindest mit der digitalen Welt außerhalb seines eigenen LLM-Gehirns), dann ist er einfach ein ausgeklügelter Chatbot.

Denken Sie so darüber nach: Sie möchten, dass Ihr Kleinkind ein wunderschönes Lego-Schloss baut. Sie können ihm genau sagen, was es tun soll, aber wenn Sie ihm nicht die Legosteine (die Werkzeuge) geben, wird es einfach dastehen und verwirrt aussehen. Ebenso, wenn Sie ihm eine ganze Werkstatt mit Elektrowerkzeugen geben, ohne Anleitung, enden Sie wahrscheinlich… nun ja, wahrscheinlich mit einem Chaos und vielleicht einem Besuch in der Notaufnahme. Unsere KI-Agenten sind ein wenig wie dieses Kleinkind, nur mit geringfügig weniger Verletzungsrisiko.

Warum Werkzeuge die Superkraft Ihres Agenten sind (und manchmal Ihr Kopfzerbrechen)

Als ich anfing, mit Agenten zu experimentieren, verbrachte ich eine peinlich lange Zeit damit, einen LLM dazu zu bringen, sich „an Dinge zu erinnern“ oder Informationen ausschließlich durch geschickte Anweisungen „zu suchen“. Ich schrieb Anweisungen, die länger waren als meine Einkaufsliste, und versuchte, all den Kontext einzubauen, den er benötigte. Und wissen Sie was? Es schlug fast immer fehl. Oder es halluzinierte. Oft. Mein Agent sagte mir mit Überzeugung, dass das aktuelle Wetter in der Antarktis 75 Grad Fahrenheit und sonnig war. Offensichtlich nicht ideal, um eine Reise zu planen.

Der erleuchtende Moment kam, als ich realisierte, dass der LLM selbst nicht dafür gedacht ist, eine Datenbank oder einen Internetbrowser zu sein. Seine Superkraft ist es, menschenähnlichen Text basierend auf den Daten zu verstehen und zu generieren, auf denen er trainiert wurde. Seine Schwäche? Echtzeitinformationen, spezifische Berechnungen oder die Interaktion mit externen Systemen. Hier kommen die Werkzeuge ins Spiel. Werkzeuge sind diese kleinen Funktionen oder APIs, die Sie bereitstellen, die es Ihrem Agenten ermöglichen, über sein neuronales Netzwerk hinaus zu greifen und in die reale Welt einzutreten.

Stellen Sie sich einen Agenten vor, dessen Aufgabe es ist, Ihnen bei der Planung eines Wochenendausflugs zu helfen. Ohne Werkzeuge kann er nur generische Reiseziele oder Aktivitäten basierend auf seinen Trainingsdaten vorschlagen. Mit Werkzeugen? Er kann:

Flugpreise in Echtzeit überprüfen.
Die aktuellen Wettervorhersagen für eine bestimmte Stadt abrufen.
Verfügbare Hotelzimmer und deren Preise finden.
Bewertungen zu lokalen Restaurants lesen.
Sogar eine Autovermietung buchen!

Auf einmal ist Ihr Agent nicht nur ein Gesprächspartner; er ist ein persönlicher Assistent mit echtem Nutzen.

Mein erster Versuch: Das Google-Suchfiasco

Mein allererster Versuch, einem Agenten ein Werkzeug zu geben, war, wie zu erwarten war, ein Desaster. Ich wollte einen Agenten, der Fragen zu aktuellen Ereignissen beantworten kann. Einfach, oder? Mein erster Gedanke war: „Gib ihm einfach Zugang zu Google!“

Schließlich verwendete ich eine Bibliothek, die ein einfaches Suchwerkzeug bereitstellte. Das Problem war nicht das Werkzeug selbst; es war mein Verständnis davon, wie der Agent *es nutzen würde*. Ich erklärte nur das Werkzeug, sagte dem Agenten, dass es existiert, und hoffte auf Magie. Der Agent, Gott segne sein digitales Herz, suchte oft nach Dingen, die bereits in meiner Anweisung standen, oder suchte nach obskuren Informationen, während eine direkte Antwort verfügbar war. Es war, als würde man einem Kind einen Taschenrechner geben und es versuchen lassen, damit seine Freunde anzurufen.

Die wichtigste Erkenntnis, die ich gewann, war: Es reicht nicht aus, einem Agenten ein Werkzeug zu geben. Sie müssen ihm sagen, wofür dieses Werkzeug ist, welche Art von Eingabe es erwartet und welche Art von Ausgabe es produzieren wird. Und vor allem müssen Sie seinen Entscheidungsprozess darüber führen, *wann* er dieses Werkzeug verwenden soll.

Anatomie eines guten Werkzeugs (für Ihren Agenten)

Lassen Sie uns zerlegen, was ein Werkzeug für einen KI-Agenten effektiv macht. Ich werde diesen Rahmen einen Moment allgemein halten, da die Prinzipien gelten, egal ob Sie LangChain, CrewAI verwenden oder Ihre eigene benutzerdefinierte Agentenschleife entwickeln.

1. Klare Funktionssignatur

Ihr Werkzeug benötigt einen Namen und, falls es Argumente entgegennimmt, klare Parameterdefinitionen. Denken Sie daran wie an eine Funktion in Python. Der Agent muss wissen, was er aufrufen und was er ihm übergeben soll.

2. Prägnante Beschreibung

Das ist wahrscheinlich der am meisten vernachlässigte Teil! Die Beschreibung ist Ihre direkte Verbindung zum Denkprozessor des LLM. So erklären Sie dem Agenten in einfacher Sprache, was dieses Werkzeug tut, warum es nützlich ist und wann er in Betracht ziehen sollte, es zu verwenden. Seien Sie nicht vage! Anstelle von „Ein Suchwerkzeug“ versuchen Sie „Sucht im Internet nach aktuellen Informationen zu jedem Thema. Verwenden Sie dies, wenn Sie aktuelle Fakten, externe Daten oder Informationen überprüfen möchten, die in meinen Trainingsdaten veraltet sein könnten.“

3. Zuverlässige Implementierung

Der tatsächliche Code, den das Werkzeug ausführt, sollte konsistent funktionieren. Wenn Ihr Werkzeug von Zeit zu Zeit fehlschlägt oder fehlerhafte Daten zurückgibt, wird Ihr Agent verwirrt sein und könnte aufhören, diesem Werkzeug zu vertrauen. Das bedeutet, dass Fehlerbehandlung Ihr Freund ist!

Praktisches Beispiel: Ein einfacher Faktenprüfer-Agent

Lasst uns einen super einfachen Agenten bauen, der Fragen beantworten kann und, falls er sich unsicher ist oder die Informationen veraltet scheinen, eine Suchmaschine verwendet, um aktuelle Daten zu erhalten. Dazu werde ich ein sehr vereinfachtes Python-Beispiel verwenden, bei dem ich mich auf die Definition des Werkzeugs konzentriere.

Schritt 1: Unser Werkzeug „Suche“ definieren

Wir werden eine Python-Funktion erstellen, die eine Websuche simuliert. In einer echten Anwendung würde dies sich mit einer Such-API verbinden (wie SerpAPI, Google Custom Search oder einfach `requests`, um eine Website abzurufen, obwohl Webscraping seine eigenen Herausforderungen mit sich bringt).

import requests
import json

def web_search_tool(query: str) -> str:
 """
 Sucht im Internet nach aktuellen Informationen zu jedem Thema. 
 Verwenden Sie dieses Werkzeug, wenn Sie aktuelle Fakten, externe Daten, 
 oder Informationen überprüfen möchten, die in meinen Trainingsdaten veraltet sein könnten.
 Geben Sie eine prägnante Suchanfrage ein.
 """
 try:
 # Simuliere einen echten Web-Such-API-Aufruf
 # In einem echten Szenario wäre das ein echter API-Aufruf, z.B. zu SerpAPI
 # Um es zu vereinfachen, simulieren wir einfach Ergebnisse basierend auf häufigen Anfragen.
 mock_results = {
 "aktuelles Wetter in London": "Es sind 12°C und bewölkt in London, UK, am 22. März 2026.",
 "Bevölkerung von Tokio": "Die derzeit geschätzte Bevölkerung von Tokio beträgt etwa 14 Millionen Menschen (Anfang 2026).",
 "aktuelle Nachrichten zu KI-Agenten": "Neue Fortschritte in den Multi-Agenten-Orchestrierungs-Frameworks wurden in dieser Woche bekannt gegeben.",
 "Hauptstadt von Frankreich": "Die Hauptstadt von Frankreich ist Paris.", # Beispiel, wo das LLM bereits wissen könnte
 "wer den Super Bowl im letzten Jahr gewonnen hat": "Die Kansas City Chiefs haben den Super Bowl LVIII im Februar 2025 gewonnen."
 }
 
 # Eine sehr vereinfachte Übereinstimmung zur Demonstration
 for key, value in mock_results.items():
 if key.lower() in query.lower():
 return value
 
 # Wenn keine spezifische Übereinstimmung gefunden wird, eine generische Suchergebnis zurückgeben
 return f"Suchergebnisse für '{query}': [Simuliertes Ergebnis: Informationen gefunden auf einer neuesten Nachrichten-Website oder Wikipedia über '{query}']"
 except Exception as e:
 return f"Fehler bei der Websuche: {str(e)}"

# Beispiel, wie das Werkzeug von einem Agenten verwendet werden könnte:
# print(web_search_tool("aktuelles Wetter in London"))
# print(web_search_tool("Bevölkerung von Tokio"))
# print(web_search_tool("wer den Super Bowl im letzten Jahr gewonnen hat"))
# print(web_search_tool("zufällige obskure Tatsache"))

Sehen Sie die Docstring für `web_search_tool`? Das ist die Beschreibung Ihres Werkzeugs! Sie erklärt dem Agenten *was es tut* und *wann* er es verwenden soll. Der Parameter `query: str` ist die klare Eingabeparameter.

Schritt 2: Integration des Werkzeugs mit einem Agenten (vereinfachte Version)

Wie könnte ein Agent also von diesem Werkzeug „wissen“? Die meisten Agenten-Frameworks abstrahieren dies, aber grundlegend bedeutet es:

Dem LLM die Beschreibung und die Funktionssignatur des Werkzeugs zur Verfügung stellen.
Das LLM entscheiden lassen, ob es das Werkzeug aufrufen möchte.
Die Python-Funktion des Werkzeugs ausführen.
Die Ausgabe des Werkzeugs an das LLM zurückgeben.

Stellen wir uns eine stark vereinfachte Agentenschleife vor, die einen hypothetischen LLM-Wrap verwendet:

# Dies ist ein konzeptionelles Beispiel, nicht ausführbar ohne eine echte LLM-Integration
# und ein Agenten-Framework.

class SimpleAgent:
 def __init__(self, llm_model):
 self.llm = llm_model
 self.tools = {
 "web_search": web_search_tool
 }
 self.tool_descriptions = {
 "web_search": {
 "name": "web_search",
 "description": """Sucht im Internet nach aktuellen Informationen zu einem beliebigen Thema. 
 Verwenden Sie dieses Werkzeug, wenn Sie aktuelle Fakten, externe Daten 
 oder zur Überprüfung von Informationen benötigen, die in meinen Trainingsdaten möglicherweise veraltet sind.
 Geben Sie eine prägnante Suchanfrage als Eingabe ein.""",
 "parameters": {"query": "string"} # Vereinfachte Beschreibung der Parameter
 }
 }

 def run(self, prompt: str) -> str:
 # Schritt 1: LLM entscheidet, ob ein Werkzeug notwendig ist
 # In einem echten Framework würde das LLM mit der Benutzeranfrage
 # und den Beschreibungen der verfügbaren Werkzeuge angesprochen werden. Es würde dann eine strukturierte Ausgabe generieren,
 # die angibt, ob es ein Werkzeug verwenden möchte und mit welchen Argumenten.

 # Zur Demonstration codieren wir ein wenig „Denken“ des LLM
 if "current" in prompt.lower() or "latest" in prompt.lower() or "up-to-date" in prompt.lower():
 print("\nDENKEN DES AGENTEN: Diese Frage erfordert wahrscheinlich aktuelle Informationen. Ich sollte das Werkzeug zur Websuche verwenden.")
 search_query = prompt.replace("What is the ", "").replace("what is ", "").strip("?.").strip()
 print(f"ACTION DES AGENTEN: Aufruf von web_search mit der Anfrage: '{search_query}'")
 tool_output = self.tools["web_search"](search_query)
 print(f"AUSGABE DES WERKSZEUGS: {tool_output}")
 
 # Schritt 2: LLM verarbeitet die Ausgabe des Werkzeugs und generiert die endgültige Antwort
 final_answer = f"Basierend auf meiner Recherche: {tool_output}"
 else:
 print("\nDENKEN DES AGENTEN: Diese Frage könnte aus meinem internen Wissen beantwortet werden.")
 # In einem echten LLM würde es direkt eine Antwort generieren
 final_answer = f"Das interne Wissen des LLM sagt: [Simulierte Antwort für: '{prompt}']"
 
 return final_answer

# --- Beispielverwendung ---
# Angenommen, 'my_llm_model' ist ein instanziiertes LLM-Client (z.B. OpenAI, Anthropic)
# agent = SimpleAgent(my_llm_model)

# print(agent.run("Wie ist das aktuelle Wetter in London?"))
# print("\n---")
# print(agent.run("Was ist die Hauptstadt von Frankreich?")) # Dies könnte je nach unserer einfachen Logik keine Suche auslösen
# print("\n---")
# print(agent.run("Erzählen Sie mir die neuesten Nachrichten über KI-Agenten."))

Dies ist natürlich eine stark vereinfachte Darstellung. Die echten Agenten-Frameworks verwalten die Logik des Aufrufs von LLM-Werkzeugen viel eleganter und nutzen oft eingebaute Funktionsaufruf-Fähigkeiten in Modellen wie der GPT-Serie von OpenAI oder Claude von Anthropic.

Die Hauptidee bleibt: Das LLM erhält die Anfrage und die Beschreibungen der Werkzeuge. Je nach seinem Verständnis entscheidet es sich, ein Werkzeug „aufzurufen“, indem es die Argumente bereitstellt. Ihr Code führt dann dieses Werkzeug aus und gibt das Ergebnis an das LLM zurück, das dieses Ergebnis dann verwendet, um seine endgültige Antwort zu formulieren.

Meine letzte Obsession: Orchestrierungswerkzeuge

Über einfache Suchanfragen hinaus experimentiere ich mit Werkzeugen, die nicht nur Informationen abrufen, sondern auch *andere Aktionen orchestrieren*. Denken Sie an ein Werkzeug „E-Mail senden“ oder ein Werkzeug „Kalenderevent erstellen“. Diese sind mächtig, da sie es dem Agenten ermöglichen, über einfache Gespräche hinauszugehen und *Dinge* in Ihrem digitalen Leben zu *tun*.

Ein kürzliches Projekt beinhaltete die Erstellung eines Agenten, der dabei hilft, meinen überfüllten Posteingang zu verwalten. Anstatt nur E-Mails zusammenzufassen (was interessant, aber begrenzt ist), wollte ich, dass er Folgendes kann:

`summarize_thread(thread_id)`: Eine spezifische Diskussion zusammenfassen.
`draft_reply(thread_id, context, tone)`: Eine Antwort entwerfen, basierend auf der Diskussion, einem Kontext, den ich bereitstelle, und einem gewünschten Ton.
`add_to_todo_list(task_description, due_date)`: Ein Element zu meiner Todoist-Liste hinzufügen.

Das Werkzeug `draft_reply` war faszinierend, da es eine interne Denksequenz für den Agenten beinhaltete: „Okay, der Benutzer möchte, dass ich eine Antwort schreibe. Zuerst muss ich `summarize_thread` verwenden, um den Kontext zu verstehen. Dann kann ich diese Zusammenfassung und den vom Benutzer gewünschten Ton verwenden, um den Text der Antwort zu generieren.“ Dies zeigt, wie Agenten Werkzeuge für komplexere Aufgaben verknüpfen können.

Das Werkzeug `add_to_todo_list` war ein einfacher API-Aufruf an Todoist. Die Magie lag nicht im API-Aufruf selbst, sondern in der Entscheidung des Agenten, wann eine E-Mail ein Aktionselement enthielt, das verfolgt werden musste, und dann die Aufgabenbeschreibung sowie ein potenzielles Fälligkeitsdatum aus dem E-Mail-Text korrekt zu extrahieren, um sie an das Werkzeug weiterzuleiten.

Handlungsfähige Tipps für Ihren Agenten-Weg

Beginnen Sie einfach: Versuchen Sie nicht, Ihrem Agenten auf einmal 50 Werkzeuge zu geben. Beginnen Sie mit ein oder zwei wirklich nützlichen Werkzeugen (wie einer Websuche oder einem einfachen Rechner) und meistern Sie, wie Ihr Agent mit ihnen interagiert.
Die Beschreibungen sind entscheidend: Nehmen Sie sich die Zeit, klare, prägnante und aussagekräftige Beschreibungen für jedes Werkzeug zu verfassen. Denken Sie daran, was ein Mensch wissen müsste, um zu entscheiden, wann und wie dieses Werkzeug verwendet werden sollte. Stellen Sie dessen Zweck und optimale Anwendungsfälle heraus.
Klarheit bei Ein- und Ausgaben: Stellen Sie sicher, dass die Funktionssignatur Ihres Werkzeugs völlig klar zu den erwarteten Argumenten ist (die Typen der Parameter sind großartig!) und welches Format seine Ausgabe haben wird. Der Agent muss beides verstehen.
Fehler elegant handhaben: Ihre Werkzeuge werden manchmal fehlschlagen. Implementieren Sie eine Fehlerbehandlung innerhalb Ihrer Werkzeugfunktionen, sodass, wenn etwas schiefgeht (z.B. ein API-Timeout, ungültige Eingabe), das Werkzeug eine sinnvolle Fehlermeldung zurückgibt, anstatt abzustürzen, was dem Agenten ermöglicht, eventuell erneut zu versuchen oder den Benutzer zu informieren.
Denken Sie an Verkettung: Sobald Sie sich mit der Verwendung einfacher Werkzeuge wohlfühlen, beginnen Sie darüber nachzudenken, wie Agenten Werkzeuge kombinieren können. Ein einfaches Beispiel: „Informationen suchen“ -> „Informationen zusammenfassen“ -> „Dem Benutzer antworten.“
Iterieren, iterieren, iterieren: Sie werden selten bei Ihrem ersten Versuch eine perfekte Werkzeugintegration erreichen. Beobachten Sie, wie Ihr Agent seine Werkzeuge verwendet (oder *missbraucht*), passen Sie Ihre Werkzeugbeschreibungen an und verfeinern Sie die Eingabeaufforderung Ihres Agenten, um sein Verhalten zu steuern.

Ihrem KI-Agenten Werkzeuge zu geben, ist dort, wo die wahre Magie passiert. Es ist der Schritt, der einen intelligenten Chatbot in einen wirklich nützlichen interaktiven Assistenten verwandelt, der tatsächlich *Dinge* in der Welt *tun* kann. Das erfordert ein wenig Übung, eine Prise Geduld und viel sorgfältiges Verfassen von Beschreibungen, aber glauben Sie mir, die Vorteile sind enorm. Also, legen Sie los, lassen Sie Ihre Agenten handeln und lassen Sie mich wissen, welche erstaunlichen Dinge Sie sie erschaffen lassen!

Bis zum nächsten Mal, viel Erfolg beim Erstellen von Agenten!

Emma Walsh

agent101.net

Ich habe meinen KI-Agenten nützlich gemacht (Hier ist wie)

Warum Werkzeuge die Superkraft Ihres Agenten sind (und manchmal Ihr Kopfzerbrechen)

Mein erster Versuch: Das Google-Suchfiasco

Anatomie eines guten Werkzeugs (für Ihren Agenten)

1. Klare Funktionssignatur

2. Prägnante Beschreibung

3. Zuverlässige Implementierung

Praktisches Beispiel: Ein einfacher Faktenprüfer-Agent

Schritt 1: Unser Werkzeug „Suche“ definieren

Schritt 2: Integration des Werkzeugs mit einem Agenten (vereinfachte Version)

Meine letzte Obsession: Orchestrierungswerkzeuge

Handlungsfähige Tipps für Ihren Agenten-Weg

Verwandte Artikel

Related Articles

Leave a Comment Cancel Reply

Warum Werkzeuge die Superkraft Ihres Agenten sind (und manchmal Ihr Kopfzerbrechen)

Mein erster Versuch: Das Google-Suchfiasco

Anatomie eines guten Werkzeugs (für Ihren Agenten)

1. Klare Funktionssignatur

2. Prägnante Beschreibung

3. Zuverlässige Implementierung

Praktisches Beispiel: Ein einfacher Faktenprüfer-Agent

Schritt 1: Unser Werkzeug „Suche“ definieren

Schritt 2: Integration des Werkzeugs mit einem Agenten (vereinfachte Version)

Meine letzte Obsession: Orchestrierungswerkzeuge

Handlungsfähige Tipps für Ihren Agenten-Weg

Verwandte Artikel

You May Also Like

📚 You Might Also Like

Related Articles

Leave a Comment Cancel Reply