Weiter zur NavigationWeiter zum Inhalt
Anzeige
Anzeige
  1. GIGA
  2. Tech
  3. Digital Life
  4. ChatGPT Agent: Was ist das und wie funktioniert das?

ChatGPT Agent: Was ist das und wie funktioniert das?

Die App von ChatGPT bietet unter bestimmten Bedingungen einen Probemonat.
ChatGPT führt den Agenten-Modus ein. Was kann er? (© IMAGO / Aviation-Stock)
Anzeige

ChatGPT wird immer weiter ausgebaut. Ein neues Feature ist der „Agent“. Was kann man damit machen und wie funktioniert das?

Erfahre mehr zu unseren Affiliate-Links
Wenn du über diese Links einkaufst, erhalten wir eine Provision, die unsere redaktionelle Arbeit unterstützt. Der Preis für dich bleibt dabei unverändert. Diese Affiliate-Links sind durch ein Symbol gekennzeichnet.  Mehr erfahren.

ChatGPT Agent: Was ist das?

Bereits im normalen Modus kann der Chatbot viele Aufgaben lösen. Der Agent-Modus ist eine Weiterentwicklung. Damit sollen komplexe Probleme gelöst werden, die der Chatbot alleine nicht schafft. Der ChatGPT-Agent greift dabei auf verschiedene Tools zu, etwa Google Drive, Dropbox oder Microsoft-Dienste. Dafür wurde ein eigenes KI-Modell gestaltet.

Anzeige

Der ChatGPT Agent ist eine automatisierte Instanz von ChatGPT, die speziell dafür entwickelt wurde, eigenständig Aufgaben in digitalen Umgebungen auszuführen, ohne dass der Benutzer jeden einzelnen Schritt manuell steuern muss. Sie können nicht nur Informationen verarbeiten und generieren wie die normale Chatbot-Variante, sondern auch aktiv Schritte unternehmen, etwa APIs aufrufen, Software steuern, andere Systeme durchforsten oder Daten verwalten. Wie bei vielen anderen KI-Anwendungen erfolgt der Start in Europa erst zu einem späteren Zeitpunkt.

Wie funktioniert das?

Die Funktionsweise lässt sich vereinfacht in folgende Schritte gliedern:

  • Zieldefinition / Prompt: Der Agent erhält ein klares Ziel oder eine Aufgabe, meist in Form eines initialen Prompts. Beispiel: „Analysiere täglich unsere Verkaufsdaten, identifiziere Anomalien und schicke sie per E-Mail an das Team.“
  • Autonome Planung: Der Agent analysiert das Ziel, zerlegt es in Einzelschritte und plant die Reihenfolge. Dazu wird überprüft, welche Informationen benötigt werden, welche Tools zur Verfügung stehen und welche APIs in welcher Reihenfolge aufgerufen werden. Der Agent entscheidet selbstständig, welche dieser Tools in welcher Reihenfolge sinnvoll sind.
  • Iteratives Vorgehen & Korrektur. Ein Agent prüft regelmäßig den aktuellen Stand:
    • Hat eine API nicht die erwartete Antwort geliefert?
    • Muss ein Zwischenschritt wiederholt werden?
    • Ist das Ziel schon erreicht oder fehlt noch etwas? Er korrigiert sein Vorgehen iterativ – ähnlich einem Menschen, der pragmatisch Probleme löst.
Anzeige

Am Ende liefert der Agent das gewünschte Resultat: eine ausgeführte Aktion, ein Bericht, eine Zusammenfassung, eine Benachrichtigung etc.

Vorteile gegenüber einem „normalen“ Chatbot

Chatbot

ChatGPT Agent

Reaktiv: Antwortet nur auf Fragen

Proaktiv: Arbeitet selbständig in Iterationen

Keine echten Aktionen

Kann Tools und APIs aktiv nutzen

Kein Langzeitgedächtnis

Kontextuelles, oft persistent Memory

Ziel: Dialog führen

Ziel: Aufgaben erledigen

Anzeige

Das Agenten-Feature wird ab sofort für ChatGPT-Nutzer mit einem Pro-, Plus- oder Team-Abonnement ausgerollt. Man findet die Funktion im Tool-Menü oder startet den Modus mit dem Befehl „/agent“. Der OpenAI-Chef Sam Altman führt in einem Social-Media-Post zwar die Vorteile des Agenten-Modus auf, warnt aber gleichzeitig davor.

Er weist darauf hin, das neue Tool nicht für „hochrangige Zwecke“ zu nutzen und dort zu viele persönliche Informationen zu teilen. Zudem warnt er davor, dass der ChatGPT-Agent anfällig für Angriffe sei und Fremde hierdurch schnell Daten abgreifen könnten (Quelle: heise.de). Altman hebt aber hervor, dass der Agent bei einfachen und harmlosen Aufgaben im Alltag wie Einkäufen oder Reiseplanungen helfen kann.

Anzeige