KI-Agenten unterstützen intelligente Automation durch Zusammenspiel mehrerer Modelle und APIs. Entscheidend sind zuverlässige Echtzeit-Datenanbindungen, Human-in-the-Loop-Design und robuste Sicherheitsmassnahmen zur Einhaltung regulatorischer Anforderungen. Das Model Context Protocol etabliert sich dabei als offener Standard.
KI-Agenten sind architektonisch komplexer als das Ergebnis eines einzigen generativen KI-Modells.
(Bild: Deemerwha studio/Shutterstock)
Wird über KI-Agenten gesprochen, geht es um die Weiterentwicklung von KI hin zur autonomen Ausführung komplexer Aufgaben, also weit über die Generierung und Bereitstellung von Informationen hinaus. KI-Agenten bieten einen Weg zur intelligenten Automatisierung von Arbeitsabläufen, zur Unterstützung menschlicher Entscheidungen sowie zur Entlastung der Teams, beispielsweise im Management, im Personalwesen oder in Kundenberatung und -service. Für die Umsetzung braucht es einen hybriden Ansatz für die Infrastruktur sowie eine Plattform, die Modellinferenzen – logische Schlüsse auf Basis der vorhandenen Daten – in grossem Umfang ermöglicht und die Entwicklung und Verwaltung der KI-Agenten optimiert.
KI-Agenten sind dabei nicht das Ergebnis eines einzigen generativen KI-Modells oder eines grossen Sprachmodells (LLM), das alle Entscheidungen trifft. Sie sind architektonisch komplexer. Oft arbeitet ein planendes LLM mit kleineren Modellen (SLMs) zusammen, die spezifische Aufgaben ausführen, sowie mit APIs, die zusätzliche Informationen sammeln. Stellt ein Nutzer eine Anfrage, werden mehrere Modelle und APIs aufgerufen, was die Komplexität der Inferenz und die Kommunikation zwischen den Systemen vervielfacht. Entscheidend ist die zuverlässige Anbindung an Datenquellen des Unternehmens (z. B. Kundendaten, Inventarsysteme, Dokumente mit Richtlinien) in Echtzeit. Sie unterscheidet nützliche Automatisierung auf Basis korrekter Daten von unzuverlässigem Rätselraten.
Bildergalerie
Das Model Context Protocol (MCP) etabliert sich hier als offener Standard. Anstatt für jede Datenbank, API oder Unternehmensanwendung individuelle Integrationen zu entwickeln, bietet MCP eine gemeinsame Schnittstelle, über die Agenten externe Ressourcen standardisiert erkennen und mit ihnen interagieren können. Für Unternehmen bedeutet dies eine schnellere Agenten-Entwicklung, höhere Interoperabilität zwischen und geringere Abhängigkeit von einzelnen Anbietern. Agenten, die auf MCP-kompatiblen Plattformen basieren, können ein wachsendes Ökosystem vorgefertigter Konnektoren nutzen, anstatt jede Integration von Grund auf neu entwickeln zu müssen.
Lasten- und Kosten-Optimierung durch hybride Architektur
Diese Vervielfachung der Datenabfrage und -verarbeitung spiegelt sich allerdings auch in den Kosten wider. Unternehmen verfügen zwar über ein Token-Budget oder budgetierte Kosten für den Betrieb eines bestimmten Modells, aber die Token-Anzahl kann sich je nach den Rechenanforderungen, die mit Agentenanfragen verbunden sind, exponentiell erhöhen. Der Übergang von der Beantwortung von KI-Fragen zur Zuweisung von automatisierten KI-Aufgaben führt zu höheren Ausgaben, die realistisch abgeschätzt und budgetiert werden müssen.
Das heisst nicht, dass Agenten-KI nur für grosse, multinationale Unternehmen mit unbegrenztem Technologiebudget erreichbar ist. Open-Source-Inferenz-Engines wie vLLM bieten leistungsstarkes, produktionsreifes Serving für grosse Sprachmodelle. Projekte wie llm-d (an dem Red Hat beteiligt ist) bauen darauf auf und ermöglichen eine verteilte Inferenz in Kubernetes-Umgebungen. Gemeinsam erlauben sie Unternehmen, die LLM-Infrastruktur intern zu betreiben, wofür eine Hybridarchitektur die Voraussetzung ist. Die Möglichkeit, Inferenz-Workloads lokal auszuführen, gewährleistet die betriebliche Kontinuität unabhängig von möglichen externen Störungen und ermöglicht gleichzeitig die bedarfsweise Nutzung von Cloud-Ressourcen. Plattformen wie Red Hat AI sind die Grundlage für die konsistente Bereitstellung und Skalierung von KI-Workloads in hybriden Umgebungen und helfen damit, die Leistung und Zuverlässigkeit zu gewährleisten, die Agenten-Workflows erfordern. Gleichzeitig lassen sich so die Rechenkosten minimieren.
Daneben sind klar definierte Anwendungsfälle und Aufgabenfunktionen entscheidend, da diese die Effizienz des übergeordneten Planungs-LLM und der unterstützenden aufgabenspezifischen SLMs steigern. Organisationen können Kosten und Genauigkeit noch weiter optimieren, indem sie diese spezialisierten Modelle für routinemässige Agentenfunktionen feinabstimmen und so die Abhängigkeit von teuren, universellen LLMs für jede Interaktion verringern. Ein gut strukturiertes Agentensystem könnte ein schlankes Modell für die anfängliche Abfrageklassifizierung, domänenspezifische Modelle für bestimmte Aufgaben und grössere Modelle für komplexe Schlussfolgerungen umfassen.
Eine häufige Befürchtung im Zusammenhang mit agentenbasierter KI ist, dass sie menschliche Arbeitskräfte verdrängen wird. Die Realität ist differenzierter. Gut konzipierte Agentensysteme ergänzen die menschlichen Fähigkeiten, anstatt sie zu ersetzen. Sie übernehmen die repetitive Datenerfassung, die erste Triage und die Routinebearbeitung und ermöglichen es qualifizierten Fachkräften, sich auf die Arbeit zu konzentrieren, die tatsächlich menschliches Urteilsvermögen erfordert: komplexe Problemlösung, einfühlsame Kundeninteraktionen, kreatives Denken und ethische Entscheidungsfindung.
Hier wird das «Human-in-the-Loop»-Design unerlässlich. Anstatt den Agenten volle Autonomie zu gewähren, definieren Unternehmen Grenzen: Welche Entscheidungen können Agenten eigenständig treffen (z. B. bis zu einem bestimmten Schwellenwert), welche erfordern die Zustimmung eines Menschen? Dieser Ansatz schafft schrittweise Vertrauen. Agenten wird mittelfristig mehr Autonomie zugestanden, wenn sie Zuverlässigkeit beweisen, während Menschen die Aufsicht über Entscheidungen mit hohem Risiko behalten.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel Communications Group GmbH & Co. KG, Max-Planckstr. 7-9, 97082 Würzburg einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.
Selbstverständlich prägen auch regulatorische und rechtliche Faktoren den Einsatz von agentenbasierter KI in Unternehmen. Bedenken hinsichtlich der digitalen Souveränität gewinnen zunehmend an Bedeutung, da immer mehr Unternehmen die Verpflichtungen zur Datenresidenz und -verarbeitung einhalten müssen. In jedem Anwendungsfall und in jeder Organisation können agentenbasierte Arbeitsabläufe regionale und internationale Grenzen überschreiten. Aus diesem Grund benötigen Agenten und ihre Plattformen robuste Schutzmechanismen: Inhaltsfilter zur Verhinderung schädlicher Ausgaben, Richtliniendurchsetzung zur Gewährleistung der Einhaltung gesetzlicher Vorschriften und umfassende Audit-Trails für die Rechenschaftspflicht.
Unternehmen müssen sicherstellen, dass die Agenten-Architekturen die Rechte der Betroffenen respektieren und geeignete Einwilligungsmechanismen gewährleisten. Vielfach sind diese Kontrollen nicht optional, sondern Voraussetzungen für den Einsatz. Plattformen müssen hier die notwendigen Tools bereitstellen, um Sicherheitsrichtlinien für Agenten-Workflows zu definieren, zu testen und zu überwachen.