Gastbeitrag: KI-Agenten im Asset Management: IPE D.A.CH

Agentische KI-Systeme haben eine Reifestufe erreicht, auf der sie ganze Prozess-kategorien im Asset Management ersetzen — nicht nur beschleunigen. Was das im produktiven Einsatz konkret bedeutet, und warum der entscheidende Erfolgsfaktor nicht technischer Natur ist.

Dr. Pashutan Modearesi

Strategische Marktbeobachtung gehört zu den personalintensivsten Routine-aufgaben. Wettbewerbsaktivitäten, regulatorische Entwicklungen, Mandatsvergaben, Kapitalmarktdynamiken — ein Recherchezyklus bindet erheblich Zeit, liefert trotzdem punktuelle Abdeckung und ist strukturell nicht skalierbar.

Wie KI-Agenten ein echter Gamechanger werden, zeigt der Aufbau eines agentischen Marktbeobachtungssystems, das wir bei einem institutionellen Asset Manager mit nur 12 Projekttagen entwickelten und eingeführten. Damit werden 15 Mann-Tage im Monat dauerhaft eingespart.

Der Fokus lag nicht auf den fachlichen Inhalten, sondern auf den architektonischen Entscheidungen, die über Erfolg oder Scheitern solcher Systeme bestimmen — und auf einer Erkenntnis, die uns überrascht hat: Der kritische Erfolgsfaktor ist nicht technischer, sondern organisatorischer Natur.

Was im produktiven Einsatz wirklich funktioniert
Agentische KI-Systeme – also Sprachmodelle, die eigenständig Werkzeuge nutzen, historische Kontexte einbeziehen und komplexe, mehrstufige Aufgaben autonom abschließen – haben eine Reifestufe erreicht, auf der sie wirtschaftlich sinnvoll in Unternehmen einsetzbar sind. Am Beispiel einer der ersten agentischen Anwendungen, einem System für die strategische Marktbeobachtung, sehen Sie den konkreten Architekturaufbau einer solchen Lösung. Dabei stehen weniger die fachlichen Inhalte im Vordergrund als vielmehr jene architektonischen Weichenstellungen, die für jedes unternehmensweite KI-Projekt entscheidend sind: der Werkzeugeinsatz, ein dauerhaftes Gedächtnis, die Parallelisierung durch spezialisierte Subagenten, die Modellwahl, die Steuerung über natürliche Sprache sowie die finale Qualitätskontrolle vor der Veröffentlichung.

Vom Chatfenster zum autonomen Prozess
Der Einstieg in die Nutzung großer Sprachmodelle erfolgte zunächst oft in klassischer, interaktiver Form. Mitarbeiter formulierten individuelle Fragen zu Wettbewerbsaktivitäten, Produktinnovationen oder regulatorischen Änderungen und werteten die Antworten händisch aus. Der operative Nutzen ist dabei schnell erkennbar, die systemischen Limitierungen jedoch ebenso. Drei strukturelle Kernprobleme prägen diese Anfangsphase:
●        Mangelnde Reproduzierbarkeit: Die Antwortqualität hängt stark von der individuellen Formulierung des Prompts ab.
●        Fehlende Aktualität: Ohne externen Datenzugriff basieren die Ausgaben lediglich auf dem statischen Trainingswissen des Modells – aktuelle Dynamiken fehlen.
●        Kein historischer Kontext: Es fehlen jegliche Gedächtniskomponente. Jede Session startet ohne Kenntnis vorheriger Erkenntnisse, ohne Wissen über das eigene Unternehmen und ohne Bezug zu bereits identifizierten Signalen.

Die Erfahrung aus dieser Anfangsphase war der Ausgangspunkt für einen strukturierten Neuansatz: weg von der interaktiven Nutzung, hin zu einem systematisierten agentischen Prozess.

Ein Agent ohne Gedächtnis bleibt ein reines Einmal-Werkzeug. Daher war eine erste Maßnahme ein persistenter Speicher, denn dieser macht das System mit jedem Durchlauf nützlicher. Für einen echten operativen Mehrwert muss die interaktive Nutzung daher in einen systematisierten Prozess überführt werden. Jede Entwicklungsstufe baut dabei konsequent auf den Komponenten der vorherigen auf (siehe Abb. 1). Der entscheidende Meilenstein liegt im Übergang von Stufe 2 zu Stufe 3 – der Implementierung eines dauerhaften Gedächtnisses, das aus einem reinen Abfragewerkzeug ein lernendes System formt.

Abb. 1 — Jede Stufe baut auf den Komponenten der vorherigen auf. Der Sprung von Stufe 02 zu Stufe 03 — die Einführung persistenten Gedächtnisses — ist der bedeutendste, weil er aus einem Einmal-Werkzeug ein lernendes System macht.

Werkzeugintegration
Der erste technologische Wendepunkt besteht darin, dem Modell den direkten Zugriff auf eine Websuche zu ermöglichen. Statt Antworten unmittelbar zu generieren, recherchiert das System nun eigenständig im Netz, evaluiert gefundene Quellen und formuliert auf dieser Basis fundierte Ergebnisse. Damit vollzieht sich der Schritt vom einfachen Chatbot zum KI-Agenten im engeren Sinne. Ein solcher zeichnet sich dadurch aus, dass er eigenständig über den Einsatz und die Reihenfolge von Werkzeugen entscheidet und Aufgaben sequenziell abarbeitet. Er beantwortet nicht bloß eine Frage, sondern bewältigt eine komplexe Aufgabe.

Durch diese Fundierung an realen Daten sinkt die Halluzinationsrate drastisch, da das Modell verifizierbare Primärquellen nutzt, statt Fragmente aus den Trainingsdaten zu rekonstruieren. Tagesaktuelle Pressemitteilungen, BaFin-Meldungen oder Produktankündigungen fließen somit direkt in die Analyse ein.

Dennoch tritt dabei oft eine neue Schwäche zutage: Ohne historischen Kontext identifizieren Agenten dieselben Signale jeden Tag aufs Neue. Eine regulatorische Veröffentlichung der Vorwoche wird so kontinuierlich als aktuelle Meldung ausgewiesen, und Produktankündigungen der Konkurrenz wiederholten sich redundant in aufeinanderfolgenden Berichten. Ohne Gedächtnis bleibt auch ein recherchierender Agent ohne Lerneffekt.

Architektur des persistenten Gedächtnisses
Da Sprachmodelle von Haus aus kein integriertes Langzeitgedächtnis besitzen und jede Sitzung im Werkszustand beginnt, ist dies für den täglichen Research-Einsatz inakzeptabel. Die Lösung liegt in der systematischen Auslagerung von Informationen, die außerhalb des Modells abgelegt und zu Beginn jeder neuen Sitzung dynamisch geladen werden. Hierfür kann eine duale Gedächtnisstruktur implementiert werden:
●        Das Regelgedächtnis: Eine textbasierte Konfigurationsdatei hält dauerhafte Rahmenbedingungen vor – darunter das eigene Unternehmensprofil, den relevanten Wettbewerberkreis, strategische Themenschwerpunkte, explizite Quellenausschlüsse sowie formale Reportvorgaben. Diese Datei wird bei jedem Aufruf des Agenten automatisiert und ohne manuellen Aufwand im Hintergrund mitgegeben.
●        Das Langzeitgedächtnis: Dieses dynamische Protokoll speichert fortlaufend die qualitativen Rückmeldungen des Fachbereichs zu den generierten Ergebnissen. Es fungiert als lernende Komponente und verarbeitet gezielte Signal-Beurteilungen, verschobene Themen-Prioritäten, Adjustierungen der Quellenrelevanz sowie historische Befunde. Da dieses Gedächtnis für den permanenten Prompt-Kontext zu umfangreich ist, liest es der Agent selektiv zu Beginn eines neuen Recherchelaufs ein, damit frühere menschliche Einschätzungen direkt in die aktuelle Analyse einfließen.

Diese differenzierte Ladelogik stellt sicher, dass fundamentale Systemregeln immer präsent sind, während spezifische historische Notizen bedarfsorientiert und ressourcenschonend geladen werden.

Parallelisierung: Das Multi-Agenten-System
Mit wachsender thematischer Breite dehnt sich die sequenzielle Bearbeitung eines vollständigen Research-Laufs auf mehrere hundert Einzelschritte aus. Das ist zwar funktional, aber zeitlich ineffizient. Die Lösung liegt in einer bewährten Methodik der Softwarearchitektur: der Parallelisierung. Statt eines einzelnen, sequenziell arbeitenden Agenten orchestriert dabei das System spezialisierte Subagenten simultan, die jeweils eine dedizierte strategische Kernfrage beantworten.

Die Aufteilung orientiert sich an einem klassischen analytischen Framework des institutionellen Asset Managements: Nachfrage, Wettbewerb, Spielregeln und Marktlage. Die Synthese des finalen Reports spiegelt das präzise Zusammenspiel dieser vier Dimensionen wider:
●        Subagent A (Institutionelle Nachfrage & Mandate): Überwacht Ausschreibungen (RFPs), Mandatsvergaben sowie thematische Schwerpunkte von Versicherungen, Pensionskassen und Versorgungswerken aus Geschäftsberichten, öffentlichen Statements oder Konferenzbeiträgen. Diese Nachfrageseite bildet das Fundament für Produkt- und Vertriebsentscheidungen.
●        Subagent B (Wettbewerb, Produkte & M&A): Analysiert Produktlaunches der Konkurrenz, strategische Neuausrichtungen, personelle Wechsel im Vorstands- und Portfolio-Management sowie M&A-Aktivitäten. Ein Praxisbeispiel ist die Erfassung neuer Multi-Asset-Fonds konkurrierender Anbieter für berufsständische Versorgungswerke.
●        Subagent C (Regulatorik, Technologie & Trends): Bündelt die externen „Spielregeln“, darunter Veröffentlichungen von BaFin, ESMA und EBA, technologische Innovationen wie KI-Anwendungen im Asset Management sowie internationale Trends mit Transferpotenzial für den deutschen Markt.
●        Subagent D (Kapitalmarkt & Makro): Liefert das makroökonomische Fundament (Zinsen, Spreads, Fondsmittelflüsse), um die Erkenntnisse der anderen Agenten kontextuell einzuordnen. So wird eine Mandatsausschreibung für LDI-Strategien in einem Zinssenkungszyklus völlig anders bewertet als in einer Phase steigender Zinsen.

Jeder Subagent operiert vollständig isoliert in seinem eigenen Kontext. Diese strikte Trennung verhindert, dass sich Einschätzungen unbewusst angleichen oder widersprechen, ohne echten Erkenntnisgewinn zu liefern. Die Zusammenführung und Synthese erfolgt erst im Nachgang durch einen übergeordneten Orchestrator entlang der zentralen Leitfrage: Wo entstehen im Zusammenspiel der Dimensionen strategische Marktlücken?

Das Ergebnis ist eine signifikant gesteigerte Rechercheabdeckung bei vergleichbarer Gesamtlaufzeit. Während ein einzelner Prozess rund 150 Schritte sequenziell durchläuft, teilen sich ein Orchestrator (ca. 40 Schritte) und vier parallele Subagenten (je 30–40 Schritte) die Arbeit – bei deutlich höherer Analysetiefe pro Themenfeld. Zudem erlaubt der modulare Aufbau eine problemlose Erweiterung um zusätzliche Agenten.

Lokale und Frontier-Modelle
Bei der Auswahl des passenden Sprachmodells sind sowohl lokal betriebene Open-Source-Modelle verschiedener Größen als auch kommerzielle Frontier-Modelle nutzbar. Aber es bestehen deutliche Nuancen: Lokale Modelle besitzen zwar die grundsätzliche Fähigkeit zur agentischen Recherche, in der Praxis zeigen sich jedoch subtile, aber folgenschwere Schwachstellen.

So neigen lokale Modelle dazu, geplante Rechercheschritte bloß textuell zu beschreiben, anstatt sie tatsächlich auszuführen. Zudem verwechseln sie gelegentlich historische Daten mit aktuellen Befunden oder brechen mehrstufige Prozesse vorzeitig ab, um direkt eine Zusammenfassung zu liefern. Durch präzises Prompt Engineering, restriktive Tool-Definitionen und nachgelagerte Validierungsschritte lassen sich diese Fehler zwar minimieren, aber nicht gänzlich eliminieren. Führende kommerzielle Modelle bieten bei komplexen, mehrstufigen Tool-Recherchen aktuell noch einen qualitativen Vorsprung – dieser Abstand ist jedoch gradueller Natur und schrumpft kontinuierlich mit jeder Modellgeneration.

Die wichtigste Erkenntnis für die Praxis: Modelle müssen zwingend anhand der konkreten, spezifischen Zielaufgabe evaluiert werden, nicht auf Basis allgemeiner Benchmarks. Ein Modell mit exzellenten Ergebnissen bei der Code-Generierung kann bei mehrstufigen Rechercheaufgaben unterlegen sein und umgekehrt.

Steuerung durch natürliche Sprache
Die nachhaltigste Konsequenz des persistenten Gedächtnisses betrifft die operative Systemanpassung: Verhaltensänderungen des Agenten erfordern keine klassischen Code-Eingriffe der IT mehr, sondern erfolgen agil über natürlichsprachliche Anweisungen in einem dedizierten Slack-Kanal.

Fehlt beispielsweise in den Quellenangaben das Publikationsdatum, bedeutete dies in klassischen Software-Workflows einen zeitaufwändigen Prozess aus Ticket, Backlog, Sprint, Testing und Release. Im Agentenkontext genügt eine einfache Slack-Nachricht:
„Bitte führe in Zukunft das Publikationsdatum vor jeder Quellenangabe auf.“

Der Agent verarbeitet diesen Input autonom als permanente Instruktion, persistiert sie im Regelgedächtnis und setzt sie ab dem nächsten Lauf um. Ebenso lassen sich Wettbewerberkreise erweitern, Quellen ausschließen, thematische Priorisierungen dynamisch anpassen oder Formatvorgaben modifizieren. Diese direkte Steuerbarkeit verschiebt die operative Kontrolle vom Entwickler zum Fachexperten und reduziert die Latenz zwischen Anforderung und Wirkung von Wochen auf wenige Stunden.

Darüber hinaus fungiert der Agent im Slack-Kanal als permanenter Ad-hoc-Gesprächspartner des Teams. Mitarbeiter können gezielte Fragen zu historischen Reports, Hintergründen bestimmter Signale oder thematischen Zusammenfassungen stellen. Diese Funktionalität nutzt dieselben technologischen Kernbausteine (Regelgedächtnis, Historien-Zugriff, Werkzeugnutzung) ohne zusätzlichen Entwicklungsaufwand und verkürzt die Distanz zwischen Erkenntnisgewinn und praktischer Nutzung im operativen Alltag erheblich.

Fazit
Aus dem getesteten produktiven Betrieb lassen sich fünf fundamentale Erkenntnisse für die Asset-Management-Branche ableiten:
1.        Iterative Natur: Die Entwicklung produktiver KI-Agenten ist agiler und explorativer als klassische Softwareprojekte. Initiale funktionale Schwächen (wie das bloße Beschreiben von Schritten) sind inhärente Begleiterscheinungen der Methodik und kein Indikator für ein fehlerhaftes Grundkonzept.
2.        Spezifische Evaluation: Die Modellwahl muss strikt aufgabenspezifisch erfolgen; allgemeine Benchmarks sind als alleiniges Auswahlkriterium ungeeignet.
3.        Gedächtnis als Core Feature: Ein persistenter Speicher ist die kritischste Weichenstellung im Aufbau. Erst er transformiert ein Einmal-Werkzeug in ein lernendes Gesamtsystem.
4.        Kultureller Wandel: Die natürlichsprachliche Steuerung verschiebt Kompetenzen und Kontrolle von der IT in die Fachabteilung. Dies erfordert eine explizite Klärung von Verantwortlichkeiten.
5.        Kontrollierte Autonomie: Vertrauen in autonome Systeme entsteht nicht durch bloße Leistungsfähigkeit, sondern durch transparente Grenzen und robuste Kontrollmechanismen.

Die hier beschriebenen Architekturbausteine sind keineswegs auf die Marktbeobachtung beschränkt. Sie bilden das universelle methodische Fundament für jede agentische Anwendung, bei der heterogene Daten erfasst, gegen einen persistenten Kontext gespiegelt und in eine entscheidungsorientierte Struktur verdichtet werden müssen. Ein einmal aufgebauter Kern amortisiert sich somit über eine gesamte Klasse vergleichbarer Business-Aufgaben.

Der Erfolg beim Rollout agentischer Systeme entscheidet sich am Ende nicht auf technischer, sondern auf organisatorischer Ebene. Es geht um die Kernfrage, wie eine Organisation Systeme, die eigenständige Einschätzungen liefern, in eine Kultur integriert, die auf menschlichem Urteilsvermögen aufbaut.

Die praktische Erfahrung zeigt, dass dies über drei Faktoren gelingt die ohnehin regulatorisch gefordert sind:
1.       Absolute Transparenz über die Funktionsweise des Systems.
2.       Glasklar definierte Grenzen für die Autonomie des Agenten.
3.       Volle Verantwortung beim Menschen.
4. Monitoring und Weiterentwicklung

Das System liefert die Datenbasis und bereitet die Entscheidung vor – das finale Urteil und die Verantwortung verbleiben jedoch immer komplett beim Investment-Team. Ausschließlich in dieser Rolle als Zuarbeiter werden Agenten zu einem realen Produktivitätsfaktor im modernen Asset Management.

---
*) Dr. Pashutan Modearesi, CTO bei GET Capital

Gastbeitrag: KI-Agenten im Asset Management

Verwandte Nachrichten