Renuo – Wie DeepSeek den Weg für KI-Agenten ebnet

Von

/01.02.25

DeepSeek markierte den Beginn einer neuen Ära der KI – doch was kommt als Nächstes? (Bild von Unsplash)

In der sich rasant entwickelnden Welt der Künstlichen Intelligenz (KI) hat ein neuer Akteur für Aufsehen gesorgt: DeepSeek. Dieses chinesische Start-up hat mit DeepSeek-R1 ein KI-Modell entwickelt, das es mit den Branchenriesen wie OpenAI's ChatGPT aufnehmen kann – und das zu einem Bruchteil der Kosten. Die Auswirkungen waren unmittelbar spürbar: Die US-Technologieaktien, insbesondere im KI-Sektor, verzeichneten massive Verluste. Der Nasdaq büsste eine Milliarde US-Dollar an Wert ein, und Unternehmen wie Nvidia, Microsoft und Google erlebten deutliche Rückgänge in ihren Aktienkursen.

DeepSeeks Erfolg hat eine Debatte über das nächste grosse Thema in der KI-Welt entfacht: KI-Agenten. Während das Konzept von autonomen Systemen in der Robotik und Softwareentwicklung bereits etabliert ist, hat der Begriff "Agentic AI" (Agentenbasierte KI) erst kürzlich an Bedeutung gewonnen. Diese neue Klasse von KI-Systemen kombiniert eigenständiges Denken, Anpassungsfähigkeit und die Fähigkeit, mit minimaler menschlicher Eingabe zu handeln.

Was bedeutet "Agentic AI"?

Vielleicht fragen Sie sich: "Haben wir nicht schon zuvor von "agentenbasierten"-Konzepten gehört?" Völlig richtig! Hier eine kurze Zusammenfassung der wichtigsten Begriffe:

Agentenbasiert: Beschreibt die Fähigkeit, eigenständige Entscheidungen zur Erreichung eines Ziels zu treffen. Solche Systeme reagieren nicht nur auf Eingaben, sondern handeln proaktiv nach vordefinierten Zielen.
KI-Agenten: Sie basieren auf diesem Prinzip, nutzen jedoch fortschrittliche Schlussfolgerungen und iterative Planungsmethoden, um komplexe Aufgaben autonom zu lösen. Diese Systeme analysieren nicht nur Daten, sondern handeln auf Basis dieser Informationen und passen ihr Verhalten an sich ändernde Umgebungen an.
Autonome Agenten: Diese sind die praktische Umsetzung von KI-Agenten. Sie sind eigenständige Softwareeinheiten, die ihre Umgebung wahrnehmen, auf Basis dieser Wahrnehmung Entscheidungen treffen und entsprechende Aktionen ausführen.

Im Gegensatz zu herkömmlichen KI-Anwendungen, die oft auf einen einzigen Anwendungsfall beschränkt sind, öffnet die agentenbasierte KI die Tür zu vielseitig einsetzbaren, zielgerichteten Systemen, die branchenübergreifend unabhängig arbeiten können. Ob es um die Verwaltung von Lieferketten, die Automatisierung von Kundeninteraktionen oder die Optimierung von Arbeitsabläufen im Gesundheitswesen geht – diese Systeme verändern die Art und Weise, wie Unternehmen über Effizienz und Innovation denken.

Agentic AI in der echten Welt

Um die transformative Kraft von Agentic AI zu verstehen, werfen wir einen Blick darauf, wie grundlegende Modelle mit agentischen Fähigkeiten bereits verschiedene Branchen beeinflussen:

DeepSeek-R1: Neugestaltung der Wettbewerbslandschaft in der KI

DeepSeek-R1 ist ein herausragendes Beispiel für ein grundlegendes Modell mit agentischen Eigenschaften. Es nutzt fortschrittliche Fähigkeiten zur Problemlösung und zum logischen Denken. Seine Anwendung als KI-Assistent geht über einfache Antworten hinaus – es generiert eigenständig Erkenntnisse und führt Aufgaben wie Programmierung und Dokumentenanalyse aus. Durch die Bereitstellung als Open-Source-Plattform hat DeepSeek eine globale Diskussion über die Zugänglichkeit und Erschwinglichkeit modernster KI-Systeme angestossen.

OpenAIs "Operator"-Tool: KI mit praktischer Funktionalität

Das kürzlich von OpenAI vorgestellte Tool „Operator“ erweitert die Grenzen der Autonomie, indem es Modellen ermöglicht, direkt mit Web-Oberflächen zu interagieren. Stellen Sie sich etwa einen KI-gestützten Kundenservice-Agenten vor, der eigenständig komplexe Datenbanken durchforstet, Formulare ausfüllt oder sogar Termine bucht – ganz ohne menschliches Zutun. Durch die Verbindung von natürlicher Sprachverarbeitung mit aktionsfähiger Schnittstellen-Interaktion bringt „Operator“ Unternehmen einen Schritt näher an eine vollständig KI-gesteuerte Automatisierung.

Innovationen im Gesundheitswesen der Schweiz

Im Schweizer Gesundheitssektor wird Agentic AI zunehmend integriert, um die Patientenversorgung und betriebliche Effizienz zu verbessern. So setzen Schweizer Krankenhäuser KI-gestützte Systeme ein, um grosse Mengen medizinischer Daten zu analysieren, klinische Arbeitsabläufe zu optimieren und personalisierte Behandlungspläne zu entwickeln. Dieser Ansatz steigert nicht nur die diagnostische Genauigkeit, sondern ermöglicht es medizinischem Fachpersonal, sich stärker auf die patientenzentrierte Versorgung zu konzentrieren.

Automatisiertes Preismanagement in der Beschaffung

Das Schweizer Start-up DiPriMa hat eine digitale Plattform entwickelt, die Preismanagementprozesse für Beschaffungsteams automatisiert. Mithilfe von KI erfasst DiPriMa Vertragsdaten, verfeinert Preisformeln und implementiert automatisierte Preisstrategien. Dieser Ansatz reduziert manuelle Aufgaben, gewährleistet die Einhaltung von Vorschriften und ermöglicht Fachkräften, sich auf strategische Entscheidungen zu konzentrieren.

Die Geheimzutat

Grundlegende Modelle wie DeepSeek-R1 oder OpenAI’s ChatGPT-o1 sind zweifellos beeindruckend. Sie brillieren in den Bereichen logisches Denken, Sprachgenerierung und sogar der Lösung komplexer Probleme. Doch hier liegt die Herausforderung: Sie interagieren nicht von Natur aus mit der Welt. Man könnte sie sich wie ein Genie vorstellen, das in einer Bibliothek eingeschlossen ist – brillant im Beantworten von Fragen, aber unfähig, sein Wissen in die Tat umzusetzen. Genau an diesem Punkt kommen Werkzeuge ins Spiel: Sie überbrücken die Lücke zwischen Denken und Handeln.

Werkzeuge verwandeln Modelle in Agenten. Sie verleihen diesen Systemen die Fähigkeit, Live-Daten abzurufen, mit APIs zu interagieren oder sogar sinnvolle Aktionen in der realen Welt auszuführen. Ob es darum geht, Flüge zu buchen, Datenbanken zu verwalten oder Dokumente aus externen Quellen abzurufen – Werkzeuge sind die Schlüsselkomponenten, die ein statisches Modell in einen dynamischen Agenten verwandeln.

Faszinierend ist, wie Werkzeuge innerhalb der Architektur eines Agenten interagieren. Ein Agent weiss beispielsweise nicht einfach, wie das Wetter ist – er ruft eine Wetter-API auf, um aktuelle Daten abzurufen, und passt seine Entscheidungen entsprechend an. Stellen Sie sich einen Agenten vor, der eine Reise plant: Er sammelt in Echtzeit Informationen zu Flügen, gleicht Hotelverfügbarkeiten ab und schlägt dynamisch die beste Reiseroute vor. All das ist möglich, weil Werkzeuge nahtlos in das System integriert sind und den Agenten von der reinen Logik zur tatsächlichen Umsetzung führen.

Dieser gesamte Prozess wird durch die sogenannte Orchestrierungsschicht gesteuert – das eigentliche Gehirn eines Agenten. Es handelt sich dabei nicht um eine einzelne Aufgabe, sondern um einen kontinuierlichen Zyklus: Der Agent beobachtet seine Umgebung, analysiert seine Optionen, handelt und passt anschliessend seine Strategie basierend auf den Ergebnissen an. Man kann es sich wie einen Koch vorstellen, der sein Gericht ständig probiert und anpasst, bis es perfekt ist. Frameworks wie ReAct (Reasoning and Action) oder Tree-of-Thought bilden das Gerüst für diesen iterativen Prozess und ermöglichen es Agenten, ihre Vorgehensweise in Echtzeit zu verfeinern.

Das Spannende daran ist die enorme Anpassungsfähigkeit. Durch Werkzeuge können Agenten auf Echtzeit-Datenquellen zugreifen, ihre Fähigkeiten mit APIs erweitern und sogar clientseitige Steuerung integrieren, um Aufgaben mit höheren Sicherheits- oder Anpassungsanforderungen zu bewältigen.

Das ist keine blosse Theorie – es bildet das Rückgrat der Agentic AI, die bereits ganze Branchen verändert. Gesundheitsagenten nutzen Werkzeuge, um Termine zu vereinbaren und Patientendaten zu überwachen. Logistiksysteme optimieren Lieferketten, indem sie sich in Echtzeit an Wetterstörungen anpassen. Diese Modelle sind nicht mehr statisch – sie sind aktive Entscheidungsträger im Einsatz.

Indem Entwickler Agenten mit den richtigen Werkzeugen ausstatten, eröffnen sie eine Welt voller Möglichkeiten. Es geht längst nicht mehr nur darum, Fragen zu beantworten oder Texte zu generieren – sondern darum, sinnvolle, reale Handlungen auszuführen. Mit zunehmend fortschrittlichen Werkzeugen verschwimmt die Grenze zwischen Denken und Handeln immer weiter. Dies markiert den Beginn einer neuen Ära der KI, in der Agenten nicht nur analysieren, sondern auch eigenständig agieren und die Welt aktiv mitgestalten.

Was es braucht, um eine Agentic AI zu entwickeln

Die Entwicklung von Agentic AI bedeutet nicht nur, die richtigen Werkzeuge oder Modelle auszuwählen – es geht darum, eine Symphonie aus Fähigkeiten, Technologien und Designprinzipien zu orchestrieren. Dieses Feld liegt an der Schnittstelle von KI-Forschung, Softwareentwicklung und praxisnaher Problemlösung, sodass das erforderliche Fachwissen so vielfältig ist wie die Anwendungen selbst. Ein grundlegendes Verständnis von Foundation Models ist der erste Schritt. Modelle wie ChatGPT-o1 oder DeepSeek-R1 bilden das zentrale Entscheidungsorgan eines agentischen Systems. Doch ihre effektive Implementierung erfordert mehr als nur das Stellen von Abfragen. Entwickler müssen wissen, wie sie diese Modelle feinabstimmen, mit externen Tools integrieren und für spezifische Aufgaben optimieren. Zudem ist die Fähigkeit, mit Reasoning-Frameworks wie ReAct oder Chain-of-Thought zu arbeiten, von grossem Wert. Diese Ansätze verbessern die Entscheidungsfindung von Modellen und machen sie leistungsfähiger und anpassungsfähiger.

Als Nächstes kommt die Tool-Integration, die die Lücke zwischen statischen Modellen und dynamischen Umgebungen schliesst. Dafür ist ein fundiertes Wissen über APIs, Datenpipelines und Erweiterungen erforderlich, die es Agenten ermöglichen, mit externen Systemen zu interagieren. Entwickler müssen strategisch darüber nachdenken, wie Agenten auf Echtzeitinformationen zugreifen und diese nutzen – sei es über eine Datenbank, eine Live-API oder eine benutzerdefinierte Funktion.

Ebenso wichtig ist der Aufbau der Orchestrierungsschicht – dem Kern der kognitiven Architektur eines Agenten. Diese Schicht steuert die komplexen Zyklen aus Beobachtung, Schlussfolgerung und Handlung. Ingenieure in diesem Bereich müssen Systeme entwerfen, die Zustände verwalten, Speicher aufrechterhalten und mehrstufige Pläne ausführen. Dabei geht es nicht nur um das Programmieren, sondern um die Schaffung einer Struktur, die es Agenten ermöglicht, sich intelligent anzupassen und kontinuierlich zu verbessern.

Schliesslich ist domänenspezifisches Fachwissen unerlässlich. Egal, ob der Agent Lieferketten optimiert, den Kundenservice verbessert oder medizinische Ergebnisse steigert – Entwickler müssen das System gezielt auf die spezifischen Anforderungen des jeweiligen Bereichs zuschneiden. Dazu gehört oft eine enge Zusammenarbeit mit Fachexperten, um sicherzustellen, dass die Handlungen des Agenten mit Branchenstandards und Zielen übereinstimmen.

Die Entwicklung von Agentic AI erfordert nicht nur technisches Können – sie ist eine Kombination aus Kreativität, Problemlösungskompetenz und weitgehendem Fachwissen. Mit der Weiterentwicklung der Technologie wächst auch das erforderliche Know-how, um ihr volles Potenzial auszuschöpfen. Es ist eine Herausforderung, ja – aber eine, die enorme Chancen mit sich bringt.

Beispielhafte Werkzeuge für Agentic AI

Wenn es um Werkzeuge im Kontext von Agentic AI geht, orientieren wir uns an den Definitionen im Agents-Whitepaper. In diesem Rahmen sind Erweiterungen, Funktionen und Datenspeicher die primären Werkzeugtypen, die es Agenten ermöglichen, mit der Welt zu interagieren – sei es durch API-Verbindungen, die Verarbeitung strukturierter Ausgaben oder den Zugriff auf Echtzeitdaten. Während diese Begriffe speziell für Google Cloud’s Vertex AI verwendet werden, nutzen andere Plattformen möglicherweise unterschiedliche Bezeichnungen für ähnliche Funktionen. Der Fokus liegt hier weniger auf dem Namen, sondern vielmehr auf den Handlungen, die ein Agent ausführen kann, und dem Ort ihrer Umsetzung.

Erweiterungen: Verbindung von Agenten mit APIs

Erweiterungen dienen als Brücke zwischen einem Agenten und externen APIs. Sie ermöglichen es Agenten, Echtzeit-API-Aufrufe durchzuführen und dynamisch die passende Erweiterung basierend auf der aktuellen Aufgabe auszuwählen. Dadurch können Agenten flexibel agieren und sinnvolle Aktionen mit minimaler Vorkonfiguration ausführen.

Hier ist ein Beispiel für die Erstellung einer Erweiterung für den SwissIndex, eine öffentliche Datenbank für Schweizer Unternehmensregistrierungen. Diese Erweiterung erlaubt es einem Agenten, den Index abzufragen, um spezifische Unternehmensinformationen zu erhalten:

  import vertexai

PROJECT_ID = "YOUR_PROJECT_ID"
REGION = "us-central1"
vertexai.init(project=PROJECT_ID, location=REGION)

zefix_extension = Extension.create(
    manifest={
        "name": "zefix",
        "description": "Access to the Swiss central business name index",
        "api_spec": {
            "openApiYaml": ZEFIX_OPENAPI,
        },
        "auth_config": {
            "auth_type": "HTTP_BASIC_AUTH",
            "httpBasicAuthConfig": {
                "credentialSecret": ZEFIX_SECRET,
            },
        },
    }
)

response = zefix_extension.query("Search for Renuo")
print(response.steps[-1].parts[-1].text)

Dieses Beispiel zeigt, wie eine Erweiterung mit Authentifizierung und API-Spezifikationen konfiguriert wird, sodass der Agent direkt mit den SwissIndex-Daten interagieren kann.

Funktionen: Client-seitige Ausführung ermöglichen

Funktionen geben Entwicklern mehr Kontrolle über die API-Ausführung, indem sie diese auf die Client-Seite verlagern. Während der Agent die Parameter oder Daten für den API-Aufruf bereitstellt, erfolgt die eigentliche Ausführung ausserhalb des Agenten. Dies gewährleistet eine sichere und anpassbare Verarbeitung.

Hier ist ein Beispiel für die Auflistung verfügbarer Vertex-AI-Erweiterungen mithilfe einer Funktion:

  from vertexai.preview.extensions import Extension

def list_extensions():
    """Provides a list of Vertex AI extensions available to the user."""
    extensions_list = Extension.list()
    return [
        (e.display_name, e.resource_name, e.create_time)
        for e in extensions_list
    ]

model = GenerativeModel("gemini-1.5-flash-001")
 
user_prompt_content = Content(
    role="user",
    parts=[
        Part.from_text("Which Vetex AI extension do I have access to ?"),
    ],
)
 
support_tool = Tool(
    function_declarations=[list_extensions_function],
)
 
response = model.generate_content(
    user_prompt_content,
    generation_config=GenerationConfig(temperature=0),
    tools=[support_tool],
)
 
 
for function_call in response.candidates[0].function_calls:
    if function_call.name == "list_extensions":
        api_response = list_extensions()
 
    response = model.generate_content(
        [
            user_prompt_content,  
            response.candidates[0].content,  
            Content(
                parts=[
                    Part.from_function_response(
                        name=function_call.name,
                        response={"content": api_response},
                    ),
                ],
            ),
        ],
        tools=[support_tool],
    )

Der Agent kann diese Funktion nutzen, um dynamische Ausgaben zu generieren, während die eigentliche API-Interaktion unter der Kontrolle des Entwicklers bleibt.

Datenspeicher: Wissen mit Echtzeitdaten erweitern

Datenspeicher ermöglichen es Agenten, Echtzeit- oder strukturierte Daten aus externen Quellen wie Datenbanken oder Dokumenten abzurufen. Durch die Integration einer Vektordatenbank können Agenten semantische Suchen durchführen und kontextrelevante Informationen abrufen.

Ein Beispiel ist ein juristischer Assistent, der Daten aus einer Sammlung von Regulierungsdokumenten abruft, die in einer Vektordatenbank gespeichert sind. Der Agent nutzt dabei den Retrieval-Augmented Generation (RAG)-Prozess, um die Datenbank abzufragen und die Ergebnisse in seinen Schlussfolgerungszyklus zu integrieren.

Ein Vergleich zwischen Erweiterungen, Funktionen und Datenspeicher

Während die spezifischen Bezeichnungen Erweiterungen, Funktionen und Datenspeicher auf dem Agents-Whitepaper basieren, bleibt ihre Kernfunktionalität plattformübergreifend universell:

Erweiterungen führen Aktionen direkt innerhalb des Agenten aus und ermöglichen eine nahtlose Interaktion mit externen APIs.
Funktionen verlagern die Ausführung auf die Client-Seite, was mehr Kontrolle und Flexibilität bietet.
Datenspeicher erweitern das Wissensspektrum eines Agenten, indem sie ihm Zugriff auf dynamische, externe Datensätze ermöglichen.

Durch die Kombination dieser Werkzeuge können Entwickler leistungsfähige und anpassungsfähige Agenten entwerfen, die sowohl logisch denken, als auch aktiv handeln können – in verschiedensten Szenarien und Anwendungsbereichen.

Diese Dreifaltigkeit von Werkzeugen – hier als Erweiterungen, Funktionen und Datenspeicher bezeichnet – bildet das Rückgrat jeder robusten Agentic AI-Architektur, unabhängig davon, welche Begriffe andere Plattformen verwenden.

Das Versprechen der Agentic AI

Als DeepSeek mit seinem bahnbrechenden Modell die KI-Landschaft auf den Kopf stellte, war die Welt nicht nur wegen der technischen Errungenschaft beeindruckt – sondern weil es den Beginn eines grundlegenden Wandels markierte. Dieser Wandel betrifft nicht nur leistungsfähigere Modelle, sondern auch intelligentere Systeme, die in einer bisher unvorstellbaren Weise schlussfolgern, handeln und sich anpassen können.

Agentic AI baut auf diesem Versprechen auf und verwandelt das Konzept der agentischen Entscheidungsfindung in eine reale, branchenübergreifende Innovation. Was einst nur eine Idee war – KI-Systeme, die unabhängig und zielgerichtet handeln – hat sich zu autonomen Agenten entwickelt, die Unternehmen und Einzelpersonen dabei helfen, komplexe Herausforderungen zu meistern. Diese Agenten, ausgestattet mit Werkzeugen wie Erweiterungen, Funktionen und Datenspeichern, gehen über statische Intelligenz hinaus und ermöglichen dynamisches, proaktives Problemlösen.

Die Entwicklung von Agentic AI – von einem Konzept zur praktischen Umsetzung in autonomen Agenten – zeigt eindrucksvoll, wie sich Technologie aus der Theorie zu bahnbrechenden Lösungen weiterentwickeln kann. DeepSeek-R1 und ähnliche Innovationen sind keine isolierten Erfolge; sie sind Wegweiser in eine Zukunft, in der KI-Systeme nicht nur die Welt analysieren, sondern mit ihr interagieren, sich anpassen und sie aktiv verbessern.

Wie wir gesehen haben, sind die Werkzeuge und Architekturen, die diesen Wandel ermöglichen, bereits leistungsfähig – doch ihr volles Potenzial wird erst allmählich verstanden. Ob es die dynamische Flexibilität der Erweiterungen, die kontrollierte Präzision der Funktionen oder das wissenssteigernde Potenzial der Datenspeicher ist – jede dieser Komponenten spielt eine entscheidende Rolle in der Gestaltung der Agentic AI-Landschaft.

Doch wie bei jeder mächtigen Technologie liegt die Verantwortung für ihre Gestaltung in unseren Händen. Die Herausforderung unserer Zeit besteht darin, Agenten zu entwickeln, die nicht nur effektiv, sondern auch ethisch, transparent und mit menschlichen Werten im Einklang stehen.

Die nächste Grenze der Künstlichen Intelligenz ist erreicht – geprägt nicht durch einzelne Errungenschaften, sondern durch integrierte, agentische Systeme, die unsere Art zu arbeiten, Probleme zu lösen, zu innovieren und zu kollaborieren grundlegend verändern. So wie DeepSeek einen Wendepunkt markierte, signalisiert der Aufstieg der Agentic AI den Beginn einer neuen Ära – einer, in der Intelligenz nicht nur smart, sondern zielgerichtet ist; nicht nur reaktiv, sondern proaktiv.

Die Frage ist nicht mehr, ob Agentic AI unsere Welt verändern wird – sondern wie wir sie nutzen, um eine lebenswerte Zukunft zu gestalten.

Die Reise hat gerade erst begonnen. Wie wirst du Teil davon sein?

Mehr Informationen gibt es hier.

Diese Beiträge könnten Sie ebenfalls interessieren: