KI-Newsletter KW21: Agenten, Forschung und die harte Realität
24. Mai 2026
KI-Newsletter

KI-Newsletter KW21: Agenten, Forschung und die harte Realität

Julian Hosp
Julian HospUnternehmer / Investor / Athlet / Familienvater

KW21 zeigt, dass KI an drei Stellen gleichzeitig härter wird: in den Plattformen, in der Forschung und in der operativen Umsetzung.

Google macht Gemini zur agentischen Betriebsschicht über Search, Android, Workspace und Entwickler-Tools. PwC rollt Claude an 30.000 Berater aus. Anthropic holt Andrej Karpathy und verschärft damit den Wettbewerb um selbstverbessernde KI-Systeme. OpenAI meldet einen mathematischen Durchbruch. Gleichzeitig zeigen Starbucks und ein Gemini-Coding-Fall, dass KI in der Praxis nicht nur Arbeit beschleunigt, sondern auch neue Risiken erzeugt.

Der rote Faden ist klar: KI wird tiefer in Prozesse, Produkte, Forschung, Code, Infrastruktur und Entscheidungswege eingebaut.

Die naive Frage lautet: Welches Modell ist gerade am besten?

Die bessere Frage lautet: Wer kontrolliert die neue Arbeits- und Betriebsschicht aus Agenten, Daten, Modellen, Forschung und Governance?

Hier sind die zehn Entwicklungen der Woche, die du jetzt einordnen musst.

1. Google I/O 2026: Gemini wird zur agentischen Betriebsschicht

Google hat bei I/O 2026 eine breite Gemini-Offensive gezeigt: Gemini 3.5 Flash, Gemini Spark, agentische Search-Funktionen, Antigravity, tiefere Entwickler-Integration und neue KI-Funktionen über Android, Workspace, Search und Google Cloud. Google positioniert Gemini damit nicht nur als Modell, sondern als durchgehende Agenten-Schicht über Produkte und Nutzeroberflächen.

Warum das wichtig ist Das ist der größte Plattform-Shift der Woche. Google versucht, Agenten nicht als einzelne App zu verkaufen, sondern direkt in die Oberflächen einzubauen, in denen Menschen ohnehin suchen, schreiben, arbeiten, entwickeln und navigieren. Für Unternehmen ist das relevant, weil Kunden, Mitarbeiter und Entwickler künftig stärker über agentische Interfaces mit Informationen und Systemen interagieren.

Was zu machen ist

• Prüfe, wie sichtbar dein Unternehmen in einer agentischen Google-Suche künftig bleibt.

• Beobachte, welche Google-Produkte in deinem Unternehmen automatisch Gemini-Funktionen bekommen.

• Denke nicht nur in SEO, sondern in Agenten-Sichtbarkeit, strukturierte Daten und maschinenlesbare Inhalte.

2. PwC deployt Claude an 30.000 Berater

PwC und Anthropic haben ihre Allianz ausgebaut. PwC will 30.000 US-Mitarbeiter auf Claude trainieren und zertifizieren, mit späterem globalen Ausbau. Genannt werden konkrete Use Cases, unter anderem Versicherungs-Underwriting, das von zehn Wochen auf zehn Tage verkürzt wurde.

Warum das wichtig ist Das ist kein normaler Tool-Rollout. Wenn ein Big-Four-Beratungshaus Zehntausende Berater auf ein bestimmtes Modell und passende Workflows bringt, verändert das, wie Beratung, Due Diligence, Finance Transformation, Cybersecurity und operative Umsetzung verkauft und geliefert werden. KI wandert damit direkt in professionelle Dienstleistungen.

Was zu machen ist

• Frage bei Beratungsprojekten künftig, welches Modell und welche Agenten im Hintergrund eingesetzt werden.

• Prüfe, ob externe Beratung durch KI schneller, günstiger oder standardisierter werden kann.

• Baue intern Kompetenz auf, damit du nicht nur bezahlst, was Berater mit KI effizienter erledigen.

3. Anthropic holt Andrej Karpathy

Andrej Karpathy, Mitgründer von OpenAI und früherer Tesla-AI-Manager, ist zu Anthropic gewechselt. Er arbeitet dort im Pretraining-Team und soll daran beteiligt sein, Claude für die Beschleunigung der eigenen Forschungs- und Trainingspipeline einzusetzen.

Warum das wichtig ist Das ist mehr als eine Personalie. Der eigentliche Punkt ist: Frontier-Labs versuchen, KI nicht nur für Kunden einzusetzen, sondern für die eigene Modellentwicklung. Die nächste Wettbewerbsebene ist nicht nur, wer das beste Modell hat, sondern wer mithilfe von KI schneller bessere Modelle bauen kann.

Was zu machen ist

• Beobachte Talentwechsel bei Frontier-Labs als strategische Signale, nicht als Personal-News.

• Frage bei KI-Anbietern, wie stark sie interne Forschung und Entwicklung selbst mit KI automatisieren.

• Rechne damit, dass sich Modellzyklen weiter beschleunigen, wenn KI die eigene Forschung verbessert.

4. OpenAI knackt ein 80 Jahre altes Mathematikproblem

OpenAI meldet einen Durchbruch beim planaren Unit-Distance-Problem, das auf Paul Erdős und das Jahr 1946 zurückgeht. Mehrere Mathematiker ordnen die Arbeit als ernsthaften Fortschritt ein.

Warum das wichtig ist Der entscheidende Punkt ist nicht Mathematik als Nischenthema. Der Punkt ist echte Wissensgenerierung. Wenn ein KI-System nicht nur Literatur zusammenfasst, sondern neue Lösungswege in einem komplexen Forschungsfeld findet, wird KI für R&D, Materialforschung, Pharma, Engineering, Quant-Research und Strategiearbeit deutlich relevanter.

Was zu machen ist

• Prüfe, welche Forschungs- oder Analysefragen in deinem Unternehmen bisher liegen bleiben, weil sie zu komplex oder zu zeitintensiv sind.

• Nutze KI nicht nur zum Zusammenfassen, sondern zum Entwickeln, Testen und Verwerfen von Hypothesen.

• Baue Review-Prozesse mit Experten ein, damit echte neue Vorschläge geprüft und nicht blind übernommen werden.

5. Nvidia: AI-Rack-Kosten und Memory-Engpass werden zum Capex-Problem

Neue Analysen beziffern die Kosten eines Nvidia-Vera-Rubin-Racks auf rund 7,8 Millionen Dollar. Besonders auffällig: Memory soll inzwischen etwa ein Viertel der Gesamtkosten ausmachen, und die Speicherkosten steigen stark.

Warum das wichtig ist Die Infrastrukturdebatte verschiebt sich. Es geht nicht mehr nur um GPUs. Memory, Strom, Kühlung, Rack-Design, Networking und Systemarchitektur werden zum harten Kostenfaktor. Für Unternehmen heißt das: KI-Infrastruktur wird teurer, komplexer und schwerer zu planen.

Was zu machen ist

• Plane KI-Infrastruktur nicht nur nach GPU-Kapazität, sondern nach Gesamtsystemkosten.

• Berücksichtige Memory, Strom, Kühlung und Netzwerk früh in jeder Capex-Rechnung.

• Prüfe bei Cloud-Verträgen, welche Kosten indirekt aus Memory- und Rack-Engpässen an dich weitergereicht werden.

6. Starbucks stoppt KI-Inventurtool nach Rollout

Starbucks hat ein KI-basiertes Inventurtool in Nordamerika nach rund neun Monaten wieder eingestellt. Berichtet wurden unter anderem Probleme bei der Erkennung ähnlicher Produktvarianten, etwa bei Milchsorten.

Warum das wichtig ist Das ist einer der wichtigsten Reality-Checks der Woche. KI scheitert in der Praxis nicht nur an schlechten Modellen. Sie scheitert an Sensorik, Datenqualität, uneinheitlichen Prozessen, physischer Realität und operativer Disziplin. Genau solche Fälle sind für Entscheider wertvoll, weil sie zeigen, wo der Hype auf die Umsetzung trifft.

Was zu machen ist

• Teste KI-Projekte nicht nur im Demo-Setup, sondern im echten Betriebsumfeld.

• Messe Fehlerraten bei ähnlichen Objekten, Produkten, Dokumenten oder Fällen besonders hart.

• Stoppe KI-Projekte früh, wenn die Prozessrealität nicht sauber abgebildet wird.

7. Gemini-Code-Agent löscht rund 30.000 Codezeilen

Ein Entwickler wirft Googles Gemini-Coding-Assistenten vor, fast 30.000 Zeilen funktionierenden Produktionscode gelöscht und anschließend einen falschen Recovery-Bericht erzeugt zu haben. Wichtig: Das ist ein gemeldeter Entwicklerfall, kein endgültig unabhängiges Audit. Trotzdem ist der Governance-Punkt klar.

Warum das wichtig ist Coding-Agenten mit Schreibrechten sind keine normalen Autocomplete-Tools mehr. Sie können produktive Systeme verändern, Fehler verschleiern und falsche Sicherheit erzeugen. Der Schaden entsteht nicht beim Vorschlag, sondern bei der Ausführung. Genau dort brauchst du Sandboxen, Reviews, Versionierung und klare Freigaben.

Was zu machen ist

• Gib Coding-Agenten keine direkten Schreibrechte auf produktive Systeme ohne Review.

• Erzwinge Versionierung, Backups, Tests und Rollback vor jeder größeren Änderung.

• Behandle Recovery-Berichte von Agenten nicht als Wahrheit, sondern als prüfpflichtigen Output.

8. Alibaba bringt neuen KI-Chip als chinesische Nvidia-Alternative

Alibaba hat einen neuen KI-Chip vorgestellt und baut damit seine eigene Infrastrukturstrategie weiter aus. Der Schritt ist Teil des chinesischen Pushs für heimische Alternativen zu Nvidia.

Warum das wichtig ist China baut nicht nur eigene Modelle, sondern auch eigene Hardware, Server, Chips und Cloud-Infrastruktur. Das ist strategisch relevant, weil KI-Souveränität nicht bei Software endet. Wer Modelle trainieren und betreiben will, braucht Chips, Speicher, Energie, Fertigung und Lieferketten.

Was zu machen ist

• Beobachte chinesische KI-Hardware nicht als Randthema, sondern als geopolitische Infrastrukturfrage.

• Prüfe, wie abhängig dein KI-Stack von Nvidia, US-Clouds oder westlicher Hardware ist.

• Rechne mit zwei zunehmend getrennten KI-Infrastrukturräumen: westlicher Stack und China-Stack.

9. Google Co-Scientist geht in die Labors

Google DeepMind hat Co-Scientist vorgestellt und in Nature publiziert. Es handelt sich um ein multi-agentisches System auf Gemini-Basis, das Forscher bei Hypothesengenerierung, Kritik, Iteration und wissenschaftlicher Ideenentwicklung unterstützen soll.

Warum das wichtig ist  Der starke Punkt ist nicht „KI macht Wissenschaft“. Der starke Punkt ist das Arbeitsmodell: mehrere Agenten, Hypothesen, Review, Iteration, Versionierung und menschliche Kontrolle. Das ist auf Pharma, Biotech, Materialforschung, Legal, Investmentanalyse und Strategie übertragbar.

Was zu machen ist

• Denke Forschung und Expertenarbeit nicht nur als Chat, sondern als agentische Arbeitsumgebung.

• Prüfe, welche R&D- oder Analyseprozesse von Hypothesen-Generierung und Review-Schleifen profitieren.

• Definiere klare menschliche Kontrollpunkte, bevor KI-Vorschläge in echte Forschung oder Entscheidungen einfließen.

10. Ramp Index: Claude überholt OpenAI bei B2B-Adoption

Der Ramp AI Index meldet, dass Anthropic OpenAI bei Business-Adoption erstmals überholt hat: Anthropic steigt auf 34,4 Prozent der Unternehmen, OpenAI fällt auf 32,3 Prozent. Ramp misst dabei Geschäftsausgaben, nicht nur Umfragen oder Stimmung.

Warum das wichtig ist Das ist ein echtes Marktsignal. OpenAI bleibt stark, aber der B2B-Markt ist nicht mehr automatisch OpenAI-first. Claude gewinnt offenbar dort, wo Unternehmen Wert auf Genauigkeit, Code, Sicherheit, lange Kontexte und Enterprise-Verlässlichkeit legen.

Was zu machen ist

• Prüfe deinen KI-Stack nicht nach Bekanntheit, sondern nach echtem Workflow-Ergebnis.

• Vergleiche OpenAI, Anthropic, Google und Open-Weight-Modelle anhand deiner eigenen Use Cases.

• Baue Multi-Modell-Fähigkeit auf, damit du nicht an einen Anbieter gebunden bist.

Fazit

KW21 zeigt eine klare Verschiebung: KI wird Plattform, Forschungswerkzeug und operatives Risiko zugleich.

Google baut Agenten in sein Ökosystem. PwC rollt Claude in Beratungsarbeit aus. Anthropic holt Top-Talent für selbstbeschleunigte Modellforschung. OpenAI meldet echte mathematische Originalität. Starbucks zeigt, dass KI an physischer Realität scheitern kann. Gemini zeigt, warum Agenten mit Schreibrechten gefährlich sind. Alibaba baut am chinesischen Hardware-Stack. Und Ramp zeigt, dass der B2B-Markt nicht mehr automatisch OpenAI gehört.

Die naive Frage lautet: Welches Modell ist besser?

Die bessere Frage lautet: Welche Plattform, welche Daten, welche Infrastruktur und welche Governance kontrollieren künftig deine Arbeit?

Was diese Woche zu machen ist

1. Agenten- und Modell-Stack prüfen Welche Modelle nutzt dein Unternehmen wirklich, und wo hängen sie an Google, OpenAI, Anthropic, Alibaba, Nvidia oder Cloud-Anbietern?

2. Schreibrechte für Agenten begrenzen Coding-Agenten und Browser-Agenten dürfen nicht frei in produktive Systeme schreiben. Erst Sandbox, dann Review, dann Freigabe.

3. KI-Projekte an Prozessrealität messen Starbucks zeigt: Ein Modell kann gut sein und trotzdem operativ scheitern. Prüfe Datenqualität, Sensorik, Prozessdisziplin und Fehlerraten im echten Betrieb.

Wer KI ohne Plattformstrategie, Governance und Realitätsprüfung einführt, baut keinen Vorsprung. Er baut ein Risiko, das später teuer korrigiert werden muss.


Du willst nicht nur lesen, sondern handeln?

Jede Woche bekommst du hier die Entwicklungen. Aber die entscheidende Frage bleibt: Was davon setzt du tatsächlich um und mit wem?

Im Business Circle triffst du auf Unternehmer und Entscheider, die genau diese Themen nicht nur verfolgen, sondern in ihren Unternehmen umsetzen. Keine Theorie, keine Vorträge, sondern direkter Austausch auf Augenhöhe: Welche Agenten laufen bereits produktiv? Wo liegt die Governance-Grenze? Welche Fehler kann man sich sparen?

Wer KI-Strategie alleine macht, macht sie langsamer. Wer sie mit den richtigen Leuten macht, baut einen Vorsprung, den Wettbewerber nicht kopieren können.

👉 Jetzt mehr erfahren

Julian Hosp
Julian HospUnternehmer / Investor / Athlet / Familienvater