Die Frage kommt mittlerweile in jedem zweiten Erstgespräch. Meistens von Geschäftsführern oder CTOs, die ihr Team KI-fit machen wollen, oder von E-Commerce-Leitern die im Shop automatisieren müssen. Und fast immer lautet sie: "Welche KI-Agentur empfehlt ihr?" Die ehrliche Antwort ist unbequem. Die beste KI-Agentur gibt es nicht. Es gibt die richtige für deinen Case. Und die hängt davon ab, ob du Beratung brauchst oder Bauarbeit. Ob du noch sortierst, was KI für euch überhaupt bedeutet, oder ob du längst weißt was du willst und jemanden brauchst der es produktiv in deine Systeme baut. Genau dafür ist dieser Artikel da.
Inhalt
- Die beste KI-Agentur gibt es nicht
- Zwei Typen von KI-Agenturen
- Welcher Typ passt zu welchem Case?
- Auswahl-Kriterien, ehrlich
- Red Flags bei der KI-Agentur-Suche
- So läuft ein gutes Erstgespräch
- Wo dasistweb steht
- FAQ
- Fazit
Die beste KI-Agentur gibt es nicht
Wer auf Google "beste KI-Agentur" eintippt, bekommt Listicle-Seiten mit zehn Anbietern. Die sehen alle ähnlich aus. Logo, Claim, drei Buzzwords, Kontaktformular. Das Problem: KI-Agentur ist kein homogener Markt. Unter dem gleichen Label arbeiten Strategen, Change-Manager, Prompt-Trainer, Integrations-Entwickler, ML-Engineers, Datenschutz-Berater und Tool-Verkäufer.
Die richtige Agentur für deinen Case hängt von zwei Fragen ab. Weißt du schon, was KI für dich konkret leisten soll? Und wer bei dir soll es nutzen: das Team als Werkzeug, oder die Software als Automatisierung?
Wenn du auf beide Fragen noch keine klare Antwort hast, brauchst du jemanden der dich durch die Strategie führt. Wenn du beide Antworten hast, brauchst du jemanden der baut. Das sind zwei grundverschiedene Agentur-Typen. Und sie schließen sich nicht aus. Viele Projekte starten mit Typ A und gehen dann in Typ B über. Aber beide zusammen bekommst du selten aus einer Hand.
Zwei Typen von KI-Agenturen
Bevor du suchst, musst du diese Unterscheidung kennen. Sonst redest du mit drei Agenturen die sich alle "KI-Agentur" nennen und komplett unterschiedliche Dinge anbieten.
Typ A: Strategie- und Beratungs-Agenturen
Diese Agenturen bringen Unternehmen dahin, dass sie überhaupt eine KI-Orientierung haben. Sie machen Workshops, Use-Case-Findung, Roadmaps, Change-Management, Schulungen für Mitarbeiter, Governance-Frameworks und Prompt-Trainings. Das Ergebnis ist meistens ein Strategiepapier, ein KI-Readiness-Report oder ein ausgebildetes Team.
Stark wenn: Du weißt nicht wo KI euch trägt. Dein Team hat Berührungsängste. Es gibt keine KI-Policy, keine DSGVO-Haltung, keinen klaren Case. Führungskräfte brauchen Einordnung, was realistisch ist und was Hype. Euer Unternehmen ist zu groß um einfach "mal was mit ChatGPT" zu machen, und zu klein um einen eigenen KI-Lead einzustellen.
Schwach wenn: Die Umsetzung ansteht. Typ-A-Agenturen haben meistens keine Entwickler. Sie empfehlen Tools, aber sie bauen keine Integration in dein Shopware, dein SAP, dein PIM. Sie trainieren dein Team auf ChatGPT, aber sie bauen keinen Claude-Agenten der deine Retouren bearbeitet. Wenn aus dem Workshop ein Projekt wird, müssen sie einen Tech-Partner dazuholen. Oder du musst selbst einen suchen.
Typ B: Engineering- und Build-Agenturen
Diese Agenturen programmieren. Sie bauen KI produktiv in bestehende Systeme ein. Claude-, GPT- oder lokale LLMs, eingebunden in Shopware, Shopify, Commercetools, SAP, PIM, CRM, Helpdesk. Eigene Modelle hosten, MCP-Server, Agenten die mehrstufige Aufgaben erledigen, Automatisierungen mit n8n, echte Datenpipelines. Sie schreiben Code, sie deployen, sie monitoren.
Stark wenn: Du weißt schon was du brauchst. "Wir wollen einen Claude-Agenten der aus 20.000 Produktdaten saubere PIM-Einträge macht." "Wir brauchen KI-Produktbeschreibungen in unserem Shopware direkt im Admin." "Wir wollen DSGVO-konform auf eigener Hardware laufen." Das sind Engineering-Projekte. Du brauchst jemanden der beide Welten kennt: KI und dein Stack.
Schwach wenn: Du noch gar nicht weißt was du willst. Eine Engineering-Agentur kann dir ein Discovery liefern, klar. Aber ein Change-Management-Programm für 200 Mitarbeiter, mit Workshops, Widerständen und Führungskräfte-Coaching, ist nicht ihr Ding. Dafür gibt es die Strategie-Agenturen, und die machen das besser als wir es je könnten.
Wir sind Typ B. Seit 2011 bauen wir E-Commerce-Systeme. Seit den ersten produktiven Claude- und GPT-Releases bauen wir damit in unsere Kundensysteme. Nicht als Experiment, sondern als Teil der Roadmap. Das heißt aber auch: Wenn du reine Beratung brauchst, empfehlen wir dir andere. Mehr dazu weiter unten.
Wie du merkst, welcher Typ gerade für dich richtig ist
Stell dir eine Frage. Könntest du der Agentur heute ein Briefing schreiben, das mindestens eine konkrete Integration, ein konkretes Tool und ein konkretes Zielsystem enthält? Wenn ja, bist du bei Typ B richtig. Wenn nein, brauchst du zuerst Typ A. Oder eine Typ-B-Agentur die ein ehrliches Discovery macht, bevor sie anfängt zu bauen.
Welcher Typ passt zu welchem Case?
Die Unterscheidung wird konkret, wenn man typische Anfragen durchgeht. So sehen die Cases aus, die bei uns und befreundeten Agenturen regelmäßig auf dem Tisch landen.
| Case | Passender Typ | Warum |
|---|---|---|
| "Wir wissen noch nicht, wo KI uns trägt." | Typ A, später Typ B | Erst Orientierung. Workshop mit Use-Case-Findung. Dann Priorisierung. Umsetzung kommt danach. |
| "Wir brauchen einen Claude-Agenten der in Shopware Support-Tickets vorqualifiziert." | Typ B | Klare Integration, klares System, klares Ziel. Ein Engineering-Projekt. |
| "Wir wollen einen Workshop für das gesamte Marketing-Team." | Typ A | Schulung, Didaktik, Prompt-Training. Keine Code-Lieferung. |
| "Wir haben 20.000 Produkte und wollen die Produkttexte mit KI neu bauen." | Typ B | PIM-Anbindung, Batch-Verarbeitung, Qualitätskontrolle. Pure Umsetzung. |
| "Wir wollen DSGVO-konform auf eigener Hardware laufen, keine US-Cloud." | Typ B mit Spezial-Kompetenz | Self-Hosted-LLMs, GPU-Setup, Daten-Governance. Nicht jede Typ-B-Agentur kann das. |
| "Wir brauchen eine KI-Strategie für die nächsten zwei Jahre." | Typ A | Reine Strategiearbeit, Roadmapping, Priorisierung. |
| "Wir wollen im ERP automatisieren, was heute manuell in Excel läuft." | Typ B | Integration, Automatisierung, eventuell Agenten. Engineering-Arbeit. |
| "Unser Kundenservice ist überlastet, wir denken an einen Bot." | Kommt drauf an | Wenn ihr wisst was der Bot können soll: Typ B. Wenn ihr noch sortiert, ob überhaupt: Typ A. |
Ein Muster, das oft auftaucht: Firmen buchen Typ A, weil sie glauben das ist der richtige Einstieg, und sind dann enttäuscht weil nach vier Wochen Workshop "nichts rauskommt". Andere Firmen buchen Typ B, obwohl sie noch gar keinen Plan haben, und sind enttäuscht weil die Agentur sagt "wir brauchen erstmal eine klare Anforderung". Beide Enttäuschungen lassen sich vermeiden, wenn man vorher weiß welcher Typ gerade dran ist.
Auswahl-Kriterien, ehrlich
Wenn du geklärt hast welchen Typ du brauchst, kommen die Kriterien. Diese Liste gilt für beide Typen, die Gewichtung ist aber unterschiedlich.
Live-Referenzen, nicht Decks
Jede KI-Agentur hat ein Deck mit "Use Cases". Das ist nichts wert. Frag nach einem produktiv laufenden System. Für Typ A: "Zeigt mir das Strategiepapier, das bei einem Kunden tatsächlich umgesetzt wurde. Und den Kunden den ich anrufen darf." Für Typ B: "Zeigt mir den Agenten live. Mit echten Daten. Und erklärt mir wie er gebaut ist." Wer kein Produktives vorzeigen kann, ist entweder zu jung im Markt oder arbeitet nur an PoCs die nie die Pilotphase verlassen.
Tech-Stack-Transparenz
Welche Modelle setzen sie ein? Claude, GPT, Gemini, Mistral, Llama? Über welche API, über welches Framework? MCP, LangChain, eigene Implementierung? Hosten sie selbst oder nutzen sie Cloud? Wer auf diese Fragen ausweichend antwortet ("wir nutzen die beste KI für den jeweiligen Fall"), hat keine Engineering-Tiefe. Gute Typ-B-Agenturen haben Meinungen zu Modellen. Gute Typ-A-Agenturen kennen zumindest den aktuellen Stand.
Preis-Struktur
Typ A arbeitet oft mit Tagessätzen oder Workshop-Paketen. Das ist planbar. Typ B arbeitet entweder mit Fixpreis für klar umrissene Features oder Time & Material für unklare Scopes. Auch das ist planbar, solange Transparenz herrscht. Rote Flagge: "Das hängt von zu vielen Faktoren ab, wir melden uns." Gute Agenturen geben dir Spannbreiten, nennen Annahmen und erklären worauf sie basieren.
Datenschutz-Haltung
Das ist in Deutschland und Europa kein Nebenthema. Frag konkret. Wie geht ihr mit personenbezogenen Daten um? Hosten eure Modelle in der EU? Wie ist eure AVV-Vorlage? Nutzt ihr Anthropic, OpenAI, Azure? Wisst ihr was ein Auftragsverarbeitungsvertrag bei Anthropic bedeutet im Vergleich zu OpenAI? Wenn die Agentur hier anfängt zu schwurbeln, weiß sie es nicht oder sie hat sich nicht ernsthaft damit beschäftigt.
Was sie NICHT machen
Die wichtigste Frage. Eine Agentur die ehrlich sagt "Change-Management machen wir nicht, dafür empfehlen wir dir X" ist Gold wert. Eine Agentur die auf alle Fragen mit "ja, machen wir auch" antwortet, baut entweder nichts davon richtig oder versteht die Frage nicht. Spezialisierung ist kein Makel, sondern ein Qualitätssignal.
Red Flags bei der KI-Agentur-Suche
Einige Dinge sollten dich direkt warnen.
"Wir nutzen einfach ChatGPT." Wenn die KI-Strategie der Agentur aus einem ChatGPT-Plus-Abo besteht, ist das keine Agentur. Das ist ein Dienstleister der das Gleiche macht was dein Team auch selber machen könnte. Echte Agenturen haben Meinungen zu Modellen, zu Frameworks, zu Integration, zu Monitoring. Sie haben einen Stack. Sie haben Erfahrungen, welches Modell welche Aufgabe besser löst.
Alles-Könner. "Wir machen KI-Strategie, KI-Schulung, KI-Implementierung, Change-Management, eigene Modelle, PIM-Integration, Chatbot, AI-Agenten, Data-Engineering, MLOps." Bei fünf bis fünfzehn Leuten ist das unrealistisch. Entweder sie machen nichts davon wirklich gut, oder sie meinen mit jedem Begriff etwas anderes als der Markt.
Consultants ohne Produktions-Referenz. Eine Agentur die nur PowerPoint liefert, aber nie etwas in Produktion gebracht hat, kann dir keine ehrliche Auskunft geben, was technisch funktioniert. Strategen die nie gebaut haben, überschätzen systematisch, wie einfach die Umsetzung wird. Fragt konkret nach einem lauffähigen Produkt, das sie selbst oder mit Partnern gebaut haben.
DSGVO-Schwurbeln. Wenn auf die Frage "wie steht ihr zu DSGVO" Sätze kommen wie "wir achten natürlich auf Datenschutz" oder "das ist ein wichtiges Thema für uns", aber keine konkreten Aussagen zu Modell-Hosting, AVV, Subprocessorn oder Daten-Residency folgen, dann haben sie sich nicht damit beschäftigt. In der EU mit KI zu arbeiten ohne eine klare Datenschutz-Haltung ist fahrlässig. Für die Agentur und für dich.
Versprechen ohne Kosten-Offenheit. "Wir bauen euch einen Agenten der 80% eurer Tickets löst." Was kostet das? "Das hängt ab..." Wenn du keine Zahlen bekommst, weder Bandbreite noch Aufwand, fehlt Engineering-Erfahrung. Gute Agenturen kennen ihren Umsetzungsaufwand. Sie sagen "Discovery zwei Wochen, 8.000+ EUR. Erste Umsetzung MVP vier bis acht Wochen, 30.000+ EUR. Weitere Ausbaustufen nach Effekt."
So läuft ein gutes Erstgespräch
Das Erstgespräch entscheidet mehr als jedes Partner-Level, mehr als jede Case Study. Hier merkst du ob die Agentur dich versteht oder ob sie verkaufen will.
Was du fragst. Stell Fragen die Engineering-Erfahrung entlarven, nicht nur Marketing. "Welches Modell würdet ihr für Use Case X nehmen und warum?" "Wie geht ihr mit Halluzinationen um, wenn der Agent echte Aktionen ausführt?" "Was passiert, wenn das Modell-Upgrade eure Prompts bricht?" "Zeigt mir einen Agenten, den ihr produktiv betreibt, und erklärt mir warum ihr euch für dieses Framework entschieden habt." Bei Typ A kommen andere Fragen hoch: "Wie messt ihr den Erfolg eines KI-Workshops?" "Wie geht ihr mit Mitarbeitern um, die Angst um ihren Job haben?"
Was die Agentur fragen sollte. Das ist mindestens so wichtig. Eine gute Agentur fragt nach deinem Geschäftsmodell, nicht nach deinem Tool-Wunsch. Sie fragt nach deiner Daten-Reife, nicht nach deinem KI-Budget. Sie fragt warum jetzt, warum genau diese Aufgabe, was passiert wenn ihr es nicht macht. Sie stellt unbequeme Fragen wie "seid ihr sicher dass das der richtige Use Case ist?" oder "warum glaubt ihr dass KI hier schneller ist als ein sauberer Prozess?". Wer nie zurückfragt, baut dir was du sagst. Nicht was du brauchst.
Was du dabei haben solltest. Drei Dinge reichen. Ein Business-Ziel in einem Satz ("Wir wollen die Zeit die unser Service-Team auf wiederkehrende Fragen verbringt halbieren"). Eine ehrliche Einschätzung eurer Daten-Reife ("Produktdaten liegen im PIM, Kundendaten im Shop, beides nicht verknüpft"). Eine Budget-Range ("30.000+ EUR für das erste sichtbare Ergebnis in drei bis sechs Monaten, danach abhängig vom Effekt mehr"). Wer mit diesen drei Punkten ins Gespräch geht, bekommt in einer Stunde eine qualifizierte Einschätzung. Wer ohne sie kommt, bekommt ein freundliches Verkaufsgespräch und muss danach selbst sortieren was davon stimmt.
Wo dasistweb steht
Um es ehrlich zu sagen. Wir sind Typ B. Wir sind Engineers, seit 2011 bauen wir E-Commerce-Systeme, heute integrieren wir KI direkt in die Systeme die wir sowieso kennen: Shopware, Shopify, Commercetools, Storyblok, eigene Middleware, SAP- und PIM-Anbindungen. Seit die ersten produktiv nutzbaren LLMs da waren, bauen wir damit. Wir haben Meinungen zu Claude vs. GPT, zu MCP, zu Agent-Frameworks, zu Self-Hosting. Mehr zu unserer Herangehensweise steht auf der Seite KI-Implementierung.
Wir passen für Unternehmen die KI produktiv in Commerce-, ERP- oder Content-Systeme bringen wollen, die DSGVO ernst nehmen, und die jemanden brauchen der beide Welten kennt. Unser Sweet Spot sind Kunden im Bereich 5 bis 150 Mio EUR GMV, durchschnittliche Kundenbeziehung über fünf Jahre, 25 Spezialist:innen im Team, davon 80 Prozent Seniors. Wir sind Shopware-Partner seit 2012, aktuell Gold-Level, und wir waren SW6 Co-Entwickler vor dem offiziellen Launch. Das heißt: Wir kennen die Systeme, in die wir KI einbauen, auf Code-Ebene.
Wir sind NICHT der richtige Partner, wenn du eine reine Change-Management-Beratung brauchst, wenn du einen großen Team-Workshop für Führungskräfte suchst oder wenn du eine zweijährige Transformation mit Widerstandsarbeit begleitet haben willst. Dafür gibt es gute spezialisierte Beratungen, und wir empfehlen sie gerne. Wenn bei dir beides ansteht, Strategie plus Engineering, machen wir den Engineering-Teil gut und empfehlen für die Strategie einen Partner der das besser kann als wir.