Zum Hauptinhalt springen
Zurück zu Wissen

KI-Agentur finden 2026: Zwei Typen, klare Auswahl, ehrlich

Martin WeinmayrVonMartin Weinmayr·

Die Frage kommt mittlerweile in jedem zweiten Erstgespräch. Meistens von Geschäftsführern oder CTOs, die ihr Team KI-fit machen wollen, oder von E-Commerce-Leitern die im Shop automatisieren müssen. Und fast immer lautet sie: "Welche KI-Agentur empfehlt ihr?" Die ehrliche Antwort ist unbequem. Die beste KI-Agentur gibt es nicht. Es gibt die richtige für deinen Case. Und die hängt davon ab, ob du Beratung brauchst oder Bauarbeit. Ob du noch sortierst, was KI für euch überhaupt bedeutet, oder ob du längst weißt was du willst und jemanden brauchst der es produktiv in deine Systeme baut. Genau dafür ist dieser Artikel da.

Inhalt

  1. Die beste KI-Agentur gibt es nicht
  2. Zwei Typen von KI-Agenturen
  3. Welcher Typ passt zu welchem Case?
  4. Auswahl-Kriterien, ehrlich
  5. Red Flags bei der KI-Agentur-Suche
  6. So läuft ein gutes Erstgespräch
  7. Wo dasistweb steht
  8. FAQ
  9. Fazit

Die beste KI-Agentur gibt es nicht

Wer auf Google "beste KI-Agentur" eintippt, bekommt Listicle-Seiten mit zehn Anbietern. Die sehen alle ähnlich aus. Logo, Claim, drei Buzzwords, Kontaktformular. Das Problem: KI-Agentur ist kein homogener Markt. Unter dem gleichen Label arbeiten Strategen, Change-Manager, Prompt-Trainer, Integrations-Entwickler, ML-Engineers, Datenschutz-Berater und Tool-Verkäufer.

Die richtige Agentur für deinen Case hängt von zwei Fragen ab. Weißt du schon, was KI für dich konkret leisten soll? Und wer bei dir soll es nutzen: das Team als Werkzeug, oder die Software als Automatisierung?

Wenn du auf beide Fragen noch keine klare Antwort hast, brauchst du jemanden der dich durch die Strategie führt. Wenn du beide Antworten hast, brauchst du jemanden der baut. Das sind zwei grundverschiedene Agentur-Typen. Und sie schließen sich nicht aus. Viele Projekte starten mit Typ A und gehen dann in Typ B über. Aber beide zusammen bekommst du selten aus einer Hand.


Zwei Typen von KI-Agenturen

Bevor du suchst, musst du diese Unterscheidung kennen. Sonst redest du mit drei Agenturen die sich alle "KI-Agentur" nennen und komplett unterschiedliche Dinge anbieten.

Typ A: Strategie- und Beratungs-Agenturen

Diese Agenturen bringen Unternehmen dahin, dass sie überhaupt eine KI-Orientierung haben. Sie machen Workshops, Use-Case-Findung, Roadmaps, Change-Management, Schulungen für Mitarbeiter, Governance-Frameworks und Prompt-Trainings. Das Ergebnis ist meistens ein Strategiepapier, ein KI-Readiness-Report oder ein ausgebildetes Team.

Stark wenn: Du weißt nicht wo KI euch trägt. Dein Team hat Berührungsängste. Es gibt keine KI-Policy, keine DSGVO-Haltung, keinen klaren Case. Führungskräfte brauchen Einordnung, was realistisch ist und was Hype. Euer Unternehmen ist zu groß um einfach "mal was mit ChatGPT" zu machen, und zu klein um einen eigenen KI-Lead einzustellen.

Schwach wenn: Die Umsetzung ansteht. Typ-A-Agenturen haben meistens keine Entwickler. Sie empfehlen Tools, aber sie bauen keine Integration in dein Shopware, dein SAP, dein PIM. Sie trainieren dein Team auf ChatGPT, aber sie bauen keinen Claude-Agenten der deine Retouren bearbeitet. Wenn aus dem Workshop ein Projekt wird, müssen sie einen Tech-Partner dazuholen. Oder du musst selbst einen suchen.

Typ B: Engineering- und Build-Agenturen

Diese Agenturen programmieren. Sie bauen KI produktiv in bestehende Systeme ein. Claude-, GPT- oder lokale LLMs, eingebunden in Shopware, Shopify, Commercetools, SAP, PIM, CRM, Helpdesk. Eigene Modelle hosten, MCP-Server, Agenten die mehrstufige Aufgaben erledigen, Automatisierungen mit n8n, echte Datenpipelines. Sie schreiben Code, sie deployen, sie monitoren.

Stark wenn: Du weißt schon was du brauchst. "Wir wollen einen Claude-Agenten der aus 20.000 Produktdaten saubere PIM-Einträge macht." "Wir brauchen KI-Produktbeschreibungen in unserem Shopware direkt im Admin." "Wir wollen DSGVO-konform auf eigener Hardware laufen." Das sind Engineering-Projekte. Du brauchst jemanden der beide Welten kennt: KI und dein Stack.

Schwach wenn: Du noch gar nicht weißt was du willst. Eine Engineering-Agentur kann dir ein Discovery liefern, klar. Aber ein Change-Management-Programm für 200 Mitarbeiter, mit Workshops, Widerständen und Führungskräfte-Coaching, ist nicht ihr Ding. Dafür gibt es die Strategie-Agenturen, und die machen das besser als wir es je könnten.

Wir sind Typ B. Seit 2011 bauen wir E-Commerce-Systeme. Seit den ersten produktiven Claude- und GPT-Releases bauen wir damit in unsere Kundensysteme. Nicht als Experiment, sondern als Teil der Roadmap. Das heißt aber auch: Wenn du reine Beratung brauchst, empfehlen wir dir andere. Mehr dazu weiter unten.

Wie du merkst, welcher Typ gerade für dich richtig ist

Stell dir eine Frage. Könntest du der Agentur heute ein Briefing schreiben, das mindestens eine konkrete Integration, ein konkretes Tool und ein konkretes Zielsystem enthält? Wenn ja, bist du bei Typ B richtig. Wenn nein, brauchst du zuerst Typ A. Oder eine Typ-B-Agentur die ein ehrliches Discovery macht, bevor sie anfängt zu bauen.


Welcher Typ passt zu welchem Case?

Die Unterscheidung wird konkret, wenn man typische Anfragen durchgeht. So sehen die Cases aus, die bei uns und befreundeten Agenturen regelmäßig auf dem Tisch landen.

CasePassender TypWarum
"Wir wissen noch nicht, wo KI uns trägt."Typ A, später Typ BErst Orientierung. Workshop mit Use-Case-Findung. Dann Priorisierung. Umsetzung kommt danach.
"Wir brauchen einen Claude-Agenten der in Shopware Support-Tickets vorqualifiziert."Typ BKlare Integration, klares System, klares Ziel. Ein Engineering-Projekt.
"Wir wollen einen Workshop für das gesamte Marketing-Team."Typ ASchulung, Didaktik, Prompt-Training. Keine Code-Lieferung.
"Wir haben 20.000 Produkte und wollen die Produkttexte mit KI neu bauen."Typ BPIM-Anbindung, Batch-Verarbeitung, Qualitätskontrolle. Pure Umsetzung.
"Wir wollen DSGVO-konform auf eigener Hardware laufen, keine US-Cloud."Typ B mit Spezial-KompetenzSelf-Hosted-LLMs, GPU-Setup, Daten-Governance. Nicht jede Typ-B-Agentur kann das.
"Wir brauchen eine KI-Strategie für die nächsten zwei Jahre."Typ AReine Strategiearbeit, Roadmapping, Priorisierung.
"Wir wollen im ERP automatisieren, was heute manuell in Excel läuft."Typ BIntegration, Automatisierung, eventuell Agenten. Engineering-Arbeit.
"Unser Kundenservice ist überlastet, wir denken an einen Bot."Kommt drauf anWenn ihr wisst was der Bot können soll: Typ B. Wenn ihr noch sortiert, ob überhaupt: Typ A.

Ein Muster, das oft auftaucht: Firmen buchen Typ A, weil sie glauben das ist der richtige Einstieg, und sind dann enttäuscht weil nach vier Wochen Workshop "nichts rauskommt". Andere Firmen buchen Typ B, obwohl sie noch gar keinen Plan haben, und sind enttäuscht weil die Agentur sagt "wir brauchen erstmal eine klare Anforderung". Beide Enttäuschungen lassen sich vermeiden, wenn man vorher weiß welcher Typ gerade dran ist.


Auswahl-Kriterien, ehrlich

Wenn du geklärt hast welchen Typ du brauchst, kommen die Kriterien. Diese Liste gilt für beide Typen, die Gewichtung ist aber unterschiedlich.

Live-Referenzen, nicht Decks

Jede KI-Agentur hat ein Deck mit "Use Cases". Das ist nichts wert. Frag nach einem produktiv laufenden System. Für Typ A: "Zeigt mir das Strategiepapier, das bei einem Kunden tatsächlich umgesetzt wurde. Und den Kunden den ich anrufen darf." Für Typ B: "Zeigt mir den Agenten live. Mit echten Daten. Und erklärt mir wie er gebaut ist." Wer kein Produktives vorzeigen kann, ist entweder zu jung im Markt oder arbeitet nur an PoCs die nie die Pilotphase verlassen.

Tech-Stack-Transparenz

Welche Modelle setzen sie ein? Claude, GPT, Gemini, Mistral, Llama? Über welche API, über welches Framework? MCP, LangChain, eigene Implementierung? Hosten sie selbst oder nutzen sie Cloud? Wer auf diese Fragen ausweichend antwortet ("wir nutzen die beste KI für den jeweiligen Fall"), hat keine Engineering-Tiefe. Gute Typ-B-Agenturen haben Meinungen zu Modellen. Gute Typ-A-Agenturen kennen zumindest den aktuellen Stand.

Preis-Struktur

Typ A arbeitet oft mit Tagessätzen oder Workshop-Paketen. Das ist planbar. Typ B arbeitet entweder mit Fixpreis für klar umrissene Features oder Time & Material für unklare Scopes. Auch das ist planbar, solange Transparenz herrscht. Rote Flagge: "Das hängt von zu vielen Faktoren ab, wir melden uns." Gute Agenturen geben dir Spannbreiten, nennen Annahmen und erklären worauf sie basieren.

Datenschutz-Haltung

Das ist in Deutschland und Europa kein Nebenthema. Frag konkret. Wie geht ihr mit personenbezogenen Daten um? Hosten eure Modelle in der EU? Wie ist eure AVV-Vorlage? Nutzt ihr Anthropic, OpenAI, Azure? Wisst ihr was ein Auftragsverarbeitungsvertrag bei Anthropic bedeutet im Vergleich zu OpenAI? Wenn die Agentur hier anfängt zu schwurbeln, weiß sie es nicht oder sie hat sich nicht ernsthaft damit beschäftigt.

Was sie NICHT machen

Die wichtigste Frage. Eine Agentur die ehrlich sagt "Change-Management machen wir nicht, dafür empfehlen wir dir X" ist Gold wert. Eine Agentur die auf alle Fragen mit "ja, machen wir auch" antwortet, baut entweder nichts davon richtig oder versteht die Frage nicht. Spezialisierung ist kein Makel, sondern ein Qualitätssignal.


Red Flags bei der KI-Agentur-Suche

Einige Dinge sollten dich direkt warnen.

"Wir nutzen einfach ChatGPT." Wenn die KI-Strategie der Agentur aus einem ChatGPT-Plus-Abo besteht, ist das keine Agentur. Das ist ein Dienstleister der das Gleiche macht was dein Team auch selber machen könnte. Echte Agenturen haben Meinungen zu Modellen, zu Frameworks, zu Integration, zu Monitoring. Sie haben einen Stack. Sie haben Erfahrungen, welches Modell welche Aufgabe besser löst.

Alles-Könner. "Wir machen KI-Strategie, KI-Schulung, KI-Implementierung, Change-Management, eigene Modelle, PIM-Integration, Chatbot, AI-Agenten, Data-Engineering, MLOps." Bei fünf bis fünfzehn Leuten ist das unrealistisch. Entweder sie machen nichts davon wirklich gut, oder sie meinen mit jedem Begriff etwas anderes als der Markt.

Consultants ohne Produktions-Referenz. Eine Agentur die nur PowerPoint liefert, aber nie etwas in Produktion gebracht hat, kann dir keine ehrliche Auskunft geben, was technisch funktioniert. Strategen die nie gebaut haben, überschätzen systematisch, wie einfach die Umsetzung wird. Fragt konkret nach einem lauffähigen Produkt, das sie selbst oder mit Partnern gebaut haben.

DSGVO-Schwurbeln. Wenn auf die Frage "wie steht ihr zu DSGVO" Sätze kommen wie "wir achten natürlich auf Datenschutz" oder "das ist ein wichtiges Thema für uns", aber keine konkreten Aussagen zu Modell-Hosting, AVV, Subprocessorn oder Daten-Residency folgen, dann haben sie sich nicht damit beschäftigt. In der EU mit KI zu arbeiten ohne eine klare Datenschutz-Haltung ist fahrlässig. Für die Agentur und für dich.

Versprechen ohne Kosten-Offenheit. "Wir bauen euch einen Agenten der 80% eurer Tickets löst." Was kostet das? "Das hängt ab..." Wenn du keine Zahlen bekommst, weder Bandbreite noch Aufwand, fehlt Engineering-Erfahrung. Gute Agenturen kennen ihren Umsetzungsaufwand. Sie sagen "Discovery zwei Wochen, 8.000+ EUR. Erste Umsetzung MVP vier bis acht Wochen, 30.000+ EUR. Weitere Ausbaustufen nach Effekt."


So läuft ein gutes Erstgespräch

Das Erstgespräch entscheidet mehr als jedes Partner-Level, mehr als jede Case Study. Hier merkst du ob die Agentur dich versteht oder ob sie verkaufen will.

Was du fragst. Stell Fragen die Engineering-Erfahrung entlarven, nicht nur Marketing. "Welches Modell würdet ihr für Use Case X nehmen und warum?" "Wie geht ihr mit Halluzinationen um, wenn der Agent echte Aktionen ausführt?" "Was passiert, wenn das Modell-Upgrade eure Prompts bricht?" "Zeigt mir einen Agenten, den ihr produktiv betreibt, und erklärt mir warum ihr euch für dieses Framework entschieden habt." Bei Typ A kommen andere Fragen hoch: "Wie messt ihr den Erfolg eines KI-Workshops?" "Wie geht ihr mit Mitarbeitern um, die Angst um ihren Job haben?"

Was die Agentur fragen sollte. Das ist mindestens so wichtig. Eine gute Agentur fragt nach deinem Geschäftsmodell, nicht nach deinem Tool-Wunsch. Sie fragt nach deiner Daten-Reife, nicht nach deinem KI-Budget. Sie fragt warum jetzt, warum genau diese Aufgabe, was passiert wenn ihr es nicht macht. Sie stellt unbequeme Fragen wie "seid ihr sicher dass das der richtige Use Case ist?" oder "warum glaubt ihr dass KI hier schneller ist als ein sauberer Prozess?". Wer nie zurückfragt, baut dir was du sagst. Nicht was du brauchst.

Was du dabei haben solltest. Drei Dinge reichen. Ein Business-Ziel in einem Satz ("Wir wollen die Zeit die unser Service-Team auf wiederkehrende Fragen verbringt halbieren"). Eine ehrliche Einschätzung eurer Daten-Reife ("Produktdaten liegen im PIM, Kundendaten im Shop, beides nicht verknüpft"). Eine Budget-Range ("30.000+ EUR für das erste sichtbare Ergebnis in drei bis sechs Monaten, danach abhängig vom Effekt mehr"). Wer mit diesen drei Punkten ins Gespräch geht, bekommt in einer Stunde eine qualifizierte Einschätzung. Wer ohne sie kommt, bekommt ein freundliches Verkaufsgespräch und muss danach selbst sortieren was davon stimmt.


Wo dasistweb steht

Um es ehrlich zu sagen. Wir sind Typ B. Wir sind Engineers, seit 2011 bauen wir E-Commerce-Systeme, heute integrieren wir KI direkt in die Systeme die wir sowieso kennen: Shopware, Shopify, Commercetools, Storyblok, eigene Middleware, SAP- und PIM-Anbindungen. Seit die ersten produktiv nutzbaren LLMs da waren, bauen wir damit. Wir haben Meinungen zu Claude vs. GPT, zu MCP, zu Agent-Frameworks, zu Self-Hosting. Mehr zu unserer Herangehensweise steht auf der Seite KI-Implementierung.

Wir passen für Unternehmen die KI produktiv in Commerce-, ERP- oder Content-Systeme bringen wollen, die DSGVO ernst nehmen, und die jemanden brauchen der beide Welten kennt. Unser Sweet Spot sind Kunden im Bereich 5 bis 150 Mio EUR GMV, durchschnittliche Kundenbeziehung über fünf Jahre, 25 Spezialist:innen im Team, davon 80 Prozent Seniors. Wir sind Shopware-Partner seit 2012, aktuell Gold-Level, und wir waren SW6 Co-Entwickler vor dem offiziellen Launch. Das heißt: Wir kennen die Systeme, in die wir KI einbauen, auf Code-Ebene.

Wir sind NICHT der richtige Partner, wenn du eine reine Change-Management-Beratung brauchst, wenn du einen großen Team-Workshop für Führungskräfte suchst oder wenn du eine zweijährige Transformation mit Widerstandsarbeit begleitet haben willst. Dafür gibt es gute spezialisierte Beratungen, und wir empfehlen sie gerne. Wenn bei dir beides ansteht, Strategie plus Engineering, machen wir den Engineering-Teil gut und empfehlen für die Strategie einen Partner der das besser kann als wir.


Häufig gestellte Fragen

Was kostet eine KI-Agentur?
Das hängt vom Typ und Scope ab. Ein Workshop bei einer Typ-A-Agentur startet bei 3.000+ EUR pro Tag. Ein Discovery plus MVP-Bau bei einer Typ-B-Agentur startet bei 30.000+ EUR, tiefe Integrationen mit ERP oder PIM schnell 80.000+ EUR. Laufender Betrieb und Weiterentwicklung sind separat. Wer ohne Discovery Fixpreise nennt, schätzt ins Blaue oder baut zu eng.
Wie lange dauert ein KI-Projekt?
Eine Strategiephase bei Typ A dauert üblicherweise vier bis zwölf Wochen. Ein erstes produktives MVP bei Typ B dauert zwei bis vier Monate, je nach Integrationstiefe. Tiefe Integrationen mit eigener Infrastruktur oder Self-Hosted-Modellen können sechs bis zwölf Monate laufen. Entscheidend ist, dass nach spätestens drei Monaten etwas sichtbar Produktives läuft, auch wenn es klein ist.
Was ist der Unterschied zwischen KI-Berater und KI-Agentur?
Ein KI-Berater ist meistens eine Einzelperson oder ein kleines Team, das Strategie-Arbeit macht und keine Umsetzung anbietet. Eine KI-Agentur hat ein Team mit verschiedenen Rollen: Strategen, Developer, Designer, je nach Typ. Der Berater ist flexibler und günstiger, aber du musst danach selbst einen Umsetzer finden. Die Agentur ist teurer, aber liefert durchgängig.
Gibt es KI-Agenturen speziell für E-Commerce?
Ja, und das ist für Commerce-Projekte relevant. Eine KI-Agentur die Produktdaten, PIM-Struktur, Shop-APIs und Checkout-Prozesse versteht, bringt dich deutlich schneller voran als eine generische KI-Agentur, die das alles erst lernen muss. Wir selbst sind so ein Fall: KI plus vierzehn Jahre Commerce-Historie.
Was ist der Unterschied zwischen einem Chatbot und einem AI-Agenten?
Ein Chatbot antwortet auf Fragen im Chatfenster, meistens auf Basis einer Wissensdatenbank. Ein AI-Agent führt Aktionen aus. Er kann auf Systeme zugreifen, mehrstufige Aufgaben übernehmen, Daten lesen und schreiben, andere Tools aufrufen. Agenten sind der nächste Schritt nach reinen Chatbots. Für Commerce-Szenarien wie Retouren-Bearbeitung, Ticket-Triage oder Produktdatenpflege sind Agenten die richtige Wahl.
Brauche ich eine KI-Agentur mit Branchen-Erfahrung?
Je spezifischer dein Fall, desto wichtiger. Für generische Workflows (Textgenerierung, Meeting-Protokolle, Recherche) reicht Methoden-Erfahrung. Sobald es um Daten in deinem PIM, Prozesse in deinem ERP oder regulatorische Themen in deiner Branche geht, spart Branchen-Erfahrung dir Monate.

Klingt nach eurem Projekt?

30 Minuten Erstgespräch. Kostenlos, ehrlich, ohne Verkaufsdruck. Wir hören zu, stellen die richtigen Fragen und geben eine klare Einschätzung.

Termin vereinbaren

Erst Klarheit.
Dann Entscheidung.

30 Minuten Erstgespräch. Wir hören zu, stellen die richtigen Fragen und geben eine klare Einschätzung.

Termin vereinbaren

Kostenlos & unverbindlich · 30 Min.