Zum Hauptinhalt springen
Zurück zu Wissen

KI und Datenqualität: Das unterschätzte Fundament

Martin WeinmayrVonMartin Weinmayr·

ChatGPT kann dir beim Schreiben helfen. Moderne KI-Tools können Bilder generieren und Kategorisierung automatisieren. Aber in deinem E-Commerce-Shop?

KI scheitert schneller als du denkst. Der Grund ist nicht die Technologie. Der Grund sind deine Daten.

Wir sehen das regelmäßig: Ein Shop investiert 50.000+ EUR in ein KI-Tool für Produktempfehlungen. Nach 3 Monaten merkt man: 30% der Produkte haben keine Beschreibung, 40% der Kategorien sind falsch zugeordnet, die Preisdaten sind 6 Monate veraltet. Und die KI gibt Mist raus.

Das ist kein KI-Problem. Das ist ein Datenproblem.

Inhalt

  1. Warum KI ohne saubere Daten scheitert
  2. Welche Daten brauchst du wirklich?
  3. Data Quality: Von Theorie zu Praxis
  4. Datenquellen synchronisieren
  5. KI-Projekte richtig starten
  6. Was ändert sich konkret für dich

Warum KI ohne saubere Daten scheitert

Das ist auch für Nicht-Techniker verständlich: KI funktioniert so ähnlich wie du lernst. Wenn du lernen sollst "was sind gute Sommerschuhe", und 30% der Trainingsdaten sind irgendwelche Winterstiefel, dann lernst du falsch.

Bei deinen Produktdaten ist das genauso. KI-Modelle für Empfehlung, Preisoptimierung oder Auto-Tagging lernen von deinen Daten. Wenn die Daten falsch, unvollständig oder widersprüchlich sind, dann ist die KI auch falsch.

Typische Probleme:

Unvollständige Produktbeschreibung. KI-Tools brauchen Text um zu verstehen was dein Produkt ist. "T-Shirt rot" ist zu dünn. "Baumwoll-T-Shirt rot, atmungsaktiv, waschen bis 40°C, Größen XS-3XL" ist nutzbar.

Widersprüchliche Kategorisierung. Ein Produkt kann in 3 verschiedenen Shop-Bereichen unter 3 verschiedenen Kategorien auftauchen. KI wird verwirrt.

Veraltete Preise & Lagerbestände. Wenn KI lernt dass dein Bestseller-Produkt 500 EUR kostet, aber eigentlich kostet es 50 EUR, dann lernt es das falsche Muster.

Fehlende oder falsche Attribute. Farbe, Größe, Material, Zielgruppe. Ein Produkt braucht diese Attribute strukturiert, nicht irgendwo im Text versteckt.

Inkonsistente Datenformate. Manche Preise haben Komma, manche Punkt. Manche Größen "M", manche "Mittel". KI-Modelle reagieren sehr sensibel darauf.

Bei dasistweb sehen wir das täglich: 80% der schlechten KI-Ergebnisse sind Datenprobleme, keine KI-Probleme.

Welche Daten brauchst du wirklich?

Nicht alle Datenqualität ist gleich wichtig. Es kommt auf deinen Use Case an.

Für Produktempfehlungen brauchst du:

  • Produktbeschreibung (mindestens 200 Zeichen)
  • Kategorie (eindeutig, nicht mehrfach)
  • Tags/Attribute (Größe, Farbe, Material)
  • Preis
  • Aktualität (Daten nicht älter als 1 Woche)

Für Preisoptimierung brauchst du:

  • SKU/EAN (eindeutig und korrekt)
  • Preis (korrekt, aktuell)
  • Lagermenge (real, nicht geschätzt)
  • Kosten (deine Einkaufspreise, wenn möglich)
  • Konkurrenz-Preise (von Scraping oder Feed)

Für Auto-Tagging/Kategorisierung brauchst du:

  • Produktbeschreibung (ausführlich)
  • Bestehende Tags (als Training für die KI)
  • Historische Daten (wie wurde das Produkt früher kategorisiert)

Das Problem: 90% der Shops haben nicht mal diese Basisdaten sauber. Du musst also zuerst aufräumen bevor du KI implementierst.

Data Quality: Von Theorie zu Praxis

Data Quality Management klingt wie ein Buzzword. In der Praxis heißt es: Wissen wo deine Daten kaputt sind, einen Plan haben das zu fixen, und dann regelmäßig monitoren.

Phase 1: Audit. Wir analysieren deine Daten. Wo sind Lücken? Wo sind Duplikate? Wo sind Widersprüche? Für einen 5.000-Produkt-Shop dauert das 1-2 Tage.

Phase 2: Priorisierung. Nicht alles ist gleich wichtig. Wenn 100 deiner Top-50-Produkte keine Beschreibung haben, das ist kritisch. Wenn 5.000 Produkte in der "Sonstige" Kategorie sind, das ist auch kritisch.

Phase 3: Bereinigung. Das ist Arbeit. Manche Probleme löst du mit Scripts (Duplikate löschen, Formate standardisieren). Manche brauchst du manuell (Kategorie-Review, Beschreibungen schreiben).

Phase 4: Automation für die Zukunft. Ohne Automation läufst du hinterher. Du brauchst Regeln:

  • Neue Produkte ohne Beschreibung: Automatisch Erinnerung an Marketing
  • Preise nicht aktualisiert seit 30 Tagen: Alert
  • Kategorien mit weniger als 10 Produkten: Review

Datenquellen synchronisieren

Bei den meisten Shops sind Daten verstreut:

  • PIM (Product Information Management): Die Quelle der Wahrheit für Produktinformation
  • ERP-System: Preise, Lagerbestände, SKUs
  • Marketplace-Feeds: Amazon, eBay, etc. mit ihren jeweils eigenen Datenformaten
  • Content-System (CMS): Produktbeschreibungen, Marketing-Texte
  • Shop-System (Shopware, Shopify): Was aktuell online ist

Jedes dieser Systeme hat eigene Datenqualitäts-Standards. Die Kunst ist: Eine Quelle der Wahrheit definieren, Rest synchronisieren.

Typisch:

  • PIM ist die Quelle für Produktstruktur, Attribute, Beschreibung
  • ERP ist Quelle für Preise und Lagerbestände
  • Shop-System synchronisiert sich regelmäßig aus beiden

Ohne das bist du im Chaos. Bei dasistweb helfen wir Shops diese Architektur aufzubauen. Das kostet ab 10.000+ EUR je nach Komplexität, spart dir aber danach tausende EUR pro Monat.

Unser Standard-Ansatz: One system of truth, automatisierte Syncs mit Validierung und Fehlerbehandlung. Nicht "wir exportieren Excel und importieren manuell".

KI-Projekte richtig starten

Wenn deine Daten sauber sind, dann kannst du KI sinnvoll nutzen.

So gehen wir vor:

Schritt 1: Audit (1 Woche). Datenqualität prüfen. Roadmap für Bereinigung schreiben.

Schritt 2: Daten-Cleanup (2 bis 8 Wochen). Je nach Größe und Komplexität. Das ist der längste Schritt und oft unterschätzt.

Schritt 3: KI-Tool auswählen (1 bis 2 Wochen). Gibt es für dein Problem schon eine Lösung? (Meist ja.) Oder musst du Custom trainieren?

Schritt 4: Pilot (2 bis 4 Wochen). Nicht gleich alle Produkte. Erst ein Subset testen. Ergebnisse validieren.

Schritt 5: Scale (4 bis 8 Wochen). Auf alle Produkte ausrollen. Monitoring einbauen.

Schritt 6: Automation (laufend). Regelmäßig neue Daten einspeisen, Modelle aktualisieren.

Der häufigste Fehler: "Wir kaufen ein KI-Tool und deployen es." Das geht schief. Garantiert.

Was ändert sich konkret für dich

Konkretes Beispiel aus unserer Praxis:

Shop mit 8.000 Produkten. Will Produktempfehlungen verbessern.

Status Quo:

  • 60% der Produkte haben keine oder sehr kurze Beschreibung
  • Kategorisierung ist chaotisch (1 Produkt in 5 Kategorien)
  • Lagerbestände sind 2 Wochen veraltet
  • Preise manchmal falsch (Copy-Paste-Fehler)

Investition in Datenqualität:

  • Audit: ab 2.000+ EUR
  • Kategorisierung-Cleanup: ab 8.000+ EUR (mit Tool-Unterstützung)
  • Beschreibungs-Standardisierung: ab 5.000+ EUR (Template + Automation)
  • Integration ERP-Shop: ab 15.000+ EUR
  • Monitoring-Setup: ab 3.000+ EUR
  • Gesamt: ab 33.000+ EUR, 3 bis 4 Monate

Dann KI-Empfehlungs-Tool:

  • Setup & Training: ab 5.000+ EUR einmalig
  • Laufende Lizenz: abhängig vom Anbieter (zum aktuellen Zeitpunkt prüfen)

Resultat:

  • Empfehlungs-Conversion steigt von 1% auf 3.2%
  • Cart-Value steigt um durchschnittlich 12 EUR
  • Das Tool spart sich selbst ein in 4 Monaten

Das ist keine KI-Magie. Das ist: Saubere Daten führen zu besseren Ergebnissen.

Fazit: Datenqualität ist nicht sexy, aber entscheidend

KI ist sexy. "Wir nutzen Machine Learning für Preisoptimierung!" klingt gut auf LinkedIn. "Wir haben unser PIM mit unserem ERP integriert und unsere Produktbeschreibungen standardisiert" klingt langweilig.

Aber: Der zweite Ansatz funktioniert. Der erste nicht.

Die gute Nachricht: Datenqualität ist ein lösbares Problem. Du brauchst nicht die neueste KI. Du brauchst erst mal deine Basis sauber. Das ist dann deine Grundlage für alle KI-Tools der Zukunft.

Häufig gestellte Fragen

Was kann ki datenqualitaet wirklich in meinem E-Commerce leisten?
KI hilft bei Produktbeschreibungen, Kundenservice, Datenanalytik und Personalisierung. Am besten funktioniert sie bei repetitiven Aufgaben mit klaren Regeln.
Wie lange dauert die Einführung von KI in meinem Shop?
Ein Chatbot 2-4 Wochen, automatische Produktbeschreibungen 1-2 Wochen, komplexere Lösungen 4-8 Wochen. Die meiste Zeit geht in Testing.
Kostet KI viel mehr als manuelle Prozesse?
Nicht unbedingt. KI spart Zeit bei hohem Volumen. Bei kleinem Shop lohnt sich der Setup-Aufwand oft erst ab 500+ Produkten oder vielen Kundeninteraktionen.
Wie sicherst du die Qualität bei KI-generierten Inhalten?
Mit Stichproben-Review, klaren Prompts und manchmal mit Hybrid-Ansatz (KI generiert, Mensch kontrolliert). 100% Qualität garantiert dir nur manuelle Arbeit.
Welche KI-Tools sind für E-Commerce am besten?
Das hängt vom Use-Case ab. ChatGPT für Text, spezialisierte Tools für Bilder oder Daten. Für deinen eigenen Shop brauchst du oft mehrere Tools kombiniert.

Klingt nach eurem Projekt?

30 Minuten Erstgespräch. Kostenlos, ehrlich, ohne Verkaufsdruck. Wir hören zu, stellen die richtigen Fragen und geben eine klare Einschätzung.

Termin vereinbaren

Erst Klarheit.
Dann Entscheidung.

30 Minuten Erstgespräch. Wir hören zu, stellen die richtigen Fragen und geben eine klare Einschätzung.

Termin vereinbaren

Kostenlos & unverbindlich · 30 Min.