Beim grenzüberschreitenden E-Commerce kommt es auf saubere Adressdaten an

Die Online-Händler in Deutschland agieren zunehmend international. Laut der Händlerbefragung „Cross Border Sale" des Bundesverbandes des Deutschen Versandhandels (bvh) nehmen nur zehn Prozent der Internet-Shops keine Aufträge aus dem Ausland an. 89 Prozent verkaufen bereits in die europäischen Nachbarländer oder planen dies in absehbarer Zeit. Wichtig ist dabei die Anpassung der Unternehmensstrategie an das jeweilige Zielland und auch bei den Adressdaten ist Einiges zu beachten.
Neben rechtlichen Unsicherheiten, Schwierigkeiten beim Anbieten eines Kundenservices in der jeweiligen Sprache, Problemen bei der Zahlungsabwicklung und der Geltendmachung offener Forderungen zählt auch der mitunter komplizierte Versand in die Nachbarländer zu den größten Hindernissen, warum Online-Shops nicht noch stärker die Chancen für den grenzenlosen Handel nutzen. Denn aktiv betreiben ihn nur 57 Prozent der für die bvh-Studie befragten E-Commerce-Firmen.
Datenqualität berührt viele Aspekte
Beim Überschreiten der Landesgrenzen spielen unweigerlich etliche Aspekte der Daten- und Informationsqualität eine Rolle. Und diese können nicht einfach mit landesspezifischen Lösungen, wie etwa in Deutschland mit dem Adressänderungsservice der Deutschen Post, abgedeckt werden. Handelsunternehmen müssen heute eine Menge Geld investieren, um Aufgaben wie einheitliche Sicht auf die Kundendaten, Datenintegration, Betrugsverhinderung, Minimierung der operativen Risiken und Einhaltung von Compliance-Bestimmungen zu bewältigen. Aber wie können diese Ausgaben auch im Falle von grenzüberschreitenden Geschäften geschützt werden?
Andere Länder, andere (Namens-) Sitten
Viele Firmen vergessen bei der Internationalisierung, dass sie es im Ausland mit einer großen Vielfalt an Sprachen, Namen, Adress-Konventionen und anderen Gewohnheiten und Regeln zu tun haben, die nur im kulturellen Kontext des jeweiligen Landes zu verstehen sind und deren Bedeutung abhängig von semantischen sowie syntaktischen Zusammenhängen ist. Wussten Sie zum Beispiel, dass die Namen Haddad, Hernández, Le Fèvre, Smid, Ferreiro, Schmidt, Kuznetsov und Kovács alle das Gleiche bedeuten? Auf Deutsch heißt der Name „Schmidt“, kommt aber u. a. auch als „Schmied“, „Schmitt“ oder „Schmiet“ vor. Ein ähnliches Problem stellen Orts- und Ländernamen dar. Je nach Sprachraum wird derselbe Ortsname anders geschrieben und ausgesprochen.
Aber in den einzelnen Ländern existieren noch viel mehr Besonderheiten. Etwa die Nutzung von Patronymen in Island und Russland. Patronyme sind Namensteile, die auf den Vornamen des Vaters zurückgeführt werden können. Ein Beispiel: In Russland heißen Sohn und Tochter „Ivan Golubevs“ dann etwa „Sergei Ivanovich Golubev” und „Olga Ivanovna Golubeva“. Bemerkenswert hierbei ist auch, dass der weibliche Nachname sich ändert: Golubev wird Golubeva. Aber auch die Präfix-Sortierung ist eine Spezialität. Wenn Sie den Namen „Van Dam“ suchen, dann werden Sie ihn in Großbritannien unter dem Buchstaben „V“ finden. In den Niederlanden wird dieser Name unter den Buchstaben „D“ sortiert. Das Gleiche gilt für die Mehrdeutigkeit von Namensbestandteilen. „London“ ist die Hauptstadt Großbritanniens, aber auch ein Nachname.
Vielfältige Adress-Bestandteile in Europa
Die größte Herausforderung für den grenzüberschreitenden Online-Handel stellt aber die intelligente Interpretation und Verarbeitung von Postadressen in den einzelnen europäischen Ländern dar. Die Vielfalt der Adressbestandteile und die Unterschiede bei deren Anordnung und Formatierung sind wirklich außerordentlich. In Frankreich z. B. gibt es zwar mit der Norm AFNOR XP Z 10-011 eine verbindliche Regelung. Sie wurde von der „Association française de normalisation“ (AFNOR) festgelegt und definiert die einheitliche Schreibweise von Postadressen. Doch in der Praxis ist das leider nicht so klar. Auch wenn der „Service national de l’adresse (SNA)“ Referenzdatensätze veröffentlicht hat, an die man sich nur zu halten braucht und seine eigenen Empfängerdaten für Pakete nach Frankreich überprüfen kann.
Das ist auch dringend notwendig, denn z. B. unterscheidet sich das Postleitzahlensystem in Frankreich sehr stark von dem in anderen Ländern wie etwa Deutschland. So teilen sich verschiedene Standorte dieselbe Postleitzahl. Außerdem bietet die staatliche Post „La Poste“ Cedex (Courrier d’Entreprise à Distribution Exceptionnelle) in Frankreich einen Lieferservice für Unternehmen, deren Anschrift nicht unbedingt in der postalisch gleichen Stadt wie der Empfänger einer Sendung liegen muss.
Hier ein Beispiel:
Société Dupont SA
1 AVENUE DE LA GARE
01702 ST MAURICE DE BEYNOST
Diese Postleitzahl steht für eine Cedex-Nummer. Denn die Postleitzahl von ST MAURICE DE BEYNOST ist eigentlich 01700. Die SNA-Referenzdatenbank erwartet in diesem Fall eine Änderung, denn Cedex-Dienst wird über die Stadt Miribel abgewickelt.
Die richtige Adresse, bei der das Paket auch tatsächlich ohne Probleme zugestellt wird, sieht also so aus:
Société Dupont SA
1 AVENUE DE LA GARE
ST MAURICE DE BEYNOST
01702 MIRIBEL CEDEX
Ein weiteres Beispiel:
M. Legendre Pierre
La Butte
50540 CHALANDREY
Die SNA-Referenzdatenbank schreibt hier Folgendes vor:
M. Legendre Pierre
LA BUTTE
MONTGOTHIER
50540 ISIGNY LE BUAT
Chalandrey ist ein Standort, der zur Poststelle Isigny le Buat gehört und dieselbe Postleitzahl nutzt. Aber La Butte ist keinesfalls ein Teil von Chalandrey, sondern von Montgothier – mit derselben Postleitzahl wie Isigny le Buat.
CHALANDREY, LA MANCELLIERE, LE MESNIL BOEUFS, LE MESNIL THEBAULT, LES BIARDS, MONTGOTHIER, MONTIGNY, NAFTEL, VEZINS. Alle diese Orte haben dieselbe Postleitzahl 50540 mit ISIGNY LE BUAT als zuständigem Postamt. Und alle diese Ortschaften haben natürlich ihre eigenen Durchgangsstraßen und Räumlichkeiten, die es zu überprüfen und berücksichtigen gilt. Denn sonst wird aus einem hoffnungsfroh nach Frankreich verschickten Paket sehr schnell eine teuere Retoure. Und übrigens: Es gibt in Frankreich auch eine Stadt mit Namen Chalandray, die man über die Postleitzahl 86190 erreicht und die ein eigenes Postamt hat.
Menschliche Intelligenz ist nötig
An diesen beiden Beispielen ist sehr schön zu sehen, dass die Verarbeitung von Anschriften in Frankreich sehr kompliziert sein kann. Um Kosten zu reduzieren und Rückläufer zu vermeiden, sollte eine vorherige Adressvalidierung eine Selbstverständlichkeit sein. Dazu ist eine von der SNA zertifizierte Software erforderlich, die computergestützte Schlussfolgerungen mit der menschlichen Intelligenz kombiniert. Denn die üblichen mathematischen Prozeduren zur Dublettenerkennung und Adressvalidierung stoßen bei europaweiten Kundendatenbanken schnell an ihre Grenzen.
Um im grenzüberschreitenden Online-Handel „saubere“ Adressdaten einsetzen zu können, ist länderspezifisches Wissen gefragt. Es muss z. B. nationale Besonderheiten der Adressierung, Namen und deren Schreibweisen berücksichtigen. Neben den herkömmlichen mathematischen Verfahren kommen deshalb in der Datenqualitätssoftware zunehmend auch wissensbasierte Methoden zum Einsatz, die Einsichten der Computerlinguistik zur Spracherkennung und -synthese anwenden. Im Ergebnis wird eine deutlich höhere Erkennungsquote von Dubletten erreicht – über Länder- und Sprachgrenzen hinweg.Denn neben der richtigen Schreibweise von Adressen spielen beim Grenzübertritt noch eine Reihe weiterer Aspekte der Daten- und Informationsqualität eine Rolle. Wie etwa die verschiedenen Sprachen, Zeichensätze, Datenschutzregelungen, Schreibweisen bei Datum und Währungen. Unternehmen, die trotz dieser Herausforderungen internationale Adressdaten erfolgreich für die Abwicklung ihres Geschäfts einsetzen wollen, sollten Namensbesonderheiten und Adress-Konventionen im Ausland genauso beachten wie die dortige Gesetzgebung, geschäftliche Gepflogenheiten, kulturelle Unterschiede und andere Verbrauchergewohnheiten.
Erfolgsfaktor Datenmanagement
Der Stellenwert der Datenqualität hat sich verändert. Heute ist der Wert von Daten auf breiter Front anerkannt und nicht länger ausschließlich auf Namens- und Adressdaten begrenzt. Darüber hinaus ist die Datenqualität nicht länger ein bloßes IT-Thema, sondern gewinnt mehr und mehr Bedeutung auch als wichtiges Geschäftsthema. Die Datenqualität ist ein entscheidender Erfolgsfaktor bei großen CRM-, ERP- oder BI-Projekten, die substantielle Investitionen verlangen.
Daten bilden den Kern des Informationssystems jedes Unternehmens, der alle Geschäftsprozesse berührt. Aus diesem Grund haben fehlerhafte Daten negative Auswirkungen auf diese Prozesse und infolgedessen auch auf die Geschäftsergebnisse. Human Inference forscht seit über 25 Jahren auf diesem Gebiet und zählt mit dieser Erfahrung zu den führenden Anbietern im Bereich Datenqualitätslösungen. In ihrem „Magic Quadrant for Data Quality Tools 2012″ attestieren die unabhängigen Analysten von Gartner dem niederländischen Softwarehaus eine starke Fokussierung auf Europa:
„Die Kunden schätzen an der Human Inference HIquality-Suite besonders die große Expertise über sprachliche und kulturelle Eigenheiten von Daten aus ganz Europa.“
Data Quality Lifecycle
Der Fokus dieser Produktfamilie liegt dabei auf qualitativ hochwertigen Lösungen, die für große Datenbanken und unternehmenskritische Systeme entwickelt wurden. Sie basieren auf natürlicher Sprachverarbeitung, enthalten eine breite Wissensbasis und unterstützen den kompletten Data Quality Life Cycle mit den Teilprozessen Data Profiling, Data Cleansing und Monitoring. Das Data Profiling gibt nicht nur Aufschluss darüber, welche Datentypen in einer Kundendatenbank vorhanden sind, sondern lässt auch erkennen, wie valide und gebräuchlich diese Daten sind. Beim Data Cleansing werden die erkannten Probleme durch Anwendung verschiedener Algorithmen direkt behoben.
Um dem ganzheitlichen Ansatz zur Qualitätssteigerung Rechnung zu tragen, bedarf es schließlich einer kontinuierlichen Überprüfung der Konsistenz, Korrektheit und Zuverlässigkeit der Daten. Neue Daten werden deshalb im Teilprozess „Monitoring“ vor der Speicherung in den operativen und analytischen Systemen überprüft. Und in bestimmten Zeitabständen findet eine Prüfung der gesamten Kundendaten statt.
Mit Hilfe dieser Werkzeuge kann auch der Prozess der Datenintegration zum Großteil automatisiert werden. Bei der Zusammenführung gleicher Datenbestände aus unterschiedlichen Datenquellen müssen diese Datensätze zunächst identifiziert werden. Dann ist zu entscheiden, welche Bestandteile der Dubletten in den bereinigten Datenbestand übernommen werden sollen. Denn ganz gleich, woher die Daten stammen – ob von CRM-Anwendungen, von Call-Center-Agents oder externen Datenlieferanten – diese Quellen weisen regelmäßig große Unterschiede in Inhalt, Format und ihrer syntaktischen sowie semantischen Gültigkeit auf. Dazu können die Daten noch unvollständig, ungenau oder veraltet sein oder in anderer Weise abweichen.
Das First-Time-Right-Prinzip
Und es besteht zudem die Gefahr der ungewollten mehrfachen Aufnahme. Ziel ist deshalb meist nicht eine sofortige Komplettbereinigung der vorhandenen Kundendaten, sondern vor allem eine stetige Verbesserung und die Vermeidung von Dubletten direkt bei der Datenerfassung nach dem Prinzip, beim ersten Mal gleich alles richtig zu machen. Zusätzlich werden die Daten – falls nötig – auch mit Hilfe der HIquality-Suite direkt korrigiert, vervollständigt und standardisiert.
Und da die Lösungen für die Sicherung der Datenqualität und das Master Data Management (MDM) immer enger miteinander verschmelzen, konzentriert sich Human Inference zunehmend auf das Kunden-Stammdaten-Management. Es stellt Unternehmen zu jedem Zeitpunkt sämtliche für den optimalen und persönlichen Kundenservice benötigten Informationen – z. B. aus CRM-Systemen oder Social-Media-Netzwerken – zur Verfügung und erlaubt so eine einheitliche Kundensicht.
Um im grenzüberschreitenden Online-Handel „saubere“ Adressdaten einsetzen zu können, ist länderspezifisches Wissen gefragt. Es muss z. B. nationale Besonderheiten, Adressierungen, Namen und deren Schreibweisen berücksichtigen.

Infobox
Korrekte Adress- und Kundendaten sichern den geschäftlichen Erfolg im Cross Border E-Commerce. Laut Studien wünschen sich 88 % der Verantwortlichen in Unternehmen mehr Aufmerksamkeit für das Thema Datenqualität.
Autor

Holger Wandt
Holger Wandt ist seit 1991 für das niederländische Softwareunternehmen Human Inference tätig. In seiner heutigen Position als Principal Advisor ist er verantwortlich für alle wissensbezogenen Fragen zur Datenqualität sowie alle Aspekte der Standardisierung von Namen und Adressen auf nationaler und internationaler Ebene. Darüber hinaus ist er Dozent und Studienleiter an mehreren Universitäten.