Back to top

Betrugserkennung über Big Data – Fallbeispiel aus der Versicherungsbranche

Big Data und Suche im Härtetest – Blog und Video

Wie hat es unser Kunde geschafft, über ein Big Data-Framework Betrugsfälle in der Versicherungsbranche in Höhe von mehr als 100 Millionen US-Dollar aufzudecken? Und das in einem Bruchteil der Zeit, die der traditionelle Weg über komplexe SQL-Abfragen in Anspruch genommen hätte? 

Das wird im folgenden Text vorgestellt. 

In hochgradig kontrollierten Bereichen wie dem Finanzsektor, dem Gesundheitswesen, der Versicherungsbranche, dem Einzelhandel oder Einrichtungen der sozialen Sicherung ist es von essenzieller Bedeutung, gegen Betrugsfälle vorzubeugen, da hier eine Vielzahl von Gesetzesbestimmungen, Complianceanforderungen, Risikomanagement-Maßnahmen und finanziellen Konsequenzen anfallen. Die Errungenschaften der modernen Technologie haben leider auch fortgeschrittenere Betrugsmöglichkeiten mit sich gebracht. Gleichzeitig bringt der technologische Fortschritt aber auch intelligentere Ansätze an die Betrugserkennung mit sich. In einer Welt, in der alle Transaktionen und Dokumente auf die eine oder andere Weise digital aufgezeichnet werden, gibt es immer Belege, die dem Ermittler bei seinem Kampf gegen Betrugsfälle helfen. Die Frage ist daher nur: Wie kann man diese Belege schnell und leicht auffinden?

 

Enorme Datenmengen, Legacy Data Warehouses und SQL-Abfragen = Verzögerungen und Kopfschmerzen

Nehmen wir unseren Kunden aus der Versicherungsbranche als Beispiel.

Traditionell mussten Mitarbeiter der Betrugserkennung erst Datenanalysten bitten, SQL-Abfragen in einem Data Warehouse auszuführen, das enorme Mengen Informationen wie Ansprüche und Rechnungen enthält. Allein durch Volumen, Geschwindigkeit und Vielzahl der Daten im Warehouse kann der Prozess Wochen oder Monate dauern, bis genug Beweismittel für ein Gerichtsverfahren gesammelt sind. Und wie bei jedem anderen Unternehmen, je länger es dauert, den Betrug aufzudecken, desto höher die Verluste.

 

Neue Sichtweisen auf Techniken der Betrugserkennung über Predictive Analytics und maschinelle Lernverfahren

Wenn man die enormen Datenmengen bedenkt, die Ermittler durchsuchen müssen, um Betrugsmuster zu erkennen, bietet sich eine Architektur, die Big Data und Suchfunktionen enthält, als sinnvollster Ansatz an. 

  • Öffentlich zugängliche Daten, wie Informationen des Providers, Codes für Gesundheitsprodukte usw. werden angesammelt und im Big Data-Framework verarbeitet. Dieses nimmt eine Denormalisierung in massivem Umfang vor, um die Daten in mehrere Tabellen und Felder aufzuteilen.
  • Die verarbeiteten Daten werden dann in die Suchmaschine geladen.
  • Methoden der maschinellen Lernverfahren und Predictive Analytics erstellen dann Warnhinweise und erkennen proaktiv verdächtige Muster.
  • Eine grafische Benutzeroberfläche, basierend auf Suchfunktionen, bietet den Ermittlern Möglichkeiten der Analyse und Dokumentation von Beweismitteln.

Die Big Data-Architektur ermöglicht dem Versicherer damit einen skalierbaren, schnelleren und akkurateren Ansatz an die Betrugserkennung. Da das System tatsächlich jeden verfügbaren Datensatz verarbeitet und analysiert können die Ermittler auch zuversichtlich sein, dass ihre Erkenntnisse zutreffend sind. Unserer Meinung nach deutlich besser als reine Stichproben und Vermutungen!

 

... und ein verbessertes Analyse-Framework, das verschiedenen Aspekten des Unternehmens hilft

Außer in der Versicherungsbranche kann dieses Big Data-Framework auch für alle anderen Arten von Log-Daten verwendet werden, um die Sicherheit zu verbessern, Betrugserkennung einzuführen, Compliance abzusichern und Business Intelligence zu gewinnen. Einige Beispiele wären:

  • Gewinnen von Informationen aus Aufzeichnungen von Befragungen, E-Mail-Konversationen und Social Media-Websites und Abgleich dieser aus (unstrukturierten) Quellen gewonnenen Einblicke mit offiziellen (strukturierten) Datensätzen und Transaktionen
  • Vergleich von Trends und Erkennung von Mustern im Benutzerverhalten (etwa bei Kunden online oder Medienkonsumenten)
  • Erkennung von versteckten Beziehungen durch Netzwerkanalyse und Datenkorrelation
  • Durchsuchen mehrerer Content-Repositorys bei öffentlichen Aufzeichnungen, um Regeln für Gesetzesbestimmungen und Compliance zu erkennen und Muster aufzuspüren, die Warnmeldungen geben sollten

Durch den Aufstieg von Big Data-Analyse-Tools wie Apache Hadoop und Spark, Cloudera CHD und dem ELK-Stack von Elastic, sowie durch Cloudspeicher wie Amazon Web Services (AWS) und Microsoft Azure, wird es auch in Zukunft immer leistungsfähigere Nutzungsbeispiele für diese Art skalierbarer, vielseitiger Big Data-Frameworks geben.


Big Data für die Betrugserkennung ist einer unserer Nutzungsfälle, die in der Reihe „Big Data und Suche im Härtetest“ beschrieben werden – ein tieferer Einblick in sechs wichtige Anwendungsgebiete von Big Data für moderne Unternehmen. Sie finden hier die vollständige Liste der sechs Nutzungsfälle für Big Data und in Zukunft auch Videobeiträge zu Unternehmen, die ihr Geschäft erfolgreich mit diesen beschriebenen Techniken bereichert haben.

Tragen Sie sich für unseren Newsletter ein und erhalten Sie stets die aktuellsten Updates für unsere Video-Blog-Reihe „Big Data und Suche im Härtetest“.

 

(Englisch)

0