Back to top

Dienstleistungen für die Verarbeitung von natürlicher Sprache

Die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) entwickelt sich immer mehr zu einer Grundanforderung moderner Unternehmen, die sich einen Wettbewerbsvorteil sichern wollen. NLP ist ein wesentlicher Bestandteil vieler neuer Geschäftsfunktionen, von Chatbots und Frage-Antwort-Systemen bis zur Überwachung von Compliance, Business Intelligence und Analyse von strukturierten und semi-strukturierten Inhalten.

In jedem Unternehmen finden sich riesige Mengen unstrukturierter Inhalte, die wichtige Erkenntnisse enthalten können – Suchabfragen, E-Mail-Kommunikation, Social Media, Videos, Kundenbewertungen, Anfragen an den Kundendienst, usw. Die NLP-Werkzeuge und -Techniken helfen dabei, unstrukturiertes „Big Data“ zu verarbeiten, zu analysieren und zu verstehen, um dann effektiv und proaktiv agieren zu können.  

Dienstleistungen für die Verarbeitung natürlicher Sprache durch Search Technologies decken ein breites Feld von Anforderungen ab; von der Datenerfassung, -verarbeitung und Analyse, über die Extrahierung von Entitäten und Fakten, bis hin zu Frage-Antwort-Systemen (im Sinne eines für das eigene Unternehmen maßgeschneiderten digitalen Assistenten).

natural-language-processing-de.png

ERFASSEN VON UNSTRUKTURIERTEN DATEN

Seit mehr als einem Jahrzehnt helfen wir Unternehmen dabei, unstrukturierte Daten aus internen wie externen Quellen für Suche und Analyse einzubinden. Unsere Consultants haben umfangreiche Erfahrung mit der Identifizierung und Extraktion von Daten mit Hilfe von:

  • downloadfähigen Daten, aus kostenpflichtigen wie auch kostenlosen Datenquellen im Internet
  • sicheren Search Technologies Konnektoren zu den in großen Unternehmen beliebtesten datenhaltenden Systemen

VERARBEITUNG ROHER SPRACHDATEN 

Rohdaten aus unterschiedlichen Quellen unterliegen einer starken Varianz. Nach ihrer Erfassung müssen wir die Daten daher bereinigen und formatieren, damit die Daten letztendlich höchste Qualitätsstandards erreichen: 

  • Format bestimmen (z. B. PDF, XML, HTML usw.)
  • Textinhalte extrahieren
  • Irrelevante Abschnitte bestimmen und entfernen (Kopf- und Fußzeilen, Randleisten und Textbausteine, die nur irrelevanten Standard-Content enthalten)
  • Unterschiede und Änderungen erkennen
  • Kodierte Metadaten extrahieren
  • Token extrahieren, normalisieren und bereinigen
  • Phrasen bzw. Zitate extrahieren

TEXT MINING, TEXT-EXTRAHIERUNG UND VERSTÄNDNIS DES SUCHBEGRIFFS FÜR EINE BESSERE SUCHE

In vielen Fällen liegen Inhalte nur in natürlicher Sprache vor, z.B. in normal formuliertem Englisch oder Deutsch – ohne Kennzeichnung von Metadaten. Wir haben die Werkzeuge und Technologien, die Ihnen dabei helfen, Informationen aus diesen Inhalten zu extrahieren. Es können einige Elemente des Text Minings, der Text-Extrahierung oder ggf. vollständiges NLP eingesetzt werden.

Typische Funktionen der Volltext-Extrahierung umfassen:

  • Extrahierung von Entitäten – z.B. Unternehmen, Personen, Geldbeträge, Hauptinitiativen usw.
  • Kategorisierung von Inhalten – Unterteilung in positive und negative Elemente (Stimmungsanalyse); nach Funktion, Absicht oder Zweck; nach Branche oder anderen Kategorien; für Analysen und Trendbestimmungen
  • Clusterbildung für Content – um Hauptthemen aus den Inhalten aufzufinden und/oder neue Themen zu entdecken
  • Extrahierung von Fakten – um Datenbanken mit strukturierten Informationen zu füllen, z.B. für Analysen, Visualisierung, Trendbestimmung und Warnhinweise
  • Extrahierung von Beziehungen – um Graphdatenbanken zu füllen, mit denen Beziehungen aus der realen Welt erforscht werden können

STATISTISCHE VERARBEITUNG VON SPRACHDATEN

In vielen NLP Projekten können statistische Methoden ein erstes allgemeines Verständnis des gesamten Dokuments liefern. Anwendungsbeispiele für statistischen Verarbeitungsmethoden, mit denen wir bereits gearbeitet haben, sind unter anderem:

  • Clusterbildung
  • Kategorisierung
  • Bestimmung von Gemeinsamkeiten
  • Themenanalyse
  • Schlagwortwolken (tag clouds)
  • Zusammenfassungen

ENTWICKLUNG VON FRAGEBEANTWORTENDEN SYSTEMEN

Ein fragebeantwortendes System (auch bekannt als „Insight Engine“ – ein Begriff, der von Gartner eingeführt wurde) analysiert Anfragen in natürlicher Sprache und arbeitet mit Drittsystemen zusammen. Es liefert statt einer Liste von Ergebnissen, die das Stichwort enthalten, direkte Antworten.

Ein fragebeantwortendes System kann über das Search Technologies Natural Language Processing Toolkit erstellt werden. Dieses wird mit fortgeschrittenen, skalierbaren Werkzeugen für die Verarbeitung natürlicher Sprache verbunden, die alle notwendigen Funktionen für das Verständnis von Anfragen vornehmen können. Zu unseren NLP-Tools gehören:

  • Zerlegung in Token
  • Normalisierung von Akronymen
  • Lemmatisierung
  • Abgrenzen von Sätzen und Ausdrücken
  • Extrahierung von Entitäten (alle Arten außer statistisch)
  • Extrahierung statistischer Ausdrücke
  • Erkennung von Fragemustern
  • Statistische Begriffsklärung
  • Frage-Antwort zu Aktion-Systeme
  • Benutzeroberflächen für die Pflege (siehe unten)

Vorteile eines fragebeantwortenden Systems mit NLP:

  • Für die Eingabe und Pflege von Entitäten und Mustern sind verschiedene Benutzeroberflächen verfügbar. Diese Oberflächen ermöglichen es professionellen Nutzern ohne Programmiererfahrung, häufige Entitäten und Frage/Antwort-Muster einzugeben und aktuell zu halten.
  • Programmierer sind nur für die Integration mit Back-End-Systemen erforderlich. 
  • Antworten können aus relationalen Datenbanken, REST-APIs zu Geschäftssystemen oder aus Ergebnissen einer Suchmaschine bezogen werden.
  • Abhängig von den konkreten Anforderungen können die Antworten in natürlicher Sprache formuliert, als Diagramm, Bericht oder interaktive Grafik geliefert werden. 


Kontaktieren Sie uns, um mehr über unsere Dienstleistungen zur Verarbeitung natürlicher Sprache zu erfahren und Ihre speziellen Anforderungen zu besprechen.

0