Back to top

Bessere Aufbereitung und Anreicherung der lokalen Daten mit Azure-Clouddiensten

Mit Accenture Aspire Content Processing, Azure Cognitive Services und Azure Blob Storage

Angesichts einer steigenden Nachfrage nach einer beschleunigten und effizienteren Erkenntnisgewinnung im Unternehmensbereich entwickelten sich cloudbasierte Suchplattformen zu skalierbaren flexiblen Lösungen, die schnellere Ergebnisse in Form von Mehrwerten liefern. Microsoft Azure Search ist eine der führenden cloudbasierten Suchlösungen, die wir bei unseren Kunden implementieren. Ob cloudbasiert oder lokal, in jeder Suchanwendung beginnt die Erkenntnisgewinnung mit einer sorgfältigen Datenaufbereitung. Wie können wir unsere Kunden dabei unterstützen, ihre strukturierten und unstrukturierten Inhalte zu erfassen, zu verarbeiten und für die Eingabe in Azure Search aufzubereiten?

In diesem Artikel erfahren Sie, wie die technologischen Hilfsmittel von Accenture zusammen mit den robusten Azure-Clouddiensten von Microsoft die Prozesse der Content-Verarbeitung beschleunigen und anreichern können, um bessere Ergebnisse der Suche und Analyse zu liefern. 


Azure-Clouddienste auf Abruf

Azure Blob Storage ist ein Azure-Clouddienst für die Speicherung großer Mengen von unstrukturierten Objektdaten, wie zum Beispiel Texte oder binäre Daten. In Blob Storage gespeicherte Daten können öffentlich oder nur privat zugänglich sein. Blob Storage wird für folgende Zwecke eingesetzt:

  • Übergabe von Bildern oder Dokumenten direkt an einen Browser
  • Speicherung der Dateien für eine gemeinsame Nutzung
  • Streaming von Video- und Audioinhalten
  • Datenspeicherung für Backup, Notfallwiederherstellung und Archivierung
  • Datenspeicherung für eine Analyse in einem lokalen bzw. Azure-basierten Dienst

Als ein weiterer Dienst in der cloudbasierten Azure-Familie bietet Azure Cognitive Services skalierbare Funktionen für die Verarbeitung von cloudbasierten Inhalten. Diese intelligenten, KI-basierten und auf Abruf verfügbaren Clouddienste können über APIs mit Websites und Anwendungen verknüpft und an die Unternehmensbedürfnisse angepasst werden.  

Technologische Hilfsmittel von Accenture

Aspire Content Processing von Accenture ist ein suchmaschinenunabhängiges Framework, das speziell für unstrukturierte und halb-strukturierte Daten entwickelt wurde. Das Framework:

  • unterstützt die Anreicherung der komplexen unstrukturierten Inhalte,
  • beinhaltet ein Staging Repository für eine effiziente Indexierung,
  • ermöglicht die Sicherheit auf Dokumentebene,
  • bietet mehr als 30 suchmaschinenunabhängige Konnektoren und Veröffentlichungsmodule für bekannte geschäftliche Speichersysteme. Dadurch wird eine flexible und sichere Erfassung der Inhalte gewährleistet.

Azure Blob-Veröffentlichungsmodul für eine bessere Aufbereitung der lokalen Daten  

Für eine effiziente Aufbereitung der lokalen Daten vor der Einspeisung in eine cloudbasierte Suchlösung werden die Inhalte mit Aspire erfasst, mit Azure Blob gespeichert und mit Azure Cognitive Services verarbeitet. Ein typischer Workflow ist in der Skizze dargestellt.

 

content processing for Azure search


1.  Ein lokal installierbares Framework Aspire Content Processing sammelt und bearbeitet solche unstrukturierten Inhalte wie Bilder, Dokumente und über HTTP verlinkte Inhalte (zum Beispiel Websites). 

2.  Über das Azure Blob-Veröffentlichungsmodul von Accenture werden die Inhalte an den cloudbasierten Speicher Azure Blob Storage übertragen. Unser Azure Blob-Veröffentlichungsmodul, wurde in 2–3 Wochen entwickelt, es basiert auf dem Aspire-Framework und bietet folgende Funktionen:

  • Inkrementelle Updates für die Synchronisierung der in Azure Blob gespeicherten Inhalte mit den Inhalten in Aspire. 
  • Eine gesicherte Verbindung zwischen Aspire und Azure Blob über einen geheimen Schlüssel.

3.  In Azure Blob gespeicherte Inhalte können mit den Azure Cognitive Services zusätzlich angereichert werden. Zu diesem Zweck werden maschinelles Lernen und Verarbeitung natürlicher Sprache eingesetzt. Eine allgemeine Bereinigung und Anreicherung in Azure Cognitive Services kann folgende Vorgänge beinhalten:

  • Allgemeine Dokumentenelemente entfernen (Seitenleiste, Kopf- und Fußzeile, Textbausteine usw.)
  • Klassifizierung der Inhalte automatisieren
  • Referenzen aus den gesammelten Inhalten extrahieren und als Metadaten an die Suchmaschine übertragen
  • Mehrere Dokumentversionen zusammenführen
  • Inhalte nach Beliebtheit einordnen
  • Namen, Orte, Organisationen usw. als Metadaten extrahieren, Filterung nach mehreren Kriterien ermöglichen

4.  Die angereicherten Inhalte werden an Azure Search übertragen und ermöglichen eine bessere Suche und Analyse. 

Erfolgreiche Partnerschaft

Dank Azure Blob können lokale und cloudbasierte Suchmaschinen von allen Azure-Clouddiensten profitieren, denn die Verschiebung der Inhalte zwischen diesen beiden Diensten ist denkbar einfach. Die oben beschriebene Aufbereitung der lokalen Daten vor der Einspeisung in eine cloudbasierte Lösung ermöglicht eine effizientere Speicherung, Verarbeitung und Anreicherung der Daten, damit die Leistung der Indexierung, Suche und Analyse signifikant gesteigert werden kann.

Im Video Liam Cavanagh, Azure Search Principal Program Manager, erklärt, wie Accenture Aspire zusammen mit Azure Cognitive Services die Verarbeitung der unstrukturierten Inhalte optimiert und verbessert.

Kontaktieren Sie uns, um mehr darüber zu erfahren, wie Sie Ihre Inhalte für bessere Suchergebnisse aufbereiten können.


Die Lösungsentwicklung wurde geleitet von:

  • Paul Nelson, Innovation Lead
  • Bill Fowler, Functional & Industry Analytics Manager
  • Cristina Arias, Functional & Industry Analytics Consultant
  • David Solano Araya, Functional & Industry Analytics Consultant
0