Back to top

Trends in der Unternehmenssuche: Was kommt 2016?

Die vier wichtigsten Suchfunktionen, auf die man ein Auge haben sollte

Aus Sicht der Benutzeroberfläche hat sich in den letzten Jahren nicht viel geändert: Funktionen für Facetten, Autovervollständigung und „Meinten Sie vielleicht...“ wurden eingeführt und haben sich bewährt. Zukünftige Änderungen werden eher unbemerkt im Hintergrund ablaufen, können aber potenziell große Auswirkungen auf die Suchqualität haben und somit ein besseres Benutzererlebnis und höhere Nutzerzufriedenheit bringen.

2016 steht an, also sollten wir uns einige der aktuellen und zukünftigen Funktionen für die Unternehmenssuche sowie deren Einfluss auf Ihr Unternehmen genauer ansehen.

 

1.  „Alles eine Frage der Zahlen“ - Suchgenauigkeit und Suchmaschinenbewertung

Die aktuellen Methoden zur Bestimmung der Suchqualität basieren meist auf „Goldenen Suchbegriffen“, Schlüsseldokumenten, Suchen ohne Ergebnisse oder Top-Ergebnissen. Ein fortschrittlicher, automatisierter Ansatz nutzt Informationen aus Log-Dateien der Suchmaschine (Suchanfragen) und Webserver (Klicks) um eine ganzheitliche Sicht auf die Suchqualität zu gewinnen – statt nur eine Teilmenge zu betrachten. Dadurch wird es möglich, Suchanfragen aus der Perspektive eines Nutzers oder einer Sitzung zu wiederholen und zu untersuchen und somit die Erfahrung aller Benutzer zu berücksichtigen.

Die Qualität der Suchmaschine kann dann mit Hilfe der Daten berechnet werden, die aus den Log-Dateien gewonnen wurden. Mit Hilfe dieser Informationen können Suchverläufe aus bestimmten Zeiträumen, von bestimmten Benutzergruppen oder nach bestimmten Abfragetypen mit unterschiedlichen Regelwerken erneut betrachtet werden um die Qualität der Suchmaschine (d.h. die Suchmaschinenbewertung) zu optimieren.

Im Folgenden ein Beispiel für die Historie einer Suchmaschinenbewertung, die aus fast 100 Durchläufen ermittelt wurde. Sehen Sie hierwie wir die Suchmaschinenbewertung mit Hilfe von Big Data und Predictive Analytics berechnen. 

 

 

Ausblick: Unternehmen werden Prozesse zur Optimierung der Suchrelevanz einführen, welche die Log-Dateien zur Analyse von Suchanfragen und Klicks nutzen um die aktuelle Bewertung der Suchmaschine zu berechnen. Diese können z.B. monatlich durchgeführt werden. Basierend auf dieser und früheren Bewertungen können Verbesserungen für den Aufbau der Suchanfrage entwickelt, getestet und in die Produktionsumgebung übernommen werden, um so die Suchqualität zu optimieren.

 

2.  „Nur für Dich“ - Personalisierung der Suche

Die Qualität der Suche kann auch dadurch optimiert werden, dass Suchergebnisse auf einzelne Benutzer oder Benutzergruppen zugeschnitten werden. Durch Log-Analysen können Benutzer anhand ihrem früheren Suchverhalten, den bisher heruntergeladenen bzw. betrachteten Dokumenten, den Benutzerdaten (in Profilen) oder ihren Beiträgen in verschiedene Gruppen eingeteilt werden. Parameter für diese Einteilung sind z.B. die Beliebtheit von Dokumenten, Semantik (unterschiedliche Bedeutung einzelner Worte für unterschiedliche Benutzergruppen) oder der geografische Standort. Dieser Prozess wird für den Endnutzer vollständig transparent gehalten und wird schon heute für die Internetsuche von Google oder die Produktsuche von Amazon verwendet (bei angemeldeten Benutzern).

Ausblick: Benutzer werden bei jedem Besuch einer Website oder eines Internetportals personalisierte Suchergebnisse angezeigt bekommen, die zu ihrem Profil und früheren Interaktionen passen.

 

3.  „Kontext ist alles“ - Semantische Suche

In aktuellen Suchmaschinen werden eingegebene Suchbegriffe und indexierte Worte einander eindeutig zugeordnet; Ausnahmen sind nur Stoppworte sowie auf linguistische Grundformen reduzierte Begriffe. Aufgrund der stetig steigenden verfügbaren Rechenleistung ist es jetzt möglich, Entitäten (statistische Ausdrücke oder Akronyme) effektiv zu erkennen, semantisch gemeinsames Auftreten zu berechnen (semantisch verbundene Begriffe, die gemeinsam auftreten) sowie eine semantische Gewichtung vorzunehmen (basierend auf dem Volltext des Dokuments, früheren Interaktionen des Benutzers oder beidem).

Zusätzlich zur reinen semantischen Analyse können auch semantische Beziehungen erkannt werden, um Informationstripel aus dem Volltext zu extrahieren.

Während der eigentlichen Suche können die Anfragen auch um Suchausdrücke und/oder Alternativen erweitert werden. Die Anfragen können mittels verschiedener Methoden verkettet und mehrfach ausgeführt werden, um die Suchergebnisse zu verbessern, bevor sie dem Benutzer präsentiert werden. Die Relevanz kann auch durch semantische Kriterien beeinflusst werden. Außerdem können verschiedene Begriffe auf eine einzelne Bedeutung reduziert werden damit diese besser zur Suchhistorie passen (in Verbindung mit Personalisierung).

Ausblick: Die Dokumentverarbeitung wird mit Komponenten zum Extrahieren semantischer Informationen während des Indexierens erweitert werden; möglicherweise mit Hilfe externer Dienste wie OpenCalais. Für die Suche selbst werden die Komponenten der Anfrageverarbeitung modifiziert/angepasst werden, damit die während der Indexierung gesammelten semantischen Informationen genutzt werden können.

 

4.  „Die Denkmaschine“ - Deep Learning

Ein weiterer Trend, der aktuell schon von Google und Baidu verfolgt wird, ist Deep Learning. Wie bereits von IBM mit der Watson-Engine demonstriert wurde, geht es hierbei um den Zugriff auf externes Wissen und den Einsatz dieses Wissens während der Dokument- und Anfrageverarbeitung. Idealerweise sollte dieses externe Wissen bereits als Informationstripel vorliegen oder aus Datenquellen wie Wikipedia generiert werden.

Ausblick: Unternehmen werden von dieser Technologie profitieren, indem sie Informationstripel aus den indexierten Dokumenten extrahieren und dabei frei verfügbare Wörterbücher wie EuroVoc oder Metadaten-Speicher wie das European Union Metadata Repository (MDR) einbeziehen. 

-- Konrad

0