Back to top

Google pro podnikové vyhledávání ve Vašem intranetu

 

Nejobvyklejší požadavek zákazníka ze všech: Nemůžeme prostě mít Google na našem intranetu?

 

Úvod:

  • Google Search Appliance má perfektní reputaci pro vyhledávací aplikace které lze jen zapojit a ihned fungují. Typicky obsahují jediný zdroj dat.
  • Zato v prostředí podniku je vícero heterogenních zdrojů dat výzvou

Tento článek se dívá na to, jak byl Google.com přizpůsoben prostředí webového vyhledávání a bere si z toho ponaučení. Účelem je pomocí toho, co jsme se tímto naučili vést implementaci toho, co patří k uživatelské zkušenosti s Googlem v aplikacích pro podnikové vyhledávání / intranetové vyhledávání.

 

Google.com - přizpůsobené prostředí

Google stále těží ze světové reputace pro relevanci výsledků vyhledávání na webu. Klíčovým důvodem je technologie indexování a vyhledávání vyvíjená již patnáct let největším týmem inženýrů zabývajících se vyhledávacími systémy. Google Search Appliance z prosperuje z této investice také a poskytuje relevanci, rychlost a škálovatelnost.

Existují ovšem značné rozdíly mezi vyhledáváním na webu a podnikovým vyhledáváním. Kterákoliv organizace, která chce poskytovat stejnou zkušenost s vyhledáváním za firewallem by měla zvážit tyto rozdíly.

 

Klíčové problémy se dají shrnout takto:

  • Normalizace obsahu: Na webu miliony marketérů schválně píše webové stránky tak, aby byly nalezeny. Toto znamená následování standardizovaných html formátů a zajišťování toho, že metadata jako je Titulek a Popis jsou vyplněná a správným způsobem reprezentují obsah na stránce. Pro srovnání na opačném konci za firewallem podniku jsou dokumenty velmi zřídka psány tak, aby byly nalezeny a často nemají využitelná metadata. Tyto problémy normalizace obsahu a vylepšení metadat mohou být řešeny, ale vyžadují plán.
  • Zpracovávání obsahu: Google.com vykonává obrovské množství manipulace s obsahem a analýz před indexováním. Například zkoumá spojení mezi webovými stránkami a počítá “PageRank” skór pro každou webovou stránku. Toto pomáhá Google rozlišovat mezi stránkami, které mají směrodatné informace na nějaké téma a těch, co takových kvalit nedosahují, a to na postupně klesající škále. Příprava obsahu vyžadována ovšem i za firewallem, kde se vyskytuje mnoho zdrojů dat. Vzájemná spojení mezi dokumenty existují zřídkakdy tam, kde jsou, jsou relevantní jen pro část souboru dat. Řešení tohoto problému existují, ale vyžadují plán a práci v implementaci. Narozdíl od webu firemní obsah rozhodně není homogenní.
  • Konektivita dat: Google.com využívá vysoce přizpůsobenou infrastrukturu pcoházení webů pro sbírání webových stránek k indexování. Má tu výhodu, že autoři stránek chtějí být nalezeni a proto održují určité standardy. Různé druhy mapy stránek jsou posytovány vlastníky webových stránek, aby napomohly Googlebotu efektivně sbírat stránky. V rozhraní podnikového vyhledávání to není už tak snadné. Vícero repozitářů, typicky vyžadujících zabezpečení se seznamy pro řízení přístupu (ACL) na úrovni dokumentu a s limitovanými metodami hromadného exportu obsahu, musí být “crawlowány” pro sběr dokumentů k indexování. Neúspěšné spojení na udržitelné úrovni znamená, že obsah není poskytován k prohledání.

Výše zmíněné rozdály nejsou jedinými rozdíly mezi webovým vyhledáváním a podnikovým vyhledáváním, ale jsou důležité a diskze o tom, jak by mohly být řešeny by měly být prioritou pro jakoukoliv organizaci, která se snaží dodat tu samoz zkušenost, jako Google, ale za firewallem.

Search Tecnologies poskytuje služby a softwareové doplňky za použití oficiálně podporovaných Google API a frameworků k řešení problémů konektivity dat, normalizace obsahu a před-zpracovávání.

Kombinujte naše služby a nástroje s hlavními funkcionalitami GSA a budete mít vše, co potřebujete k napodobení Googlu ve Vašem intranetu.

Jak by mohlo roustoucí množství zákazníků Google Search Appliance dosvědčit, správně laděný vyhledávací systém je klíčový pro produktivitu v podniku.

Blog Categories
0

We’re very excited to announce that we’re now part of Accenture! Read the announcement here.