Back to top

Zdokonalení AWS Cloudsearch: předběžný názor

(*AWS = zkratka pro: Amazon Web Services)  

Rozhodnutí založit Cloudsearch na Solr by mohlo zásadně změnit dosavadní postavení hráčů na trhu

Zatímco píšu tento text, kolega (technik) sedící napravo pár metrů ode mě vytváří na žádost zákazníka nový analyzátor dokumentů, aby se mohl zabývat problematikou kvality choulostivých dat. Není podstatné, jaké vyhledávací weby zákazník používá, stále platí, že dodáte-li programu špatný vstup, nemůžete čekat dobrý výstup. A tak mizerná kvalita dat obvykle ukazuje na potíže s tím, co je při vyhledávání důležité. Můj kolega ví, jak tyto potíže napravit.

Zabývá se nastavením důležitých dat a dolaďuje věci pomocí řady cyklů „změnit - reindexovat - testovat”. Každý, kdo implementoval vyhledávací systém, který je pro úspěch byznysu důležitý, bude s tímto opakujícím se procesem jistě obeznámen.

 

PRODUKTIVITA & HBITOST

Se zákazníkovým svolením byla data odeslána přes noc do AWS a dnes ráno můj kolega spustil extra velkou EC2 instanci, instaloval nějaký software, a zatímco přemýšlel a kódoval za svým stolem, někde jinde na naší planetě zpracovával obrovský server text za něj. Mně se řekne, že ta práce bude hotová za několik dní, během kterých EC2 instance bude sama zpracovávat úkol. 

Díky tomu, že se blíže seznámil se službami Amazon Web Services, si můj kolega zlepšil osobní produktivitu a rychlost, se kterou jsme schopni poskytovat služby našim zákazníkům. Používáním AWS tímto způsobem není ojedinělé ani pro tohoto kolegu, ani pro naši společnost.  Ale člověka až zabolí při pomyšlení, jak jsme tuto činnost až donedávna prováděli.

 

EC2 HOSTOVAL SOLR

Ve světě podnikání pomocí vyhledávání jsme svědky narůstajícího počtu zákazníků, kteří si zvolí provoz systému na AWS. Kombinace Solr (přední služby open source vyhledávacího webu), provozované na EC2 instancích je oblíbená, zejména u aplikací pracujících s webem, jako jsou například hledání na webu nebo vyhledávání v elektronickém obchodování. Zrovna nedávno jsme pomohli významnému obchodnímu vydavateli přenést objemnou a složitou vyhledávací infrastrukturu do Solr/EC2 – viz zde uvedená případová studie.

Solr není pro každého. Protože je open source, nenutí Vás platit žádné předběžné licenční poplatky. Zákazníkům se tenhle nápad líbí. Jedná se o vyspělé, robustní řešení s kvalitním škálováním, což jsou všechno aspekty, které se mým kolegům líbí. 

U Search Technologies si ceníme své nezávislosti a obecně se vyhýbáme myšlenkám upínajícím se pouze na jediný vyhledávací web, který by byl lepší než jiný. Namísto toho se nejdříve podrobně seznámíme s požadavky zákazníka, například prostřednictvím naší služby Assessment Service, a na základě toho, co zjistíme, pak hledáme vhodný vyhledávací web. Ve většině situací existují různé vyhledávací weby s potřebnou kapacitou, často zahrnující Solr, a zákazník si tedy může vybírat. 

Závažné důvody pro to, že si zákazník Solr nevybere, zahrnují jeho pochybnosti o údržbě a podpoře z open source software. 

 

CO SI TEDY MYSLÍME MY O NOVÉM CLOUDSEARCH?

Jeho funkční schopnosti se velmi zlepšily a zdají se být ve srovnání s původní verzí dvakrát rychlejší. 

Vyčerpávající popis funkcí naleznete na blogu AWS Blog.

Nejvíce zajímavé však je, že Cloudsearch je nově postavený na Solr. 

Chlapci z AWS kolem toho prozatím nedělají povyk, možná proto, že to není vlastně úplně Solr. Například tam chybí několik funkcí Solr, které nemají dostatečnou „elasticitu“. API je také malinko odlišný na to, aby se hodil pro provozování jiných paralelních AWS služeb; někteří skalní zastánci Solr s tímto faktem nebudou tak docela spokojení.

Jaké jsou důsledky? 

 

Zde jsou některé, které mně okamžitě vytanou na mysli. 

1.  ZÁSADNÍ DŮVOD MLUVÍCÍ PRO SOLR 

Solr je významným a aktivním projektem Apache. Svým vlivem a podporou se nedávno postavil za Solr jeden největších predátorů z džungle IT. Skalní příznivci mají důvod k oslavám. Tohle může jedině posílit dlouhodobou prognózu Solr, což by naopak mělo uklidnit uživatele Solr stejně jako implementátory. 

 

2.  DOKÁŽE SE VYPOŘÁDAT S POCHYBNOSTMI O PODPOŘE & ÚDRŽBĚ

Podobně jako základní verze Solr, nezahrnuje Cloudsearch žádný počáteční licenční poplatek. Tohle se zákazníkům líbí. Stejně jako všechny AWS služby je tento model v režimu plať-podle-toho-jak-používáš. Organizace, které se odkláněly od Solr, protože měly pochybnosti o podpoře a údržbě open source řešení, mohou být v posuzování trochu uvolněnější. Cloudsearch je plně udržovanou službou a AWS se již nyní těší dobré pověsti za podporu poskytovanou pro řadu organizací, včetně té naší. Zde je tedy způsob nasazení Solr, proti kterému ani ten nejopatrnější IT manažer nemá žádný důvod něco namítat.

 

3.  CLOUDSEARCH NYNÍ VYHOVUJE POŽADAVKŮM NA ROZSÁHLÉ VYHLEDÁVÁNÍ INFORMACÍ Z REÁLNÉHO SVĚTA 

Nově dodaná funkčnost u Cloudsearch vyplňuje některé závažné mezery; to bude znamenat, že Cloudsearch bude plně uspokojovat potřeby mnohem širšího okruhu vyhledávacích aplikací. I když očekáváme, že převážná většina aplikací Cloudsearch bude i nadále fungovat na bázi internetu, nic nebrání jejich současnému využití pro intranet nebo pro podnikové vyhledávací aplikace. Například my to tak děláme, když používáme rozšiřující technologie, například data konektory, zpracování obsahu, anebo zpracování dotazů. Přidejte příjemné a flexibilní uživatelské prostředí UI jako například Twigkit a máte funkční a značně cenově výhodnou vyhledávací platformu pro svůj podnik.

 

4.  CLOUDSEARCH ŽENE DOLŮ NÁKLADY NA VLASTNICKÉ PRÁVO

Stojí za povšimnutí, že cena za Cloudsearch zůstává stejná. U menších aplikací můžete začít za méně než 100 USD za měsíc; nezapomeňte, že tato částka zahrnuje hardware i software a údržbu a podporu pro obojí. Počáteční testy (měli jsme přístup do programu Beta) naznačují, že rychlost nové verze je přibližně dvojnásobná. To znamená, že kupříkladu na splnění požadavku s velkým objemem dat budete potřebovat ve srovnání s původní službou Cloudsearch pouze polovinu instancí. 

Již v původní verzi Cloudsearch bylo záměrem nabízet cenově velmi optimální řešení.

 

CO TOHLE VŠECHNO ZNAMENÁ? 

Při nezávislém pohledu stojí za povšimnutí každá vlastnost, o které jsme zde zmínili. 

Celkem vzato všechny zmíněné vlastnosti mohou významně ovlivnit hledání nových možností pro vyhledávání na webu pro každý podnik. 

Čtěte více na stránkách odkazu …. Nová funkčnost v Cloudsearch

0