6.6.2013

FAST – tehoa ja älyä SharePoint-hakuun

 

Kristiina Manner Sinisen Meteoriitin teknologiakonsultti Kristiina Manner on päässyt tositoimiin FAST -hakutekniikan parissa. Kristiina kertoi meteoriitti.comin toimitukselle, mistä FASTissa oikein on kyse.

Mikä oikein on FAST ja mitä sillä saa aikaan?

FAST (FAST Search Server 2010 for SharePoint) on Microsoftin monipuolinen ja tehokas hakuratkaisu, joka tuottaa käyttäjälle relevantteja hakutuloksia yhdistelemällä tietoa älykkäästi. FASTin avulla tietoja voi hakea yhdellä haulla monesta eri tietolähteestä, kuten intranetistä, verkkolevyiltä ja tietokannoista. Hakutulokseen voidaan yhdistää myös muiden hakukoneiden, esimerkiksi Bingin, tuottamia tuloksia.

FAST haku poimii tietosisällöstä automaattisesti esimerkiksi kaupunkien, maiden ja ihmisten nimiä. FAST haulle voidaan määritellä kunkin asiakkaan omat termistöt ja sanastot, joita FAST tunnistaa sisällöstä kun tietoja luetaan hakujärjestelmän indeksiin. Tunnistetuista termeistä voidaan tehdä hakutulosten selaamista ja kaventamista varten rajaajia, jotka ryhmittelevät hakutuloksia vaikkapa tuoteryhmien, tuotteiden ja prosessien mukaan.

Käyttäjän saamia hakutuloksia voidaan kohdentaa käyttäjän roolin tai sijainnin mukaan. Rooleja voivat olla esimerkiksi kehittäjä, projektipäällikkö tai myyjä ja sijainteja kaupunki, maa tai toimipiste. Kohdentamisella pyritään tuomaan käyttäjälle tietoa nimenomaan häntä kiinnostavasta näkökulmasta, esimerkiksi myyjälle tuotteen myyntimateriaalia ja kehittäjälle tuotteen teknistä dokumentaatiota.

Miksi FAST kannattaa ottaa käyttöön?

FAST tuo monipuolisuutta sekä konepellin alle että haun loppukäyttäjälle. Siinä on älykästä prosessointia ja automaattista tietojen etsintää sisällöstä jo indeksointivaiheessa, ja haun loppukäyttäjälle saadaan tuotettua relevantteja tuloksia monipuolisesti, visuaalisesti ja rajaajilla jaoteltuna.

Tässä muutamia hyviä syitä ottaa FAST käyttöön: 

  • Visuaalisuus – Hakutuloslistaus näyttää pienet kuvat löydetyistä dokumenteista. Niiden kautta hakutulosdokumentteja voi esikatsella ilman, että itse hakutulosdokumenttia klikataan auki. Esikatselu auttaa arvioimaan, löytyykö hakutuloksista vastaus siihen, mitä käyttäjä on etsimässä.
  • Lingvistiikka – FAST tunnistaa automaattisesti yli 80 kieltä, ja kielen tunnistamisen jälkeen se käsittelee dokumenttien sisältöjä kielikohtaisilla sanastoilla ja säännöillä. FAST -haku ymmärtää kielen rakennetta ja sanojen taivutusmuotoja, näin ollen esimerkiksi sanojen monikot tai muut sijamuodot eivät tuota ongelmia hauissa. FAST oikolukee hakutermit ennen haun suoritusta, mikä osaltaan parantaa hakutuloksia. FAST myös suodattaa käyttäjän kirjoittamista hakutermeistä pois tarpeettomia ilmauksia. Näin saadaan haun kannalta oleellisimmat hakutermit esiin. FAST sisältää lisäksi mahdollisuuden kielisidonnaisten henkilönimien, yritysten nimien ja maantieteellisten paikannimien tunnistukseen.
  • Sisällön prosessointi – FASTin Content Processing Pipeline prosessoi indeksoitavaa sisältöä monipuolisesti ja prosessointia on vieläpä mahdollista räätälöidä juuri asiakkaan tarpeiden mukaiseksi. Räätälöimällä voidaan lisätä sisällön indeksointiin asiakaskohtaisia sääntöjä, joiden mukaan sisältödokumenttien elementtejä käsitellään. Esimerkki asiakaskohtaisista säännöistä olisi tilanne, jossa yrityksen valmistaman tuotteen tietoja haetaan eri tietolähteistä – SharePointista, verkkolevyltä ja tietokannasta. Eri tietolähteissä tuotteen nimi on tallennettu eri nimisiin kenttiin, kuten “tuotenimi” ja “product”. Asiakaskohtaisten käsittelysääntöjen avulla voidaan lisätä kaikkiin tuotteeseen liittyviin dokumentteihin kenttä “Tuote”, johon tuotenimi tallennetaan. Käyttäjille tämä ilmenee niin, että haun kautta löytyvissä dokumenteissa on aina tietyn niminen kenttä, josta tuotenimi löytyy, eikä hänen tarvitse tietää millä kaikilla tavoin tuotenimi on eri tietolähteissä tallennettu.
  • Erilaiset hakukokemukset eri käyttäjille – FASTissa on mahdollisuus erilaisia relevanssimalleja eri tietolähteille, eri sovelluksille ja eri tyyppisille käyttäjille. Relevanssimalli tarkoittaa sitä, että käyttäjälle voidaan näyttää tuloksia esimerkiksi maa- tai kaupunkikohtaisesti, tai hakutulokset voivat perustua hänen osastoonsa tai työnimikkeeseensä. Hakusana voi olla sama, esimerkiksi tuotteen nimi, mutta näkökulma eri.
  • Rajaajat – FASTissa on mukana SharePoint Server Searchista tutut, hakutuloksen metatietojen perusteella luodut haun rajaajat (navigaattorit, fasetit). FAST näyttää tulosten tarkat lukumäärät rajaajakohtaisesti, näin käyttäjä saa nopean yleiskuvan kuvan siitä, minkä verran hakutuloksia eri rajaajien kautta löytyy. Rajaajia voidaan myös luoda asiakkaan sanastojen tai taksonomioiden mukaisesti.
  • Metadata ekstraktointi – FAST pystyy automaattisesti poimimaan indeksoitavasta sisällöstä metatietoja ja hyödyntämään sitä rajaajissa, relavanssissa ja kohdennetuissa hauissa.
  • Yhteensopivuus ja helppous SharePoint 2010 kanssa – FAST asennetaan eri palvelimelle kuin SharePoint ja FASTille on oma asennusohjelma. Asennuksen jälkeen FASTia kuitenkin hallinnoidaan täysin SharePointin Central Administrationin kautta tai PowerShellin avulla.

Mihin tilanteisiin tai minkälaisiin organisaatioihin FAST sopii?

FAST sopii useimpiin tilanteisiin ja organisaatioihin! Etenkin nyt, kun FAST Search Server 2010 for SharePoint on SharePointin myötä huomattavasti edullisempi ottaa käyttöön kuin erillinen FAST Search for Internet Sites. Jos yrityksellä on olemassa Enterprise-lisenssi, ei tarvita muuta kuin FASTin vaatimien palvelimien lisenssit sekä palvelin tai palvelimet. FAST Search Server for SharePointin avulla yritys saa hakuratkaisun, joka palvelee juuri heitä – hyödyntää yrityksen omia sanastoja ja termejä, kykenee kohdistamaan hakutuloksia eri käyttäjäryhmille ja ymmärtää yrityksen tietosisältöä kielellisesti entistä paremmin.

Nyrkkisääntönä voi pitää, että aina kun yrityksellä on tietoa useissa eri tietovarastoissa ja näiden tietovarastojen tiedot haluttaisiin yhden haun piiriin, niin FASTiin tulisi ehdottomasti tutustua hakukonevaihtoehtona. FAST Search Server 2010 for SharePoint on etenkin SharePoint-asiakkaille erittäin houkutteleva hinnaltaan ja mahdollistaa todella monipuolisen hakukokemuksen rakentamisen.

Eniten FASTista saavat hyötyä organisaatiot joilla on esimerkiksi tuotetietoa useissa eri järjestelmissä ja näitä tietoja haluttaisiin esittää tai hakea yhteisen hakukoneen avulla. Myös vaatimukset useille, erilaisille kielitunnistuksille voi olla vahva syy valita FAST. Tällaisissa tilanteissa FAST on jo vuosien ajan ollut markkinajohtaja maailmassa ja syynä ovat aivan omaa luokkaansa olevat räätälöintivaihtoehdot.

Minkälaista palautetta asiakkailta on saatu FASTista?

Kiinnostus on ollut kovaa ja Sinisellä Meteoriitilla onkin jo FAST-projekteja käynnissä. Hakukoneprojekteissa kenties palkitsevinta on, että asiakkaat kokevat oppivansa erittäin paljon projektien aikana. Hakukoneprojektit myös edistävät monissa organisaatioissa tietojen yhteismitallisuuteen panostamista ja näin uusi hakukone saa usein aikaan positiivista muutosta monella rintamalla organisaatioissa. FASTin osalta asiakkaat lähes aina kiittelevät sen monipuolisia mukautus- ja räätälöintimahdollisuuksia. Joskus toki tekemistä tuntuu olevan liiankin kanssa, mutta FAST Search Server 2010 for SharePoint suoraviivaistaa tätä säätövaihettakin merkittävästi.

Mitkä ovat FASTin kilpailijoita Suomessa?

Hakukonemarkkinassa eri toimijat ovat erikoistuneet hieman eri asioihin ja näin suoria kilpailijoita on tuotteille hieman vaikea nimetä. FASTin kanssa samassa yhteydessä useimmiten Suomessa mainitaan etenkin SharePoint 2010:n oma hakukone, Googlen GSA sekä Lucene Solr.

FASTin pahin kilpailija Suomessa lienee SharePoint 2010:n oma perushaku joka on parantunut huomattavasti SharePoint 2007 -version hakukoneesta. Monet asiakkaat pohtivat valintaa pelkästään näiden kahden välillä silloin kun tietovarastoja tai kieliversioita ei ole lukuisia. Vaaka kääntyy FASTin puolelle yleensä silloin, kun halutaan hakea tietoja myös muista tietolähteistä kuin SharePoint-kirjastoista ja verkkolevyiltä.

Pelkästään hakukonetta ostamassa olevat asiakkaat tutustuvat usein myös Googlen GSA -hakukoneeseen, mutta GSA :n lähestymiskulma on kovin erilainen, koska Googlen ratkaisu on erittäin itsenäinen ja täten vähemmän mukautettavissa. Myös hinnoittelumalli on Googlella erilainen. Tyypillisesti Googlen GSA:ta näkee Suomessa enemmän julkisten verkkopalveluiden hakukoneratkaisuna (esim. Helsingin yliopisto) kuin sisäisten intranet-tyyppisten ratkaisujen hakukonevaihtoehtona. Avoimen lähdekoodin ratkaisuista maininnan arvoinen hakukone on etenkin Lucene ja sen suosittu Solr-paketointi. Monet kotimaiset julkaisujärjestelmät esimerkiksi sisältävät Luceneen pohjautuvan hakukoneen, joten monella organisaatiolla on Suomessakin Lucene käytössään tietämättään. Lucenen Solr hakukone kuuluu myös varsin raskaan sarjan vaihtoehtoihin, joiden pystyttäminen jo pelkästään voi olla merkittävä projekti. Räätälöintimahdollisuuksien osalta Solria voi kuitenkin pitää yhtenä FASTin kilpailijana myös Suomessa. Avoimen lähdekoodin ratkaisuna Solr kuitenkin vaatii yleensä asiakkaalta enemmän osaamista ja perehtyneisyyttä, kun taustalta ei löydy selkeätä tukitahoa. Tästä syystä myös Solr tulee varsin harvoin vastaan FASTin kilpailijana Suomessa, vaikka se teknisesti varsin kyvykäs hakukonetuote onkin.

Maailmalla FASTin kanssa kilpailee eniten Autonomy IDOL, mutta IDOL on kovin harvinainen Suomessa ja paikallista läsnäoloa Suomessa ei kyseisellä toimittajalla ole ollut vuosiin. IDOL kuuluu myös raskaan sarjan hakukoneisiin, joiden pelkkä pystyttäminen voi olla useiden satojen tuhansien eurojen projekti. Maailmalta löytyy myös muita raskaamman sarjan pelureita, jotka ovat erikoistuneet tiettyihin ratkaisutyyppeihin, esimerkiksi verkkokauppahakuihin.

Tekstissä mainitut hakukoneet
Google GSA
Lucene Solr
Autonomy IDOL

Linkkejä FASTiin

Erillisellä FAST tuotteella toteutettuja hakuja

Lisätietoja Sinisen Meteoriitin palveluista

Kiinnostuitko? Ota yhteyttä!