A sikeres vállalati adatgyűjtéstől az intelligens keresésig

adatgyűjtés, Precognox

Egy vállalkozás sikerességét alapvetően meghatározza a cégen belüli folyamatok hatékonysága. A vállalati adatvagyon megfelelő kiaknázása pedig az egyik olyan terület, amely kiemelten fontos, ezért a naprakész információk elérhetőségét a legmagasabb színvonalon kell biztosítani. Ennek eléréséhez egy olyan összetett rendszert kell megvalósítani, amely az adatgyűjtéstől a vállalati keresésig a teljes folyamatot lefedi. Hogyan is épül fel egy ilyen rendszer?

Vállalati adatgyűjtés, a folyamat alapja

A vállalati adatgyűjtés alatt a céges adatvagyon összegyűjtését értjük. Honnan is származhatnak a céges adatok? Ezek lehetnek felhőben, dokumentumkezelőben tárolt fájlok, levelező kliensekben lévő emailek, vállalatirányítási- és CRM rendszerekben elérhető adatok, de akár a világhálón található információk. Ezek mind-mind képezhetik a céges adatvagyont, függetlenül attól, hogy éppen milyen formátumban állnak rendelkezésre. Mindezek összegyűjtése az első lépés ahhoz, hogy az információk elérhetőek legyenek és kereshetővé váljanak. Természetesen a gyűjtési folyamat ismétlődő, annak gyakorisága az egyedi igényekhez igazítható. Emellett több beépített kontrolling metódus is biztosítja, hogy a folyamat veszteségek nélkül valósuljon meg.

Adatgyűjtés világszínvonalon

A világhálóról származó tartalmak is képezhetik a vállalati adatvagyon részét, illetve alapjául szolgálhatnak olyan világszínvonalú projekteknek, mint a közbeszerzési adatokkal foglalkozó DIGIWHIST. Az ilyen jellegű internetes tartalmak gyűjtésére szolgáló megoldás a TAS Data Collector.

Az adatgyűjtéshez szervesen hozzátartoznak olyan folyamatok is, amelyek elengedhetetlenek a kívánt eredmény eléréséhez, ilyenek többek között az adattisztítás vagy a validálás. Az adattisztítás során strukturálatlan adatokból készítünk strukturált adatokat. Ennek segítségével könnyen kereshetővé, szűrhetővé válik az adat. A folyamatnak része az adatgyűjtés során keletkezett hibák, duplikációk kiszűrése, a különböző dátumformátumok egységesítése. A validálás során az adott adatokra vonatkozó, egyedi szabályrendszer alapján tudjuk megjelölni, hogy mely rekordok feldolgozhatók, és melyeket kell elvetni.

Keresőmotor

A vállalati keresésre specializálódott keresők, mint a Precognox által fejlesztett TAS Vállalati kereső, olyan nyílt forrású megoldásokra építkeznek, mint az Elasticsearch. Az Elasticsearch egy elosztott, ingyenes és nyílt kereső- és elemzőmotor minden típusú adathoz, beleértve a szöveges, numerikus, térbeli, strukturált és strukturálatlan adatokat. Az Elasticsearch az Apache Lucene-re épül, és először 2010-ben adta ki az Elasticsearch N.V. (ma Elastic néven ismert). Az egyszerű REST API-jairól, elosztott jellegéről, sebességéről és skálázhatóságáról ismert Elasticsearch az Elastic Stack központi eleme, amely az adatok bevitelére, dúsítására, tárolására, elemzésére és vizualizálására szolgáló ingyenes és nyílt eszközökből áll (ELK Stack – Elasticsearch, Logstash és Kibana).

 

Intelligens keresés

Ahhoz, hogy egy keresési folyamatot valóban intelligensnek nevezhessünk, egy sor olyan fejlett megoldás integrálására is szükség van, amelyek a gépi tanulás, a mesterséges intelligencia, a nyelvészet és a természetes nyelvfeldolgozás területéhez tartoznak.
Az entitásfelismerés- és kinyerés, a fejlett névazonosítás, a keresési loganalízis, a tezaurusz használata egytől-egyig hozzájárulnak ahhoz, hogy a vállalati keresés a leghatékonyabban valósulhasson meg és a legmagasabb színvonalon biztosítsa a felhasználók által elvárt működést.