• Intelligens keresés
  • szövegbányászat
  • agilis szoftverfejlesztés

InfoHarvester

A Precognox InfoHarvester egy irányított crawler, adatfeldolgozási és információkinyerő platform.
Az InfoHarvester web-en keresztül elérhető oldalakról strukturált és strukturálatlan adatokat tud gyűjteni, nagy mennyiségben tárolni majd lekérdezhetővé tenni azokat.

Képes a szöveges oldaltartalomból strukturált adatot kiemelni, majd a kiszedett adatokon transzformációkat végezve új adatokat létrehozni (szaknyelvben ETL - Extract Transform Load) és az adatokat információvá konvertálni.

A begyűjtött adatokat Hadoop cluster-ben vagy AWS-ben (Amazon Web Services) tárolja, így a biztonságosan megőrzött adatmennyiségnek és múltnak gyakorlati határa nincs ("big data" tárolási megoldás).

A Hadoop keretrendszer lehetővé teszi további elosztott feldolgozás végrehajtását (Map/Reduce), így az adatokból később is új információk nyerhetők, addig nem látható összefüggések tárhatók fel.

A Precognox Kft. saját szerver cluster-én is nyújt InfoHarvester szolgáltatást (SaaS). Így Ön beruházás nélkül, azonnal be tud lépni a "big data" világába. Az összegyűjtött adatoknak és a belőlük nyert információknak csak a képzelete szab határt.

Az InfoHarvester fő felépítése
Az InfoHarvester fő felépítése

InfoHarvester további tulajdonságai:

  • Ütemezhető az egyes weboldalak meglátogatási gyakorisága.

  • A rendszer státusza folyamatosan monitorozható. Hibafigyelés és riasztási rendszer segíti az üzemeltetést.

  • Akár negyed órányi gyakorisággal is lekérhető a rendszertől teljes, pillanatnyi állapot vagy az előző lekéréshez viszonyított változás az adatokban.

  • A szolgáltatás a Precognox kereső-vel kompatibilis, a legyűjtött adatok közvetlenül kereshetővé és szűrhetővé tehetők.

 

Adatbányászat szolgáltatás
Sokéves szövegbányászati és nyelvfeldolgozási tapasztalatunkra támaszkodva információvá fordítjuk az InfoHarvester alá töltött adatait. Nyelvész és data mining szakértőink és partnereink segítenek választ találni üzleti kérdéseire.

További információkért és ajánlatért vegye fel velünk a kapcsolatot!

Tagságaink

NLP meetup NLP meetup
Language Technology Innovate
Nyelv- és Beszédtechnológiai Platform
Informatikai Vállalkozások Szövetsége (IVSZ)
Enterprise Europe Network
Információmenedzsment Innovációs Klaszter Információmenedzsment Innovációs Klaszter
Referenciák