• Intelligens keresés
  • szövegbányászat
  • agilis szoftverfejlesztés

CEU: Egy elégedett ügyfél visszajelzése

2014. április 23., szerda

 "A CEU MicroData a Közép-európai Egyetem oktatóiból, doktoranduszaiból és kutatói munkatársaiból álló csoport. Vállalati és egyéni adatokat elemzünk a gazdasági fejlődés, nemzetközi kereskedelem, a céges hálózatok, politikai kapcsolatok és korrupció jobb megértéséhez. 


A kozbeszerzes.ceu.hu webalkalmazásunkkal a közpénzek költését szeretnénk átláthatóbbá tenni. Az Open Data alapelvek jegyében könnyen kereshető, böngészhető és letölthető felületet építettünk az egyébként is nyilvános Közbeszerzési Értesítő hirdetményeinek.

A Közbeszerzési Értesítőben 1997 és 2013 között megjelent több mint 140.000 szöveges hirdetmény félig strukturált formában tartalmazza mindazt az információt, amire nekünk szükségünk volt, pl. a közbeszerzés kiíróját, nyertesét és összegét. A hirdetmények szerkezete ráadásul évről évre változik. Kis kutatócsoport lévén nem tudtuk mindezt rövid időn belül feldolgozni. Olyan céget kerestünk, amelyik rövid idő alatt és megadott adatminőségi kritériumokat teljesítve épít a szöveges dokumentumokból strukturált adatbázist. Így esett a választásunk a Precognox Kft-re.

Már a feladat specifikációja és a szerződéskötés során nagyon jó volt az együttműködés a Precognoxszal. Egy személyes igényfelmérés után közösen megterveztük a készülő adatbázis sémáját, az adatminőség ellenőrzésének módját, és az adatminőség mértékét. A dokumentumok egységes sémába rendezése után ugyanis több adatmező validálását kértük: összegek, dátumok, cégnevek, címek.

A pontosan határidőre elkészült program felülmúlta a várakozásainkat. Az egyes adatmezők pontossága 89-95 százalékos lett, vagyis egy százelemű véletlen mintában ennyiszer megegyezett az elemzőink által beírt érték azzal, amit a Precognox algoritmusa által talált és validált. Nem gondoltuk volna, hogy pusztán gépi feldolgozással ilyen mértékű pontosságot lehet elérni.

Későbbi kiegészítő kéréseinkre is igazi agilis csapatként, gyorsan és rugalmasan reagáltak. A továbbiakban is szívesen bízzuk meg őket hasonló feladattal."

Koren Miklós

A Közép-európai Egyetem tanára és az MTA KRTK kutatója. Kutatási területe a gazdasági növekedés és a nemzetközi kereskedelem. Tudományos eredményeit vezető nemzetközi folyóiratok publikálták. A külföldi tudásáramlásról szóló kutatását az Európai Kutatási Tanács támogatja. Munkatársaival együtt szerkeszti a defacto.iogazdasági információs oldalt és blogot. 

Tagságaink

NLP meetup NLP meetup
Language Technology Innovate
Nyelv- és Beszédtechnológiai Platform
Informatikai Vállalkozások Szövetsége (IVSZ)
Enterprise Europe Network
Információmenedzsment Innovációs Klaszter Információmenedzsment Innovációs Klaszter
Referenciák