• Intelligens keresés
  • szövegbányászat
  • agilis szoftverfejlesztés

NLP és termékfejlesztés előadás @ CEU MicroData

2014. november 21., péntek

CEU MicroData kutatócsoport ebédjén vett részt Varjú Zoltán számítógépes nyelvész kollégánk, ahol a termékfejlesztés és az NLP kérdéseiről beszéltek. A csoporttal nagyon élveztük a közös munkát a kozbeszerzes.ceu.hu mögötti adatbázis elkészítésén, és vendégei voltak a szeptemberi meetupunknak is.

Az általuk jegyzett Defacto blogot minden, a köz ügyei iránt érdeklődő olvasónknak ajánljuk. Fejlesztői blogjukat pythonisták és programozók fogják örömmel olvasni.

Országos számítógép-alkalmazói versenyt szponzorálta a Precognox

2014. május 20., kedd

Mivel nagyobb fejlesztő irodánk Kaposváron található, így természetes, hogy cégünk is szponzorálta az országos számítógép-alkalmazói versenyt, melyet a kaposvári Táncsis Mihály Gimnáziumban rendeztek meg az Arany János Tehetséggondozó Programban részt vevő tanulók számára.

A verseny célja: a számítógép-használatban jártas diákok tudásának, ügyességének összemérése, találkozás az ország más területein tanulókkal, tanítókkal, tapasztalataink kicserélése.

A versenyről bővebben.

Gratulálunk az idei győzteseknek!

Adom az adóm címmel

2014. április 24., csütörtök

CEU: Egy elégedett ügyfél visszajelzése

2014. április 23., szerda

 "A CEU MicroData a Közép-európai Egyetem oktatóiból, doktoranduszaiból és kutatói munkatársaiból álló csoport. Vállalati és egyéni adatokat elemzünk a gazdasági fejlődés, nemzetközi kereskedelem, a céges hálózatok, politikai kapcsolatok és korrupció jobb megértéséhez. 


A kozbeszerzes.ceu.hu webalkalmazásunkkal a közpénzek költését szeretnénk átláthatóbbá tenni. Az Open Data alapelvek jegyében könnyen kereshető, böngészhető és letölthető felületet építettünk az egyébként is nyilvános Közbeszerzési Értesítő hirdetményeinek.

A Közbeszerzési Értesítőben 1997 és 2013 között megjelent több mint 140.000 szöveges hirdetmény félig strukturált formában tartalmazza mindazt az információt, amire nekünk szükségünk volt, pl. a közbeszerzés kiíróját, nyertesét és összegét. A hirdetmények szerkezete ráadásul évről évre változik. Kis kutatócsoport lévén nem tudtuk mindezt rövid időn belül feldolgozni. Olyan céget kerestünk, amelyik rövid idő alatt és megadott adatminőségi kritériumokat teljesítve épít a szöveges dokumentumokból strukturált adatbázist. Így esett a választásunk a Precognox Kft-re.

Már a feladat specifikációja és a szerződéskötés során nagyon jó volt az együttműködés a Precognoxszal. Egy személyes igényfelmérés után közösen megterveztük a készülő adatbázis sémáját, az adatminőség ellenőrzésének módját, és az adatminőség mértékét. A dokumentumok egységes sémába rendezése után ugyanis több adatmező validálását kértük: összegek, dátumok, cégnevek, címek.

"A pontosan határidőre elkészült program felülmúlta a várakozásainkat. Az egyes adatmezők pontossága 89-95 százalékos lett, vagyis egy százelemű véletlen mintában ennyiszer megegyezett az elemzőink által beírt érték azzal, amit a Precognox algoritmusa által talált és validált. Nem gondoltuk volna, hogy pusztán gépi feldolgozással ilyen mértékű pontosságot lehet elérni.

Későbbi kiegészítő kéréseinkre is igazi agilis csapatként, gyorsan és rugalmasan reagáltak. A továbbiakban is szívesen bízzuk meg őket hasonló feladattal."

Koren Miklós

A Közép-európai Egyetem tanára és az MTA KRTK kutatója. Kutatási területe a gazdasági növekedés és a nemzetközi kereskedelem. Tudományos eredményeit vezető nemzetközi folyóiratok publikálták. A külföldi tudásáramlásról szóló kutatását az Európai Kutatási Tanács támogatja. Munkatársaival együtt szerkeszti a defacto.iogazdasági információs oldalt és blogot. 

Elindult a kozbeszerzes.ceu.hu oldal

2014. március 25., kedd

A CEU Department of Economics Koren Miklós és Szeidl Ádám által vezetett CEU Microdata kutatócsoportja elindította a kozbeszerzes.ceu.hu oldalt, ami a magyar közbeszerzési hirdetményeket teszi egyszerűen kereshetővé és elemezhetővé. A közbeszerzési hirdetmények sajnos strukturálatlan szöveges fájlok formájában kerülnek nyilvánosságra, ezek feldolgozását cégünk, a Precognox Kft. végezte.Büszkék vagyunk arra, hogy magyar kutatók nemzetközileg is elismert munkáját segíthetjük.

Az adatok segítségével már most nagyon érdekes dolgokra derült fényt, pl. egy, az Indexen olvasható cikkben számoltak be arról, hogy a mindenki által sejtett közbeszerzési mutyi empirikusan is kimutatható. Maga az oldal egyszerű, könnyen kezelhető, nagyon hamar megismerhető. Akik szeretnék az adatokat letölteni, azok akár programmatikusan is megtehetik ezt, hiszen mindenkit arra ösztönöznek az üzemeltetők, hogy vigye magával robotját is az oldalra. A CEU Microdata csoporttól további izgalmas projektek várhatóak még, melyeket izgatottan várunk. Sok sikert kívánunk a csapatnak!

A téma visszhangja az interneten: 

Bebizonyítjuk a közbeszerzési mutyit
Elindult a kozbeszerzes.ceu.hu oldala
Közbeszerzés: tényleg a mutyi melegágya !

 

Tartalom átvétel

Tagságaink

NLP meetup NLP meetup
Language Technology Innovate
Nyelv- és Beszédtechnológiai Platform
Informatikai Vállalkozások Szövetsége (IVSZ)
Enterprise Europe Network
Információmenedzsment Innovációs Klaszter Információmenedzsment Innovációs Klaszter
Referenciák