• Intelligens keresés
  • szövegbányászat
  • agilis szoftverfejlesztés

Egy okos kereső életeket menthet

2017. december 5., kedd

Terrortámadás a Boston Marathonon

A Boston Marathon a világ legnagyobb múltú éves maraton futóversenye. A világ egyik legismertebb utcai versenyeként több mint harmincezer résztvevőt és több mint fél millió nézőt vonz évente – ezzel New England legnézettebb sporteseményének számít. 2013. április 13-án, a 117. maraton közben két nagy erejű bomba robbant több ezer, a Boylson út mentén álló néző között. Három személy azonnal életét vesztette, további 264 megsérült, akik közül többek végtagjait amputálni kellett. A halálesetek száma még magasabb lett volna, ha nem lett volna a helyszínen több egészségügyi szakember is. A robbantást a 26 éves Tamerlan Tsarnaev és testvére, a 19 éves Dzhokhar Tsarnaev hajtotta végre. Az elkövetőkről kiderült, hogy mindketten a radikális iszlám követői, akik az Al-Qaeda online magazinból tanulták meg, hogyan kell bombát készíteni. Miután elmenekültek a helyszínről, meggyilkoltak egy MIT rendőrt. Az intenzív hajszát és tűzharcot követően Tamerlant megölték, Dzhokhart letartóztatták. Tamerlant és egy másik társát később összefüggésbe hozták egy korábban megoldatlan hármas gyilkosság elkövetésével.

 

Hajsza a terroristák után

2011 márciusában az Orosz Szövetségi Biztonsági Szolgálat (FSB) ügynökei felvették a kapcsolatot az FBI-jal, és figyelmeztették amerikai kollégáikat, hogy Tamerlan Tsarnaev radikálissá vált és biztonsági kockázatot jelent. A megosztott információ igen részletes volt: a Tsarnaev család több tagjainak címét és telefonszámát is tartalmazta. Az oroszok továbbá arról tájékoztatták az amerikaiakat, hogy Tamerlan kapcsolatba került erőszakos iszlám szélsőségesekkel, köztük William Plotnikov-al, akit megöltek a dagestani harcok során.

A Bostoni Közös Terrorizmus elleni Erő (Boston Joint Terrorism Task Force, BJTF), a nyomozás során rögzítette az adatokat Tsarnaevról a vám- és határvédelmi (Customs and Border Protection, CBP) adatbázisba, amelyet Államkincstári Végrehajtó Kommunikációs Rendszernek (Treasury Enforcement Communications System, TECS) neveznek. Ez az adatbázis tulajdonképpen egy megfigyelési lista, amelynek az a célja, hogy minden egyes alkalommal riasszon, amikor Tamerlan belép az USA-ba vagy kilép az ország területéről. 2011 szeptemberében az FSV megkereste a CIA-t, hogy megismételje a figyelmeztetéseket, amelyeket korábban az FBI-nak küldött. A CIA megosztotta a kapott információt a Nemzeti Terror-elhárítási Központtal (National Counterterrorism Center, NCTC), és kezdeményezte, hogy vegyék fel a nevet a központi, az USA kormánya által kezelt adatbázisba, a Terrorista Azonosító Adatbank Környezetbe (Terrorist Identities Datamart Environment, TIDE). Ez az adatbázis 700 000 nevet tartalmaz és az USA kormánya által kezelt további megfigyelési listák forrásául szolgál, úgy mint a TECS; az FBI Terrorista Ellenőrző Adatbázisa (Terrorist Screening Database); vagy a Közlekedés-biztonsági Hivatal „nem repülhet” listája. Az utasítások, amelyeket felvettek az adatbázisba egyértelműek és kötelezőek voltak.

 

Probléma a névazonosítással

Ha Tamerlant elkapták volna a több ezer határátlépése során, akkor azonnal megállították és letartóztatták volna, amint megérkezett a New York-i JFK Nemzetközi Repülőtérre 2012 júliusában. Azonban semmilyen riasztás nem érkezett, mert a számítógépes rendszerek, amelyek a megfigyelési listákat ellenőrizték, nem tudták azonosítani Tamerlan nevét. Az ezt követő nyomozások során, sok megfigyelő, köztük Lindsey Graham szenátor is, a hiba okának a név elírását tartotta. A legtöbb modern számítógépes rendszer azonban, így a keresőmotorok is, képesek az elgépelésből adódó hibákat automatikusan kijavítani. Ha a shakspeer szóra keresünk például, a Google és a Bing is a Shakespeare kifejezésre ad találatot. Ha hasimoto-t gépelünk be, a hashimoto-ra kapunk találatot.

Sajnos a TECS és a TIDE kereskedelmi szoftvereket azonban úgy fejlesztették, hogy csak az angol neveket találják meg, mint például a Jones-t és a Smith-t. Abban az esetben, ha más nyelvekben előforduló nevekkel van dolgunk, több tízezer más karaktert használhatunk, amelyeknek nem mindig van közvetlen megfelelőjük az angol nyelvben. Ilyen például a csecsen eredetű Tsarnaev, amelyet Царна́ев-nek írnak, bár a különböző átírásoknak köszönhetően a Tsarnayev vagy a Carnáev is helyes alakok.
Hasonlóan a 富士田-hoz, amelyet Fujita-nak vagy Huzita-nak is írhatunk. Ezek az átírási alternatívák azonban rendkívül zavarók lehetnek egy olyan tisztviselő számára, aki csak angolul tud.

identity-resolution

Tamerlan Tsarnaev feltartóztatásának elmulasztása nem az első hiba, amelyet a CBP és NCTC számítógépes rendszerek idáig elkövettek. 2009 december 25-én ugyanezek a rendszerek engedélyezték, hogy Farouk Abdulmutallab felszálljon a 253-as észak-nyugati járatra egy oda útra szóló jeggyel a zsebében és egy nagy erejű robbanószerkezettel az alsóneműjében. A gép mind a háromszáz utasa meghalt volna, ha nincs egy éles szemű és bátor utas a szomszéd ülésen, aki visszatartotta Abdulmutallabot és megakadályozta, hogy élesítse a robbanószerkezetet. Abdulmutallab annak ellenére kapott engedélyt a beszállásra, hogy hat héttel előtte az NCTC felvitte a nevét a TIDE-ba. A kísérletet követően a Fehér Ház vizsgálata megállapította, hogy Abdulmutallab nevének elírásából kezdetben az következett, hogy az USA Külügyminisztériuma azt hitte, nincs érvényes amerikai vízuma.

Ki a hibás? A vámőr vagy a hírszerzési elemző, aki elírta a keresett személy nevét? Vagy a számítógépes rendszer, amely nem mutatta ki az egyezést?

 

Hatékony névazonosítás

A Basis Technology az ilyen és hasonló esetek elkerülése érdekében fejleszt szoftvereket és kínál hatékony megoldást a „nem-repülhet” listákra és a pénzügyi megfelelőséget figyelő listákra. Mivel a világ utazóinak neve több tucat nyelvből eredhet, a szoftver – azáltal, hogy képes ezeket a nyelveket felismerni – jelentősen megnöveli az automatizált figyelő listák ellenőrző rendszereinek pontosságát. A pontosság növelése pedig segíthet, hogy a következő Omar Farouk Abdulmutallabot megakadályozzák abban, hogy felszálljon a gépre, illetve a következő Tamerlan Tsarnaevet, hogy átlépje a határt.

Carl Hoffman, Basis CEO írása alapján

 

A Basis Technology szoftver megoldásokat kínál a szövegelemzés, az információ kinyerés, a számítástechnikai bűnüldözés és személyazonosság-meghatározás területén több mint negyven nyelven. RosetteA Rosette, amely az amerikai cég legfontosabb terméke, olyan nyelvészeti platform, amely széles körben használt, nagy teljesítményű és megbízható komponensekkel a keresést, az üzleti intelligenciát, a közösségi média felügyeletét, a pénzügyi megfelelősséget és más vállalati alkalmazást támogat. A Basis Technology nyelvészeti csapata az alkalmazott természetes nyelvfeldolgozás élén jár a statisztikai modellezés, a szakértői szabályok és a korpusz alapú adatok kombinációját használva. A vállalat kriminalisztikai területén úttörő munkát végeznek. Munkájuk célja, hogy a bűnügyi bizonyítékok elérhetővé váljanak, segítve ezzel a törvények végrehajtását és Egyesült Államok kormányát. A cég központja Cambridge-ben (Massachusetts) van, irodáik szerte a világban (Washingtonban, Londonban, Tel Avivban és Tokyoban) megtalálhatók. 

 

Cégünk, a Precognox a Basis Technology egyetlen magyarországi partnereként az amerikai cég által fejlesztett technológiák hivatalos viszonteladója és integrátora. További információért keressen bennünket az info@precognox.com e-mail címen, vagy a +36 20/8861391 telefonszámon.

A Precognox a hónap vállalkozása lett 2017 októberében

2017. október 25., szerda

Nagy megtiszteltetés számunkra, hogy 2017 októberében elnyertük a Nemzetgazdasági Minisztérium által kezdeményezett, "Díj a sikeres vállalkozásokért: A hónap kis- és közepes vállalata" díjat. Az elismerést, Varga Mihály miniszter úrtól, ügyvezetőnk, Jóföldi Endre vette át. 

Ügyvezetőnk a következőket mondta el a díjátadáson: "20 éve, amikor a Kandón végeztünk Kása Károly barátommal, cégalapító társammal, egyikünk sem gondolta, hogy céget fogunk alapítani. Nem volt világuralmi, mai szóval startupos ambíciónk. Azt szoktam mondani, mi kényszervállalkozóként kezdtük. Az ügyfeleink kényszerítettek, kezdjünk bele, mert szerették volna, hogy nekik dolgozzunk. 

A második, hogy cégünk működésének van egy fontos sajátossága. Somogy megyében, Kaposváron él és dolgozik kollégáink nagy része, velem együtt. A Dél-Dunántúlon, ami sajnos az EU 10. legszegényebb régiója,  egy olyan megyében, ahol mindössze 320 informatikával foglalkozó szakember van. Úgy látjuk, ott még nagyobb a hozzáadott értéke annak, amit létrehoztunk. Kaposvárról jutottunk el odáig, hogy például mára már két egyesült államokbeli cég is az ügyfelünk lehet. Úgy gondolom, az ilyen helyeken működő és magas hozzáadott értékű munkahelyeket létrehozó cégek még több támogatásra érdemesek. Ezért örülök annak, hogy városunk vezetése felkarolta kezdeményezésünket, hogy egy szoftverfejlesztő és oktatóközpont jöhessen hamarosan létre Kaposváron.

Végül hadd hozzak egy furcsa képet, ami újra és újra eszembe jut a saját életem és a vállalkozásunk kapcsán is. Egy teknőst fényképeztek le egy kerítésoszlop tetején. Rögtön eszünkbe jut a kérdés a képet látva: Hogy kerül egy teknős egy kerítésoszlop tetejére? Sok mindenre lehet találgatni, de egy biztos, nem a saját erejéből jutott odáig. Valaki odatette. Én is így érzem magam. Ahol most tartunk, nem csupán magunknak köszönhetjük. Mindenünk, amink van, úgy kaptuk: emberi értékeket a szüleinktől, támogatást a családunktól, tehetséget, képességet a Gondviselőtől, vagy a sorstól, ha valaki úgy gondolja. És aztán sok segítséget másoktól, kollégáinktól, akik most vagy korábban velünk együtt építették a vállalkozásunkat. Tudjuk, hogy eddig sem jutottunk volna el egyedül, és ami előttünk van, oda sem lehet egyedül eljutni. Ezért köszönöm kollégáim nevében is ezt az elismerést!" 

Az eseményről és a többi díjazottról részletesen beszámolót olvashatnak a Nemzetgazdasági Minisztérium oldalán illetve az MNO cikkében.

Mesterséges intelligencia segíti a Járókelőt

2017. szeptember 22., péntek

A Járókelő oldalára egyre több bejelentés érkezik, és szerencsére a bejelentésekkel foglalkozó szervezetek is egyre aktívabbak, ezért fontos számukra visszajelzést adni. Az oldalon régóta lehet értékelni a válaszokat hasznosságuk szerint, de egy-egy ügyre viszonylag kevés szavazat érkezik. Új fejlesztésünk lehetővé teszi, hogy azonnal visszacsatolást adjunk, ezzel is segítve az üggyel foglalkozókat.

Hogy tanult?

A Járókelőre beérkezett válaszok egy halmazát a Precognox annotátorai és a Járókelő önkéntesei értékelték. Ezt a tanító adathalmazt használtuk osztályozó algoritmusunk betanítására, ami a gépi tanulás során többek között arra figyel, hogy használt-e a válaszadó udvariassági formulákat, milyen gyorsan érkezett a válasz, mennyire hosszú az írás és mennyire bonyolult nyelvezetű.

Az osztályozás az élet része

Az osztályozás, vagy klasszifikáció az egyik leggyakoribb probléma manapság a marketingtől az egészségügyig az élet minden területén, hiszen az internetnek hála rengeteg adat ömlik mindenkire; emailek, cikkek, bejegyzések, válaszok, képek, stb. Az automatikus osztályozás előtt álló legnagyobb akadály általában az, hogy nincs megfelelő tanító adathalmaz, a második leggyakoribb nehézség az, hogy az egyes osztályokba tartozó már felcímkézett elemek száma nem kiegyenlített.

A Precognox egyedi megoldása az adatok felcímkézésének megtervezésétől, a megfelelő tanító adathalmaz kialakításán át a betanított algoritmus szoftveres szolgáltatásba ágyazásáig végig kíséri ezt a folyamatot.

Szívesen segítünk hasonló problémád megoldásában, ha van kérdésed, keress bennünket emailben vagy telefonon.

Segítünk, ha jobb névkeresésre van szükség

2017. szeptember 13., szerda

A Basis Technology együttműködő partnerei lettünk. Az amerikai cég ötvenöt nyelvet támogatva nyújt világszínvonalú technológiát szövegelemzési problémák megoldásához. Mostantól ezek a technológiák magyarországi projektekben is elérhetővé válnak cégünkön keresztül. A tavaly indult közös munka magasabb szinten folytatódik tovább, miután személyesen is bemutatkoztunk a tengerentúli cég munkatársainak, illetve egy kollégánk több hónapot kint töltött, hogy az együttműködést előkészítse. 

Kása Károly fejlesztési vezetőnk a Basis amerikai irodájában beszél cégünkről

A hír kapcsán ügyvezetőnk, Jóföldi Endre a Sonline újságírójával arról beszélgetett, milyen esetekben segíthetnek a hasonló szöveganalitikai szoftverek. Cégünk ügyvezetője így fogalmazott: „A bostoni maratonon robbantó merénylő rajta volt ugyan a veszélyes személyek listáján, de a neve másképpen volt írva, mint az útlevelében. Az amerikai partnercégnek viszont van egy névkereső programja, ami képes különböző írásmódok (és nyelvek, többek között arab, orosz és kínai esetében is) esetén is beazonosítani személyeket. Ha akkor már használta volna az amerikai határellenőrzési szerv a bostoniak szoftverét, elkerülhető lett volna a merénylet.” A teljes cikk a Sonline felületén olvasható.

Basis Cambridgebeli központjában

 

Idén is indult csapatunk a Deseda Ultramaratonon

2017. augusztus 22., kedd

Augusztus 12-13-án a III. Deseda Ultramaratonon részt vett 12 fős vegyes csapatunk. Ez Magyarország egyetlen 252 km-es (36 órás) futóversenye. A verseny útvonala a Deseda tó partján kialakított 14 km-es kerékpárúton halad, a táv 18 kör, mely 6 Maratonnak felel meg. Az úttest burkolata 12 km-en új aszfalt, 2 km-en erdei aprókavicsos út. Minden időjárási körülmény mellett jól futható. Az útvonal zömében sík, kettő komolyabb, de nem hosszú emelkedővel nehezítve. A távot futóink 24 óra 41 perc alatt teljesítették, ezzel a céges csapatok között a hetedik helyen végezve. 

Az időjárás kedvezően alakult a versenyt megelőző napok kánikulájához képest, a 25 Celsius fokos hőmérséklet kellemes futóidőnek bizonyult. Az idei versenyre egyedi pólóval is készültünk versenyzőink számára.

"A váltó tagjaként futottam le életem első fél maratoni távját, 22km-t. Bár a verseny előtti egyik hétvégén futottunk egy próbakört Ágiékkal, a versenyen úgy izgultam, hogy azt hittem, felmondják a szolgálatot a lábaim. De a kollégák biztatása, és az, ahogyan egymást motiváltuk, arra sarkallt, hogy minden erőmet összeszedjem a csapatért. Az első körnél csak az járt a fejemben, hogy hasonló jó időt fussak, mint Karesz, akit váltottam. Mikor meghallottam az időmet, nem akartam hinni a fülemnek. De talán még ennél is boldogabb voltam, amikor Gabi, a befutónk, rengeteget javítva az előző köridején, felbukkant az utolsó kilométeren és együtt futott célba az egész csapat.

A közös élmények, izgalmak és a futás iránti lelkesedés összekovácsolt minket. A 252. kilométer végén már azt tervezgettük, milyen stratégiával indulunk a jövő évi Desedán – természetesen ismét a Precognox színeiben." – Putz Orsolya

Tartalom átvétel

Tagságaink

NLP meetup NLP meetup
Language Technology Innovate
Nyelv- és Beszédtechnológiai Platform
Informatikai Vállalkozások Szövetsége (IVSZ)
Enterprise Europe Network
Információmenedzsment Innovációs Klaszter Információmenedzsment Innovációs Klaszter
Referenciák