Hogyan elemezhetünk és vizualizálhatunk interneten elérhető adatokat a Power BI-ban?

, Precognox

A Power BI – mint a Microsoft Business Intelligence eszköze – adatbázisok részletes elemzését és látványos vizualizációját teszi lehetővé. Ezzel, a ma már igen elterjedt eszközzel az esetek nagy részében a vállalati struktúrán belül elérhető adatokat elemezzük.
A Precognox által fejlesztett TAS Data Collector használatával azonban mostantól már lehetségessé válik a külső, interneten elérhető adatok felhasználása is a Power BI alkalmazáson belül.

Hogyan? Ezt mutatjuk be most lépésről-lépésre.

1. Az adott weboldal (mint adatforrás) kiválasztása, tartalmának letöltése

, Precognox

A kiválasztott webes adatokat (példánkban a Keresővilág Blog weboldal tartalmát mutatjuk) első lépésben a Data Collector szolgáltatás segítségével letöltjük. A weben található strukturálatlan adatok (szöveges tartalmak) esetében a letöltés mellé azonban számos feladat (adattisztítás, validálás) társul, melyeket szakembereink végeznek el. Ezen munkafolyamatok megvalósulásának eredményeképpen a letöltött adatokból strukturált adatbázis jön létre, melyet a későbbiekben is folyamatosan frissítünk, így mindig az aktuális adatok válnak elérhetővé és felhasználhatóvá.
A letöltött adatokhoz egy biztonságos, jelszóval védett csatornán keresztül kap hozzáférést (server adatot, felhasználónevet és jelszót) a felhasználó.

2. Az adatok betöltése a Power BI kezelőfelületén az Get Data / More… menüpontra, majd a MySQL database és a Connect gombra kattintva lehetséges

, Precognox

A tőlünk kapott Server és Database adatok megadása, majd OK gombra kattintás

, Precognox

Itt kell megadni a felhasználónevet és a jelszót, amelyeket tőlünk kap meg, majd a Connect gombra történő kattintás következik

, Precognox

3. Az adatbázis kiválasztása, utána betöltése a Load gombra történő kattintással

, Precognox

4. Az adatok betöltése után következhet azok kezelése és vizualizációja a megszokott módon

, Precognox

Példa az elkészült vizualizációra

Az elkészült vizualizáció amellett, hogy betekintést nyújt a webes forrás tartalmába, komoly üzleti előnyt is jelent hiszen prezentációk, üzleti jelentések, értékelések vagy akár konkurenciaelemzések alapjául is szolgálhat. Ily módon aknázható ki az Interneten található hatalmas adatmennyiségben rejlő potenciál.

A TAS Data Collector által biztosított strukturált adatbázisok – az integrációnak köszönhetően – a legtöbb ismert business intelligence eszközzel (Tableau, RapidMiner, Google Data Studio, IBM SPSS) vizualizálhatók.

A Data Collector működéséről és előnyeiről a TAS Text Analytics System oldalán olvashat bővebben.

Képek: Microsoft Power BI kezelőfelület és vizualizáció