Analýza dát: Na čom skutočne záleží? < Blog Emark

Analýza dát je spravidla považovaná za metódu vyhodnocovania výsledkov. Je to spôsobené širokou dostupnosťou atraktívnych vizualizačných nástrojov, ktoré možno použiť na jednoduché grafické zobrazenie údajov. Na čom však záleží predovšetkým, je storytelling. Ďalšia podstatná vec je asociatívnosť dát. Ak chceme čo i len uvažovať o pokročilej analytike, predikciách, data miningu alebo zdieľaní s partnermi, toto sú veci, bez ktorých sa nepohneme.

Ak rozumiem prúdeniu dát, znamená to, že som schopný zlepšiť procesy, pretože dnešné procesy sú dáta. Ak napríklad obchodný manažér zadá do systému CRM nesprávnu kategóriu, dostanem nesprávny výsledok. Ponúka sa analýza dát a výsledkov späť k zdroju, vďaka ktorej môžem navrhnúť bezpečnostné opatrenia a automatizáciu, ktorá zlepší celý proces pre všetkých – zdvihne kvalitu našich interakcií s kolegami, zákazníkmi, dodávateľmi alebo partnermi.  

Možnosť vyhodnotiť celý data flow od začiatku je ďalšou BI funkcionalitou, ktorá by si zaslúžila inovovať vo väčšom rozsahu. Vďaka tomu dokážeme z dát ešte lepšie vydestilovať hodnotu (nielen samotné výsledky) a premeniť ich vo väčšej miere na aktíva. 

 

Data flow 

 

Vezmime si napríklad náš výpočet čistého výnosu (pozri video s fiktívnymi údajmi) – kalkulácia vyžaduje šesť krokov a čiastkové výsledky každého kroku sa môžu radikálne líšiť. Konsolidujeme medzipodnikové, združené náklady, čistíme a kategorizujeme zdrojové údaje, ktoré musia byť aktuálne a prístupné z účtu s dostatočnými právami. Ak každý, koho tieto hodnoty zaujímajú, pozná tento tok, vytvára to dôveru v dáta, čo následne podporuje ich používanie. 

 

 

Asociativita dát 

Každý GB údajov, ktoré vytvoríme a uložíme, niečo stojí a v ideálnom prípade by sme z nich chceli vytvoriť viac než len jednorazovú hodnotu – urobiť z nich aktívum. Keďže produkujeme viac údajov, tlak na inovácie v oblasti BI je vysoký. 

Od čias, keď som pred 16 rokmi pracoval na svojom prvom projekte dátovej analýzy, sa veľa zmenilo, hlavne čo sa týka výkonu a používateľského zážitku. Keď premýšľam o trendoch a inováciách, rád sa držím ďalej od pretechnizovaných tém a zameriavam sa skôr na princípy. 

Prvým princípom/výzvou, ktorú vidím pre inovácie v oblasti BI, je lepšia asociatívnosť údajov. Mám na mysli schopnosť asociovať (alebo spájať/zlučovať) dva alebo viac súborov údajov bez ohľadu na formát (čísla, dátumy, reťazce…) alebo rozsah (stovky alebo miliardy riadkov). Znie to jednoducho, ale riešenie nekonzistencií pri jednom datasete môže zdržať projekt na dni alebo týždne ak ich potrebujete vyriešiť desiatky alebo stovky. 

Každý dataset sa stáva oveľa cennejším, ak sa dá prepojiť s iným. Jedným z mega-generátorov údajov bude napríklad internet vecí. Len jeden senzor, ktorý posiela údaje každú minútu, nám poskytne približne pol milióna záznamov ročne. Teraz si predstavte tisíc senzorov, ktoré posielajú údaje každú sekundu. Ak poznáme referenciu (limit alebo referenčnú hodnotu), potom nám stačí aktuálna hodnota, možno posledný deň, aby sme si všimli trend. Takže 99+ % týchto údajov by sme mohli ignorovať ako irelevantné. To sa dramaticky zmení, keď ich spojíme napr. so servisnými údajmi, a nemyslím tým redukčné spojenie. Skutočné spojenie zachová všetky hodnoty v oboch súboroch údajov a odhalí existujúce aj neexistujúce vzťahy. A práve táto šedá zóna je často najzaujímavejšia. 

 

 

Ak chceme uvažovať o pokročilej analytike, predikciách, dolovaní údajov alebo zdieľaní s obchodnými partnermi, kľúčovú úlohu zohráva asociatívnosť údajov. Ak nám BI pomôže lepšie asociovať súbory dát, budeme môcť rýchlejšie predvídať vývoj podnikania a zmierňovať riziká. 

 

Čo prinesie budúcnosť 

 

Narazil som na štatistiku objemu dát, ktorý sa meria v zettabajtoch. Je to jedna miliarda terabajtov alebo približne jeden bilión gigabajtov. Celkové číslo je pre väčšinu z nás samozrejme veľmi virtuálne, ale pozorovaný trend je veľmi reálny a predpovedá, že do roku 2025 sa objem dát zdvojnásobí. 

 

Čo bude hnacou silou tohto nárastu? Podľa toho, čo som čítal/počul: 

  1. ľudia = chceme údaje, o všetkom; všimol som si akési všeobecné povedomie, že údaje vás robia informovanejšími a prinášajú vám pohodlie; 
  2. spoločnosti chcú (polo)automatizovať väčšinu svojich procesov, a tak vytvárajú nielen transakčné údaje, ale aj množstvo záznamov o používaní, stave systému a udalostiach; 
  3. zákazníci, dodávatelia a ďalší obchodní partneri očakávajú, že s nimi budeme zdieľať relevantné údaje, aby sme zefektívnili procesy (a to nielen vtedy, keď im posielame faktúry); 
  4. masívne sa zavádzajú technológie generujúce údaje > internet vecí, 5G, IPV6, Web3 a dokonca aj neslávne známy blockchain; 
  5. viac a rýchlejších údajov znamená vyššiu zraniteľnosť, čím sa zvyšuje potreba vytvárať viac údajov o údajoch = metadáta. 

 

Aká je teda výzva? Nuž, hádam generovanie každého GB niečo stojí a v ideálnom prípade by sme chceli, aby to vytváralo viac ako jednorázovú hodnotu = aby sa stalo aktívom. Väčšina vytvorených údajov sa však neuchováva alebo sa na ne jednoducho zabudne a len menšia časť zvyšných sa využíva na analýzu dát. To zvyšuje tlak na inovácie v oblasti BI, pretože bez nich sa rozdiel v hodnote údajov bude len zväčšovať. 

 

 

 

Analýza dát: Na čom skutočne záleží?, Blog Emark

 

AUTOR: RADOVAN ORESKY

Prečítajte si aj moje ďalšie blogy: blog.emarkanalytics.com/author/radovan-oresky/

 

Zdieľanie príspevku

Odomknite príbeh, ktorý v sebe ukrývajú vaše dáta

Chcem vedieť viac