Big Data:
Når det kommer til Big data. Så bliver der produceret gastronomisk mængde data på ingen tid. Op mod 90% af alt data i hele verden der er til rådighed i dag er blevet lavet inden for de sidste 2 år. Big data bliver defineret ved at datamængden er så stor at man ikke kan analysere det, med konventionelle metoder. Man bliver ved at finde nye måder at analysere dataen og der er hele tiden nye ting man skal tage i mente når man udvikler værktøjer til at håndtere dataen. Hvis man skal forstå hvad Big data er bliver man nødt til at nedbryde det til 5 hovedet punkter, de 5 V’er: Velocity, Volume, Value, Variety og Veracity.
Velocity:
Velocity oversat til dansk er hastighed så er det jo indlysende at der er tale om hastigheden af hvor hurtigt dataen bliver produceret samt hvor hurtigt det bliver indsamlet og analyseret. Mængden af mails, opslag på de sociale medier, billeder og youtube videoer som folk laver, stiger så hurtigt at hvis man lave nogle værktøjer til at håndterer den data som vi har nu ville de ende med at være nyttesløse inden for et par år måske endda om nogle måneder.
Volume:
Volume oversat er mængde og så snakker man om mængden af data der bliver produceret hvert sekund fra alle social medier, telefoner og alle ens kort som har en chip i. Mængden af den data der bliver produceret gør at man ikke kan opbevare dataen på normale måder man opbevarer data på. Normalt ville man opbevare dataen i en database hvor at alle harddiskene man data på ville være et sted. Nu blive man nød til at opbevare det flere forskellige steder og bruge software til at samle det når man skal bruge det.
Value:
Value er værdien af den data man har indsamlet. Meget af den data der bliver produceret er ubrugelig. Når man har en masse data som har værdi så sælger nogle virksomheder dataen til andre virksomheder som bruger det til kommercielt brug for øje.
Variety:
Variety er variationen af dataen som vi kan bruge til noget. Der er det strukturerede data som er ting som navne, telefon nummer, adresse og ens finansielle ståsted. Det meste af vores data er ubrugelig det vil sige at 80% af alt vores data. Der kommer ny teknologi som kan strukturerer al dataen så man kan bruge den.
Veracity:
Veracity er kvaliteten af dataen samt om dataen er præcis nok til at være troværdig nok til at blive brugt. Noget der kan påvirke data det vil være at man er i en by og så kan GPS data nogen gange være ret upræcis, da satellitten kan have svært ved at lokaliserer din telefon.
Alle store websites:
Alle store websites som amazon, ebay, aliexpress, new york times og tv2. De alle har en del data i bare hvem, hvor, hvornår og hvor lang tid folk er på deres side. Nogen af dem ville også kunne samle info om hvad man har købt og derved kunne lave en masse forslag ud fra hvem man er som shopper. Altså om man er en der køber computer delene eller om man er en som køber tøj eller ting til bilen. Firmaer som Amazon, Ebay og Aliexpress som er nogle af verdens største online markedspladser får også noget data som ens adresse, telefonnummer og kortoplysninger.
Det er en vigtig info som er struktureret data. Noget af dataen er noget som man vil kunne bruge til noget kommercielt både på deres egen platform men også sælge det videre til andre platforme som hjemmesider som har med statistik eller online marketing.
Alle kender det med at man sidder og kigger på et produkt på nettet og så lidt efter så får man reklamer for selvsamme produkt alle steder man ikke har adblock på. Det er jo fordi at de sælger ens data til hinanden. Så hvis man tænker over at de arbejder sammen så er det en vanvittig forretning. Fordi at de sætter jo reklamerne der for at du vil ende med at købe deres produkt. Over tid vil ens underbevidsthed jo få en til at købe fordi at man måske går og tænker på om man burde købe den.
Der er noget data som man ikke lovligt må dele såsom, ens kort oplysninger, nemid cpr-nummer m.m. Da man kan lave identitetstyveri med nogle af de oplysninger. Det skal lige siges at det er grunden til at man har billede id.