Et indblik i 26 Big Data-analytiske teknikker: Del 2

Et indblik i 26 Big Data-analytiske teknikker: Del 2

Indtil nu har jeg i mine blogs om Big Data stiftet bekendtskab med forskellige aspekter af Big Data, fra hvad det faktisk betyder til fakta og hvad der må og ikke må af det. I den forrige blog så vi nogle Big Data Analytics-teknikker. Tag listen videre i denne blog.

  1. Mønster genkendelse

Mønstergenkendelse er en gren af ​​maskinlæring, der fokuserer på genkendelse af mønstre og regelmæssigheder i data, selvom det i nogle tilfælde anses for at være næsten synonymt med maskinlæring. Mønstergenkendelsessystemer trænes i mange tilfælde ud fra mærkede "trænings"-data (overvåget læring), men når der ikke er mærkede data tilgængelige, kan andre algoritmer bruges til at opdage hidtil ukendte mønstre (uovervåget læring).

  1. Prædiktiv modellering

Prediktiv analyse omfatter en række forskellige teknikker, der forudsiger fremtidige resultater baseret på historiske og aktuelle data. I praksis kan prædiktiv analyse anvendes på næsten alle discipliner – fra at forudsige fejl i jetmotorer baseret på datastrømmen fra flere tusinde sensorer til at forudsige kundernes næste træk baseret på, hvad de køber, hvornår de køber, og endda hvad siger de på sociale medier. Prediktive analyseteknikker er primært baseret på statistiske metoder.

Se også:  En begyndervejledning til Big Data Analytics

  1. Regressions analyse

Dette er en teknik, der tager brugen af ​​uafhængige variabler og hvordan de påvirker afhængige variable. Dette kan være en meget nyttig teknik til at bestemme sociale medieanalyser som sandsynligheden for at finde kærligheden over en internetplatform.

  1. Følelsesanalyse

Følelsesanalyse hjælper forskere med at bestemme talers eller forfatteres følelser med hensyn til et emne. Følelsesanalyse bruges til at hjælpe:

  • Forbedre servicen hos en hotelkæde ved at analysere gæstekommentarer.
  • Tilpas incitamenter og tjenester for at imødekomme det, kunderne virkelig efterspørger.
  • Bestem, hvad forbrugerne virkelig tænker, baseret på udtalelser fra sociale medier.
  1. Signalbehandling

Signalbehandling er en muliggørende teknologi, der omfatter den grundlæggende teori, applikationer, algoritmer og implementeringer af behandling eller overførsel af information indeholdt i mange forskellige fysiske, symbolske eller abstrakte formater, bredt betegnet som signaler . Den bruger matematiske, statistiske, beregningsmæssige, heuristiske og sproglige repræsentationer, formalismer og teknikker til repræsentation, modellering, analyse, syntese, opdagelse, gendannelse, sansning, erhvervelse, udvinding, læring, sikkerhed eller efterforskning. Eksempelapplikationer omfatter modellering til tidsserieanalyse eller implementering af datafusion for at bestemme en mere præcis aflæsning ved at kombinere data fra et sæt mindre præcise datakilder (dvs. at udtrække signalet fra støjen).

  1. Rumlig Analyse

Rumlig analyse er den proces, hvorved vi omdanner rå data til nyttig information. Det er processen med at undersøge placeringer, attributter og relationer mellem funktioner i rumlige data gennem overlejring og andre analytiske teknikker for at løse et spørgsmål eller få nyttig viden. Rumlig analyse udtrækker eller skaber ny information fra rumlige data.

  1. Statistikker

I statistik er eksplorativ dataanalyse en tilgang til at analysere datasæt for at opsummere deres vigtigste karakteristika, ofte med visuelle metoder. En statistisk model kan bruges eller ej, men primært er EDA til at se, hvad dataene kan fortælle os ud over den formelle modellerings- eller hypotesetestopgave. Statistiske teknikker bruges også til at reducere sandsynligheden for type I-fejl ("falske positive") og type II-fejl ("falske negative"). Et eksempel på en applikation er A/B-test for at bestemme, hvilke typer marketingmateriale der vil øge omsætningen mest.

Se også:  40 overvældende fakta om Big Data

  1. Superviseret læring

Overvåget læring er maskinlæringsopgaven med at udlede en funktion fra mærkede træningsdata. Træningsdataene består af et sæt træningseksempler . I overvåget læring er hvert eksempel et par bestående af et inputobjekt (typisk en vektor) og en ønsket udgangsværdi (også kaldet supervisionssignalet ). En overvåget læringsalgoritme analyserer træningsdataene og producerer en udledt funktion, som kan bruges til at kortlægge nye eksempler.

  1. Social netværksanalyse

Social netværksanalyse er en teknik, der først blev brugt i telekommunikationsindustrien, og derefter hurtigt adopteret af sociologer for at studere interpersonelle forhold. Det bruges nu til at analysere forholdet mellem mennesker på mange områder og kommercielle aktiviteter. Noder repræsenterer individer inden for et netværk, mens bånd repræsenterer relationerne mellem individerne.

  1. Simulering

Modellering af komplekse systemers adfærd, ofte brugt til prognoser, forudsigelse og scenarieplanlægning. Monte Carlo-simuleringer, for eksempel, er en klasse af algoritmer, der er afhængige af gentagne tilfældige stikprøver, dvs. at køre tusindvis af simuleringer, hver baseret på forskellige antagelser. Resultatet er et histogram, der giver en sandsynlighedsfordeling af udfald. Den ene ansøgning er at vurdere sandsynligheden for at nå de økonomiske mål givet usikkerhed om forskellige initiativers succes

  1. Tidsserieanalyse

Tidsserieanalyse omfatter metoder til at analysere tidsseriedata for at udtrække meningsfuld statistik og andre karakteristika ved dataene. Tidsseriedata opstår ofte, når man overvåger industrielle processer eller sporer virksomhedens forretningsmålinger. Tidsserieanalyse tager højde for det faktum, at datapunkter taget over tid kan have en intern struktur (såsom autokorrelation, trend eller sæsonvariation), der skal tages højde for. Eksempler på tidsserieanalyse omfatter timeværdien af ​​et aktiemarkedsindeks eller antallet af patienter, der diagnosticeres med en given tilstand hver dag.

  1. Uovervåget læring

Uovervåget læring er maskinlæringsopgaven med at udlede en funktion til at beskrive skjult struktur fra umærkede data. Da eksemplerne givet til den lærende er umærkede, er der intet fejl- eller belønningssignal til at evaluere en potentiel løsning – dette adskiller uovervåget læring fra overvåget læring og forstærkende læring.

Et indblik i 26 Big Data-analytiske teknikker: Del 2

Imidlertid omfatter uovervåget læring også mange andre teknikker, der søger at opsummere og forklare nøgletræk ved dataene.

  1. Visualisering

Datavisualisering er udarbejdelse af data i et billed- eller grafisk format. Det gør det muligt for beslutningstagere at se analyser præsenteret visuelt, så de kan forstå vanskelige koncepter eller identificere nye mønstre. Med interaktiv visualisering kan du tage konceptet et skridt videre ved at bruge teknologi til at bore ned i diagrammer og grafer for flere detaljer, og interaktivt ændre, hvilke data du ser, og hvordan de behandles.

Konklusion

Big data-analyse har været et af de vigtigste gennembrud i informationsteknologiindustrien. Faktisk har Big Data vist sin betydning og behov næsten i alle sektorer og i alle afdelinger af disse industrier. Der er ikke et eneste aspekt af livet, som ikke er blevet påvirket af Big Data, ikke engang vores personlige liv. Derfor har vi brug for Big Data Analytics til at administrere disse enorme mængder data effektivt.

Som sagt før er denne liste ikke udtømmende. Forskere eksperimenterer stadig med nye måder at analysere disse enorme mængder af data på, som er til stede i en række forskellige former, hvis genereringshastighed stiger med tiden for at udlede værdier for vores specifikke anvendelser.


The Rise of Machines: Real World Applications of AI

The Rise of Machines: Real World Applications of AI

Kunstig intelligens er ikke i fremtiden, det er her lige i nuet I denne blog Læs, hvordan kunstig intelligens-applikationer har påvirket forskellige sektorer.

DDOS-angreb: et kort overblik

DDOS-angreb: et kort overblik

Er du også et offer for DDOS-angreb og forvirret over forebyggelsesmetoderne? Læs denne artikel for at løse dine spørgsmål.

Har du nogensinde spekuleret på, hvordan tjener hackere penge?

Har du nogensinde spekuleret på, hvordan tjener hackere penge?

Du har måske hørt, at hackere tjener mange penge, men har du nogensinde spekuleret på, hvordan tjener de den slags penge? lad os diskutere.

Revolutionære opfindelser fra Google, der vil gøre dit liv lettere.

Revolutionære opfindelser fra Google, der vil gøre dit liv lettere.

Vil du se revolutionerende opfindelser fra Google, og hvordan disse opfindelser ændrede livet for ethvert menneske i dag? Læs derefter til bloggen for at se opfindelser fra Google.

Fredag ​​Essential: Hvad skete der med AI-drevne biler?

Fredag ​​Essential: Hvad skete der med AI-drevne biler?

Konceptet med selvkørende biler til at køre på vejene ved hjælp af kunstig intelligens er en drøm, vi har haft i et stykke tid nu. Men på trods af flere løfter er de ingen steder at se. Læs denne blog for at lære mere...

Teknologisk singularitet: En fjern fremtid for menneskelig civilisation?

Teknologisk singularitet: En fjern fremtid for menneskelig civilisation?

Efterhånden som videnskaben udvikler sig i et hurtigt tempo og overtager en stor del af vores indsats, stiger risikoen for at udsætte os selv for en uforklarlig Singularitet. Læs, hvad singularitet kunne betyde for os.

Udvikling af datalagring – Infografik

Udvikling af datalagring – Infografik

Opbevaringsmetoderne for dataene har været under udvikling, kan være siden fødslen af ​​dataene. Denne blog dækker udviklingen af ​​datalagring på basis af en infografik.

Funktioner af Big Data Reference Architecture Layers

Funktioner af Big Data Reference Architecture Layers

Læs bloggen for at kende forskellige lag i Big Data-arkitekturen og deres funktionaliteter på den enkleste måde.

6 fantastiske fordele ved at have smarte hjemmeenheder i vores liv

6 fantastiske fordele ved at have smarte hjemmeenheder i vores liv

I denne digitalt drevne verden er smarte hjemmeenheder blevet en afgørende del af livet. Her er et par fantastiske fordele ved smarte hjemmeenheder om, hvordan de gør vores liv værd at leve og enklere.

macOS Catalina 10.15.4-tillægsopdatering forårsager flere problemer end at løse

macOS Catalina 10.15.4-tillægsopdatering forårsager flere problemer end at løse

For nylig udgav Apple macOS Catalina 10.15.4 en supplerende opdatering for at løse problemer, men det ser ud til, at opdateringen forårsager flere problemer, hvilket fører til mursten af ​​mac-maskiner. Læs denne artikel for at lære mere