Et indblik i 26 Big Data-analytiske teknikker: Del 1

Et indblik i 26 Big Data-analytiske teknikker: Del 1

' Big Data ' er anvendelsen af ​​specialiserede teknikker og teknologier til at behandle meget store datasæt. Disse datasæt er ofte så store og komplekse, at det bliver vanskeligt at behandle ved hjælp af tilgængelige databasestyringsværktøjer.

Informationsteknologiens radikale vækst har ført til flere komplementære forhold i branchen. Et af de mest vedvarende og uden tvivl mest aktuelle resultater er tilstedeværelsen af ​​Big Data. Udtrykket Big Data er et slagord, der blev opfundet for at beskrive tilstedeværelsen af ​​enorme mængder data. Den resulterende effekt af at have en så enorm mængde data er Data Analytics.

Data Analytics er processen med at strukturere Big Data. Indenfor Big Data er der forskellige mønstre og sammenhænge, ​​der gør det muligt for dataanalyse at lave en bedre beregnet karakterisering af dataene. Dette gør dataanalyse til en af ​​de vigtigste dele af informationsteknologi.

Derfor oplister jeg her de 26 big data-analyseteknikker. Denne liste er på ingen måde udtømmende.

  1. A/B test

A/B-test er et vurderingsværktøj til at identificere, hvilken version af en webside eller en app, der hjælper en organisation eller enkeltperson med at nå et forretningsmål mere effektivt. Denne beslutning tages ved at sammenligne, hvilken version af noget der fungerer bedst. A/B-test bruges almindeligvis i webudvikling for at sikre, at ændringer af en webside eller sidekomponent er drevet af data og ikke personlig mening.

Det kaldes også spildtest eller spandtest.

Et indblik i 26 Big Data-analytiske teknikker: Del 1

Se også:  Big Data-gråområdet – hvad man må og ikke må

  1. Forening Regellæring

Et sæt teknikker til at opdage interessante relationer, dvs. "associeringsregler", blandt variabler i store databaser. Disse teknikker består af en række algoritmer til at generere og teste mulige regler.

En applikation er markedskurvanalyse, hvor en forhandler kan bestemme, hvilke produkter der ofte købes sammen og bruge disse oplysninger til markedsføring. (Et almindeligt nævnt eksempel er opdagelsen af, at mange supermarkedskøbere, der køber nachos, også køber øl.)

Et indblik i 26 Big Data-analytiske teknikker: Del 1

  1. Klassifikationstræanalyse

Statistisk klassifikation er en metode til at identificere kategorier, som en ny observation tilhører. Det kræver et træningssæt af korrekt identificerede observationer – historiske data med andre ord.

Statistisk klassifikation bruges til at:

  • Tildel automatisk dokumenter til kategorier
  • Kategoriser organismer i grupperinger
  • Udvikle profiler af studerende, der tager onlinekurser

Et indblik i 26 Big Data-analytiske teknikker: Del 1

  1. Klyngeanalyse

En statistisk metode til at klassificere objekter, der opdeler en forskelligartet gruppe i mindre grupper af lignende objekter, hvis lighedskarakteristika ikke er kendte på forhånd. Et eksempel på klyngeanalyse er segmentering af forbrugere i selv-lignende grupper til målrettet markedsføring. Anvendes til Data Mining.

  1. Crowdsourcing

I crowdsourcing er nuancen, at en opgave eller et job outsources, men ikke til en udpeget fagperson eller organisation, men til den brede offentlighed i form af et åbent opkald. Crowdsourcing er en teknik, der kan anvendes til at indsamle data fra forskellige kilder, såsom tekstbeskeder, sociale medieopdateringer, blogs osv. Dette er en form for massesamarbejde og et eksempel på brug af web.

  1. Datafusion og dataintegration

En proces på flere niveauer, der beskæftiger sig med association, korrelation, kombination af data og information fra enkelte og flere kilder for at opnå en raffineret position, identificere estimater og fuldstændige og rettidige vurderinger af situationer, trusler og deres betydning.

Datafusionsteknikker kombinerer data fra flere sensorer og relateret information fra tilknyttede databaser for at opnå forbedret nøjagtighed og mere specifikke slutninger, end der kunne opnås ved brug af en enkelt sensor alene.

Se også:  En begyndervejledning til Big Data Analytics

  1. Data Mining

Data mining er at sortere gennem data for at identificere mønstre og etablere relationer. Data mining er refereret til de kollektive dataekstraktionsteknikker, der udføres på store mængder data. Data mining-parametre inkluderer Association, Sekvensanalyse, klassificering, Clustering og Forecasting.

Applikationer omfatter udvinding af kundedata for at bestemme segmenter, der er mest tilbøjelige til at reagere på et tilbud, udvinding af menneskelige ressourcedata for at identificere karakteristika for de mest succesrige medarbejdere eller markedskurvanalyse for at modellere kundernes købsadfærd.

  1. Ensemble læring

Det er en kunst at kombinere forskellige sæt læringsalgoritmer for at improvisere om modellens stabilitet og forudsigelsesevne. Dette er en form for overvåget læring.

  1. Genetiske algoritmer

Optimeringsteknikker, der bruger processer som genetisk kombination, mutation og naturlig selektion i et design baseret på begreberne naturlig evolution. Genetiske algoritmer er teknikker, der bruges til at identificere de mest sete videoer, tv-shows og andre former for medier. Der er et evolutionært mønster, der kan gøres ved brug af genetiske algoritmer. Video- og medieanalyse kan udføres ved brug af genetiske algoritmer.

  1. Maskinelæring

Machine Learning er en anden teknik, der kan bruges til at kategorisere og bestemme det sandsynlige resultat af et specifikt sæt data. Machine Learning definerer en software, der kan være i stand til at bestemme de mulige udfald af et bestemt sæt begivenheder. Det bruges derfor i prædiktiv analyse. Et eksempel på prædiktiv analyse er sandsynlighed for at vinde retssager eller succes for visse produktioner.

  1. Naturlig sprogbehandling

Et sæt af teknikker fra et subspecial inden for datalogi (inden for et felt, der historisk kaldes "kunstig intelligens") og lingvistik, der bruger computeralgoritmer til at analysere menneskeligt (naturligt) sprog. Mange NLP-teknikker er typer af maskinlæring. En anvendelse af NLP er at bruge sentimentanalyse på sociale medier til at bestemme, hvordan potentielle kunder reagerer på en brandingkampagne.

  1. Neurale netværk

Ikke-lineære prædiktive modeller, der lærer gennem træning og ligner biologiske neurale netværk i struktur. De kan bruges til mønstergenkendelse og optimering. Nogle neurale netværksapplikationer involverer overvåget læring, og andre involverer uovervåget læring. Eksempler på applikationer omfatter identifikation af kunder af høj værdi, der er i risiko for at forlade en bestemt virksomhed, og identificering af svigagtige forsikringskrav.

Læs også:  40 overvældende fakta om Big Data

  1. Optimering

En portefølje af numeriske teknikker, der bruges til at omdesigne komplekse systemer og processer for at forbedre deres ydeevne i henhold til en eller flere objektive mål (f.eks. omkostninger, hastighed eller pålidelighed). Eksempler på applikationer omfatter forbedring af operationelle processer såsom planlægning, routing og gulvlayout og at træffe strategiske beslutninger såsom produktsortimentsstrategi, forbundet investeringsanalyse og F&U-porteføljestrategi. Genetiske algoritmer er et eksempel på en optimeringsteknik.

I min næste blog vil jeg beskrive de resterende 13 Big Data Analytics-teknikker.

Læs: Næste del af et indblik i 26 Big Data-analytiske teknikker


The Rise of Machines: Real World Applications of AI

The Rise of Machines: Real World Applications of AI

Kunstig intelligens er ikke i fremtiden, det er her lige i nuet I denne blog Læs, hvordan kunstig intelligens-applikationer har påvirket forskellige sektorer.

DDOS-angreb: et kort overblik

DDOS-angreb: et kort overblik

Er du også et offer for DDOS-angreb og forvirret over forebyggelsesmetoderne? Læs denne artikel for at løse dine spørgsmål.

Har du nogensinde spekuleret på, hvordan tjener hackere penge?

Har du nogensinde spekuleret på, hvordan tjener hackere penge?

Du har måske hørt, at hackere tjener mange penge, men har du nogensinde spekuleret på, hvordan tjener de den slags penge? lad os diskutere.

Revolutionære opfindelser fra Google, der vil gøre dit liv lettere.

Revolutionære opfindelser fra Google, der vil gøre dit liv lettere.

Vil du se revolutionerende opfindelser fra Google, og hvordan disse opfindelser ændrede livet for ethvert menneske i dag? Læs derefter til bloggen for at se opfindelser fra Google.

Fredag ​​Essential: Hvad skete der med AI-drevne biler?

Fredag ​​Essential: Hvad skete der med AI-drevne biler?

Konceptet med selvkørende biler til at køre på vejene ved hjælp af kunstig intelligens er en drøm, vi har haft i et stykke tid nu. Men på trods af flere løfter er de ingen steder at se. Læs denne blog for at lære mere...

Teknologisk singularitet: En fjern fremtid for menneskelig civilisation?

Teknologisk singularitet: En fjern fremtid for menneskelig civilisation?

Efterhånden som videnskaben udvikler sig i et hurtigt tempo og overtager en stor del af vores indsats, stiger risikoen for at udsætte os selv for en uforklarlig Singularitet. Læs, hvad singularitet kunne betyde for os.

Udvikling af datalagring – Infografik

Udvikling af datalagring – Infografik

Opbevaringsmetoderne for dataene har været under udvikling, kan være siden fødslen af ​​dataene. Denne blog dækker udviklingen af ​​datalagring på basis af en infografik.

Funktioner af Big Data Reference Architecture Layers

Funktioner af Big Data Reference Architecture Layers

Læs bloggen for at kende forskellige lag i Big Data-arkitekturen og deres funktionaliteter på den enkleste måde.

6 fantastiske fordele ved at have smarte hjemmeenheder i vores liv

6 fantastiske fordele ved at have smarte hjemmeenheder i vores liv

I denne digitalt drevne verden er smarte hjemmeenheder blevet en afgørende del af livet. Her er et par fantastiske fordele ved smarte hjemmeenheder om, hvordan de gør vores liv værd at leve og enklere.

macOS Catalina 10.15.4-tillægsopdatering forårsager flere problemer end at løse

macOS Catalina 10.15.4-tillægsopdatering forårsager flere problemer end at løse

For nylig udgav Apple macOS Catalina 10.15.4 en supplerende opdatering for at løse problemer, men det ser ud til, at opdateringen forårsager flere problemer, hvilket fører til mursten af ​​mac-maskiner. Læs denne artikel for at lære mere