' Big Data ' és l'aplicació de tècniques i tecnologies especialitzades per processar conjunts de dades molt grans. Aquests conjunts de dades sovint són tan grans i complexos que es fa difícil de processar amb eines de gestió de bases de dades disponibles.
El creixement radical de la tecnologia de la informació ha donat lloc a diverses condicions complementàries a la indústria. Un dels resultats més persistents i possiblement més presents, és la presència de Big Data. El terme Big Data és una frase que es va encunyar per descriure la presència de grans quantitats de dades. L'efecte resultant de tenir una quantitat tan gran de dades és l'anàlisi de dades.
Data Analytics és el procés d'estructuració de Big Data. Dins del Big Data, hi ha diferents patrons i correlacions que fan possible que l'anàlisi de dades faci una caracterització millor calculada de les dades. Això fa que l'anàlisi de dades sigui una de les parts més importants de la tecnologia de la informació.
Per tant, aquí estic enumerant les 26 tècniques d'anàlisi de big data. Aquesta llista no és de cap manera exhaustiva.
-
Prova A/B
Les proves A/B són una eina d'avaluació per identificar quina versió d'una pàgina web o d'una aplicació ajuda una organització o una persona a assolir un objectiu empresarial de manera més eficaç. Aquesta decisió es pren comparant quina versió d'alguna cosa funciona millor. Les proves A/B s'utilitzen habitualment en el desenvolupament web per assegurar-se que els canvis a una pàgina web o a un component de la pàgina es deriven de les dades i no de l'opinió personal.
També s'anomena prova de vessament o prova de cub.

Vegeu també: L'àrea grisa de Big Data: coses a fer i a no fer
-
Aprenentatge de les normes d'associació
Conjunt de tècniques per descobrir relacions interessants, és a dir, "regles d'associació", entre variables en grans bases de dades. Aquestes tècniques consisteixen en una varietat d'algorismes per generar i provar possibles regles.
Una aplicació és l'anàlisi de cistella de mercat, en la qual un minorista pot determinar quins productes es compren sovint junts i utilitzar aquesta informació per a la comercialització. (Un exemple citat habitualment és el descobriment que molts compradors de supermercats que compren nachos també compren cervesa).

-
Anàlisi de l'arbre de classificació
La classificació estadística és un mètode per identificar categories a les quals pertany una nova observació. Requereix un conjunt d'entrenament d'observacions identificades correctament, és a dir, dades històriques.
La classificació estadística s'utilitza per:
- Assigna automàticament documents a categories
- Classificar els organismes en grups
- Desenvolupar perfils dels estudiants que cursen cursos en línia

-
Anàlisi de clústers
Un mètode estadístic per classificar objectes que divideix un grup divers en grups més petits d'objectes similars, les característiques de semblança dels quals no es coneixen per endavant. Un exemple d'anàlisi de clústers és la segmentació dels consumidors en grups autosimilars per al màrqueting dirigit. S'utilitza per a la mineria de dades.
-
Crowdsourcing
En el crowdsourcing, el matís és que una tasca o un treball s'externalitza, però no a un professional o organització designat, sinó al públic en general en forma de convocatòria oberta. El crowdsourcing és una tècnica que es pot implementar per recopilar dades de diverses fonts, com ara missatges de text, actualitzacions de xarxes socials, blocs, etc. Aquest és un tipus de col·laboració massiva i una instància d'ús de la web.
-
Fusió de dades i integració de dades
Un procés multinivell que tracta de l'associació, correlació, combinació de dades i informació de fonts úniques i múltiples per aconseguir una posició refinada, identificar estimacions i valoracions completes i oportunes de situacions, amenaces i la seva importància.
Les tècniques de fusió de dades combinen dades de diversos sensors i informació relacionada de bases de dades associades per aconseguir una millor precisió i inferències més específiques de les que es podrien aconseguir amb l'ús d'un sol sensor.
Vegeu també: Una guia per a principiants a l'anàlisi de dades grans
-
Mineria de dades
La mineria de dades és ordenar les dades per identificar patrons i establir relacions. La mineria de dades es refereix a les tècniques d'extracció de dades col·lectives que es realitzen en un gran volum de dades. Els paràmetres de mineria de dades inclouen associació, anàlisi de seqüències, classificació, agrupació i previsió.
Les aplicacions inclouen l'extracció de dades de clients per determinar els segments amb més probabilitats de respondre a una oferta, l'extracció de dades de recursos humans per identificar les característiques dels empleats amb més èxit o l'anàlisi de cistella de mercat per modelar el comportament de compra dels clients.
-
Aprenentatge conjunt
És un art de combinar diversos conjunts d'algorismes d'aprenentatge per improvisar l'estabilitat i el poder predictiu del model. Aquest és un tipus d'aprenentatge supervisat.
-
Algoritmes genètics
Tècniques d'optimització que utilitzen processos com la combinació genètica, la mutació i la selecció natural en un disseny basat en els conceptes d'evolució natural. Els algorismes genètics són tècniques que s'utilitzen per identificar els vídeos, programes de televisió i altres mitjans de comunicació més vists. Hi ha un patró evolutiu que es pot fer mitjançant l'ús d'algoritmes genètics. L'anàlisi de vídeo i mitjans es pot fer mitjançant l'ús d'algoritmes genètics.
-
Aprenentatge automàtic
L'aprenentatge automàtic és una altra tècnica que es pot utilitzar per classificar i determinar el resultat probable d'un conjunt específic de dades. L'aprenentatge automàtic defineix un programari que pot determinar els possibles resultats d'un determinat conjunt d'esdeveniments. Per tant, s'utilitza en anàlisi predictiva. Un exemple d'anàlisi predictiva és la probabilitat de guanyar casos legals o l'èxit de determinades produccions.
-
Processament del llenguatge natural
Conjunt de tècniques d'una subespecialitat de la informàtica (dins d'un camp històricament anomenat "intel·ligència artificial") i lingüística que utilitza algorismes informàtics per analitzar el llenguatge humà (natural). Moltes tècniques de PNL són tipus d'aprenentatge automàtic. Una aplicació de PNL utilitza l'anàlisi de sentiments a les xarxes socials per determinar com reaccionen els clients potencials a una campanya de marca.
-
Xarxes neuronals
Models predictius no lineals que aprenen mitjançant l'entrenament i s'assemblen a les xarxes neuronals biològiques en l'estructura. Es poden utilitzar per al reconeixement i optimització de patrons. Algunes aplicacions de xarxes neuronals impliquen aprenentatge supervisat i d'altres impliquen aprenentatge no supervisat. Alguns exemples d'aplicacions inclouen la identificació de clients de gran valor que corren el risc d'abandonar una empresa determinada i la identificació de reclamacions d'assegurances fraudulentes.
Llegiu també: 40 fets al·lucinants sobre Big Data
-
Optimització
Una cartera de tècniques numèriques utilitzades per redissenyar sistemes i processos complexos per millorar-ne el rendiment segons una o més mesures objectives (per exemple, cost, velocitat o fiabilitat). Alguns exemples d'aplicacions inclouen la millora de processos operatius com ara la programació, l'encaminament i el disseny de la planta, i la presa de decisions estratègiques com l'estratègia de la gamma de productes, l'anàlisi d'inversions vinculades i l'estratègia de cartera d'R+D. Els algorismes genètics són un exemple de tècnica d'optimització.
Al meu proper bloc, descriuria les 13 tècniques d'anàlisi de Big Data restants.
Llegeix: Següent part d'una visió de 26 tècniques d'anàlisi de Big Data