Fins ara, als meus blogs sobre Big Data , t'he familiaritzat amb diferents aspectes de Big Data, des del que realment significa fins a fets i coses a fer i no fer-ho. Al bloc anterior vam veure algunes Tècniques d'anàlisi de Big Data. Portant la llista més enllà en aquest bloc.
- Reconeixement de patró
El reconeixement de patrons és una branca de l'aprenentatge automàtic que se centra en el reconeixement de patrons i regularitats de les dades, encara que en alguns casos es considera gairebé sinònim d'aprenentatge automàtic. Els sistemes de reconeixement de patrons s'entrenen en molts casos a partir de dades etiquetades de "entrenament" (aprenentatge supervisat), però quan no hi ha dades etiquetades disponibles es poden utilitzar altres algorismes per descobrir patrons desconeguts anteriorment (aprenentatge no supervisat).
- Modelatge predictiu
L'anàlisi predictiva inclou una varietat de tècniques que prediuen resultats futurs basant-se en dades històriques i actuals. A la pràctica, l'anàlisi predictiva es pot aplicar a gairebé totes les disciplines, des de predir la fallada dels motors a reacció basant-se en el flux de dades de diversos milers de sensors, fins a predir els propers moviments dels clients en funció del que compren, quan compren i fins i tot què diuen a les xarxes socials. Les tècniques d'anàlisi predictiva es basen principalment en mètodes estadístics.
Vegeu també: Una guia per a principiants a l'anàlisi de dades grans
- Anàlisi de regressió
Aquesta és una tècnica que pren l'ús de variables independents i com afecten les variables dependents. Aquesta pot ser una tècnica molt útil per determinar l'anàlisi de les xarxes socials com la probabilitat de trobar l'amor a través d'una plataforma d'Internet.
- Anàlisi de sentiments
L'anàlisi de sentiments ajuda els investigadors a determinar els sentiments dels parlants o escriptors respecte a un tema. L'anàlisi de sentiments s'utilitza per ajudar:
- Milloreu el servei en una cadena hotelera mitjançant l'anàlisi dels comentaris dels clients.
- Personalitzeu els incentius i els serveis per respondre al que realment demanen els clients.
- Determineu què pensen realment els consumidors a partir de les opinions de les xarxes socials.
- Processament del senyal
El processament de senyals és una tecnologia habilitadora que engloba la teoria fonamental, les aplicacions, els algorismes i les implementacions de processament o transferència d'informació continguda en molts formats físics, simbòlics o abstractes diferents, designats àmpliament com a senyals . Utilitza representacions, formalismes i tècniques matemàtiques, estadístiques, computacionals, heurístiques i lingüístiques per a la representació, modelització, anàlisi, síntesi, descobriment, recuperació, detecció, adquisició, extracció, aprenentatge, seguretat o forense. Les aplicacions de mostra inclouen el modelatge per a l'anàlisi de sèries temporals o la implementació de la fusió de dades per determinar una lectura més precisa combinant dades d'un conjunt de fonts de dades menys precises (és a dir, extreure el senyal del soroll).
- Anàlisi espacial
L'anàlisi espacial és el procés pel qual convertim les dades en brut en informació útil. És el procés d'examinar les ubicacions, els atributs i les relacions de les característiques de les dades espacials mitjançant la superposició i altres tècniques analítiques per abordar una pregunta o obtenir coneixements útils. L'anàlisi espacial extreu o crea nova informació a partir de dades espacials.
- Estadístiques
En estadística, l'anàlisi exploratòria de dades és un enfocament per analitzar conjunts de dades per resumir les seves característiques principals, sovint amb mètodes visuals. Es pot utilitzar o no un model estadístic, però principalment l'EDA serveix per veure què ens poden dir les dades més enllà de la tasca de modelatge formal o de prova d'hipòtesis. També s'utilitzen tècniques estadístiques per reduir la probabilitat d'errors de tipus I ("falsos positius") i errors de tipus II ("falsos negatius"). Un exemple d'aplicació són les proves A/B per determinar quins tipus de material de màrqueting augmentaran més els ingressos.
Vegeu també: 40 fets al·lucinants sobre Big Data
- Aprenentatge supervisat
L'aprenentatge supervisat és la tasca d'aprenentatge automàtic d'inferir una funció a partir de dades d'entrenament etiquetades. Les dades d'entrenament consisteixen en un conjunt d' exemples d' entrenament . En l'aprenentatge supervisat, cada exemple és un parell format per un objecte d'entrada (normalment un vector) i un valor de sortida desitjat (també anomenat senyal de supervisió ). Un algorisme d'aprenentatge supervisat analitza les dades d'entrenament i produeix una funció inferida, que es pot utilitzar per mapejar nous exemples.
- Anàlisi de xarxes socials
L'anàlisi de xarxes socials és una tècnica que es va utilitzar primer a la indústria de les telecomunicacions, i que després els sociòlegs van adoptar ràpidament per estudiar les relacions interpersonals. Ara s'està aplicant per analitzar les relacions entre persones en molts àmbits i activitats comercials. Els nodes representen individus dins d'una xarxa, mentre que els llaços representen les relacions entre els individus.
- Simulació
Modelització del comportament de sistemes complexos, sovint utilitzats per a la previsió, la predicció i la planificació d'escenaris. Les simulacions de Montecarlo, per exemple, són una classe d'algorismes que es basen en mostres aleatòries repetides, és a dir, executant milers de simulacions, cadascuna basada en supòsits diferents. El resultat és un histograma que ofereix una distribució de probabilitat dels resultats. Una aplicació està avaluant la probabilitat d'assolir els objectius financers donades les incerteses sobre l'èxit de diverses iniciatives
- Anàlisi de sèries temporals
L'anàlisi de sèries temporals inclou mètodes per analitzar dades de sèries temporals per extreure estadístiques significatives i altres característiques de les dades. Sovint, les dades de sèries temporals sorgeixen quan es fan el seguiment dels processos industrials o el seguiment de mètriques empresarials corporatives. L'anàlisi de sèries temporals té en compte el fet que els punts de dades pres al llarg del temps poden tenir una estructura interna (com ara autocorrelació, tendència o variació estacional) que s'hauria de tenir en compte. Alguns exemples d'anàlisi de sèries temporals inclouen el valor horari d'un índex de borsa o el nombre de pacients diagnosticats amb una determinada condició cada dia.
- Aprenentatge no supervisat
L'aprenentatge no supervisat és la tasca d'aprenentatge automàtic d'inferir una funció per descriure l'estructura oculta a partir de dades sense etiquetar. Com que els exemples que es donen a l'alumne no estan etiquetats, no hi ha cap senyal d'error o recompensa per avaluar una solució potencial; això distingeix l'aprenentatge no supervisat de l'aprenentatge supervisat i l'aprenentatge de reforç.

Tanmateix, l'aprenentatge no supervisat també inclou moltes altres tècniques que pretenen resumir i explicar les característiques clau de les dades.
- Visualització
La visualització de dades és la preparació de dades en un format pictòric o gràfic. Permet als responsables de la presa de decisions veure les analítiques presentades visualment, de manera que puguin comprendre conceptes difícils o identificar nous patrons. Amb la visualització interactiva, podeu fer un pas més enllà del concepte utilitzant la tecnologia per aprofundir en gràfics i gràfics per obtenir més detalls, canviant de manera interactiva les dades que veieu i com es processen.
Conclusió
L'anàlisi de big data ha estat un dels avenços més importants de la indústria de les tecnologies de la informació. De fet, el Big Data ha demostrat la seva importància i necessitat pràcticament en tots els sectors, i en tots els departaments d'aquestes indústries. No hi ha un sol aspecte de la vida que no s'hagi vist afectat pel Big Data, ni tan sols les nostres vides personals. Per tant, necessitem Big Data Analytics per gestionar aquestes grans quantitats de dades de manera eficient.
Com s'ha dit abans, aquesta llista no és exhaustiva. Els investigadors encara estan experimentant noves maneres d'analitzar aquestes grans quantitats de dades que estan presents en una varietat de formes la velocitat de generació de les quals augmenta amb el temps per obtenir valors per als nostres usos específics.