Deri më tani, në bloget e mia për Big Data , ju kam njohur me aspekte të ndryshme të Big Data, nga ajo që do të thotë në fakt deri te faktet, të bësh dhe të mos bësh. Në blogun e mëparshëm pamë disa teknika të analizës së të dhënave të mëdha. Duke e çuar listën më tej në këtë blog.
	- Njohja e modelit
 
Njohja e modelit është një degë e mësimit të makinerive që fokusohet në njohjen e modeleve dhe rregullsive në të dhëna, megjithëse në disa raste konsiderohet të jetë pothuajse sinonim i mësimit të makinës. Sistemet e njohjes së modelit në shumë raste trajnohen nga të dhënat e etiketuara të "trajnimit" (të mësuarit e mbikëqyrur), por kur nuk ka të dhëna të etiketuara të disponueshme, algoritme të tjera mund të përdoren për të zbuluar modele të panjohura më parë (të mësuarit e pambikëqyrur).
	- Modelimi parashikues
 
Analitika parashikuese përfshin një sërë teknikash që parashikojnë rezultatet e ardhshme bazuar në të dhënat historike dhe aktuale. Në praktikë, analitika parashikuese mund të zbatohet në pothuajse të gjitha disiplinat - nga parashikimi i dështimit të motorëve reaktiv bazuar në rrjedhën e të dhënave nga disa mijëra sensorë, deri te parashikimi i lëvizjeve të ardhshme të klientëve bazuar në atë që blejnë, kur blejnë dhe madje edhe çfarë. thonë ata në rrjetet sociale. Teknikat e analitikës parashikuese bazohen kryesisht në metoda statistikore.
Shihni gjithashtu:  Një udhëzues fillestar për analitikën e të dhënave të mëdha
	- Analiza e regresionit
 
Kjo është një teknikë që merr përdorimin e variablave të pavarur dhe se si ato ndikojnë në variablat e varur. Kjo mund të jetë një teknikë shumë e dobishme në përcaktimin e analizave të mediave sociale si probabiliteti për të gjetur dashurinë në një platformë interneti.
	- Analiza e ndjenjave
 
Analiza e ndjenjave i ndihmon studiuesit të përcaktojnë ndjenjat e folësve ose shkrimtarëve në lidhje me një temë. Analiza e ndjenjave po përdoret për të ndihmuar:
	- Përmirësoni shërbimin në një zinxhir hotelesh duke analizuar komentet e mysafirëve.
 
	- Personalizojini stimujt dhe shërbimet për të adresuar atë që klientët kërkojnë në të vërtetë.
 
	- Përcaktoni se çfarë mendojnë vërtet konsumatorët bazuar në opinionet nga mediat sociale.
 
	- Përpunimi i sinjalit
 
Përpunimi i sinjalit është një teknologji mundësuese që përfshin teorinë themelore, aplikacionet, algoritmet dhe implementimet e përpunimit ose transferimit të informacionit të përmbajtur në shumë formate të ndryshme fizike, simbolike ose abstrakte të përcaktuara gjerësisht si sinjale . Ai përdor përfaqësime matematikore, statistikore, llogaritëse, heuristike dhe gjuhësore, formalizma dhe teknika për përfaqësim, modelim, analizë, sintezë, zbulim, rikuperim, ndjeshmëri, përvetësim, nxjerrje, mësim, siguri ose mjekësi ligjore. Aplikacionet e mostrës përfshijnë modelimin për analizën e serive kohore ose zbatimin e bashkimit të të dhënave për të përcaktuar një lexim më të saktë duke kombinuar të dhëna nga një grup burimesh të dhënash më pak të sakta (dmth, nxjerrjen e sinjalit nga zhurma).
	- Analiza Hapësinore
 
Analiza hapësinore është procesi me të cilin ne i kthejmë të dhënat e papërpunuara në informacion të dobishëm. Është procesi i ekzaminimit të vendndodhjeve, atributeve dhe marrëdhënieve të veçorive në të dhënat hapësinore përmes mbivendosjes dhe teknikave të tjera analitike me qëllim që të adresohet një pyetje ose të fitohet njohuri e dobishme. Analiza hapësinore nxjerr ose krijon informacion të ri nga të dhënat hapësinore.
	- Statistikat
 
Në statistika, analiza e të dhënave eksploruese është një qasje për të analizuar grupet e të dhënave për të përmbledhur karakteristikat e tyre kryesore, shpesh me metoda vizuale. Një model statistikor mund të përdoret ose jo, por kryesisht EDA është për të parë se çfarë mund të na tregojnë të dhënat përtej modelimit formal ose detyrës së testimit të hipotezave. Teknikat statistikore përdoren gjithashtu për të reduktuar gjasat e gabimeve të tipit I ("pozitive false") dhe gabimeve të tipit II ("negativë të rremë"). Një shembull i një aplikacioni është testimi A/B për të përcaktuar se cilat lloje të materialit të marketingut do të rrisin më shumë të ardhurat.
Shihni gjithashtu:  40 fakte mbresëlënëse rreth të dhënave të mëdha
	- Mësimi i mbikëqyrur
 
Mësimi i mbikëqyrur është detyra e të mësuarit të makinës për të nxjerrë një funksion nga të dhënat e etiketuara të trajnimit. Të dhënat e trajnimit përbëhen nga një grup shembujsh trajnimi . Në mësimin e mbikëqyrur, çdo shembull është një çift i përbërë nga një objekt hyrës (zakonisht një vektor) dhe një vlerë dalëse e dëshiruar (e quajtur edhe sinjali mbikëqyrës ). Një algoritëm i mbikëqyrur i të mësuarit analizon të dhënat e trajnimit dhe prodhon një funksion të konkluduar, i cili mund të përdoret për hartimin e shembujve të rinj.
	- Analiza e rrjeteve sociale
 
Analiza e rrjeteve sociale është një teknikë që u përdor fillimisht në industrinë e telekomunikacionit, dhe më pas u miratua shpejt nga sociologët për të studiuar marrëdhëniet ndërpersonale. Tani po aplikohet për të analizuar marrëdhëniet midis njerëzve në shumë fusha dhe aktivitete tregtare. Nyjet përfaqësojnë individë brenda një rrjeti, ndërsa lidhjet përfaqësojnë marrëdhëniet midis individëve.
	- Simulimi
 
Modelimi i sjelljes së sistemeve komplekse, të përdorura shpesh për parashikimin, parashikimin dhe planifikimin e skenarëve. Simulimet e Monte Carlo-s, për shembull, janë një klasë algoritmesh që mbështeten në kampionimin e përsëritur të rastësishëm, dmth. në ekzekutimin e mijëra simulimeve, secila bazuar në supozime të ndryshme. Rezultati është një histogram që jep një shpërndarje probabiliteti të rezultateve. Një aplikim është vlerësimi i gjasave për të përmbushur objektivat financiarë duke pasur parasysh pasiguritë në lidhje me suksesin e iniciativave të ndryshme
	- Analiza e serive kohore
 
Analiza e serive kohore përfshin metoda për analizimin e të dhënave të serive kohore në mënyrë që të nxirren statistika domethënëse dhe karakteristika të tjera të të dhënave. Të dhënat e serive kohore shpesh lindin kur monitorohen proceset industriale ose gjurmohen metrikat e biznesit të korporatës. Analiza e serive kohore merr parasysh faktin se pikat e të dhënave të marra me kalimin e kohës mund të kenë një strukturë të brendshme (si autokorrelacioni, trendi ose ndryshimi sezonal) që duhet të merret parasysh. Shembuj të analizave të serive kohore përfshijnë vlerën për orë të një indeksi të tregut të aksioneve ose numrin e pacientëve të diagnostikuar me një gjendje të caktuar çdo ditë.
	- Mësimi i pambikëqyrur
 
Mësimi i pambikëqyrur është detyra e mësimit të makinës për të nxjerrë një funksion për të përshkruar strukturën e fshehur nga të dhënat e paetiketuara. Meqenëse shembujt që i janë dhënë nxënësit nuk janë të etiketuar, nuk ka asnjë sinjal gabimi ose shpërblimi për të vlerësuar një zgjidhje të mundshme – kjo e dallon mësimin e pambikëqyrur nga mësimi i mbikëqyrur dhe të mësuarit përforcues.

Megjithatë, mësimi i pambikëqyrur përfshin gjithashtu shumë teknika të tjera që kërkojnë të përmbledhin dhe shpjegojnë tiparet kryesore të të dhënave.
	- Vizualizimi
 
Vizualizimi i të dhënave është përgatitja e të dhënave në një format piktorik ose grafik. Ai u mundëson vendimmarrësve të shohin analitikën e paraqitur vizualisht, në mënyrë që ata të kuptojnë koncepte të vështira ose të identifikojnë modele të reja. Me vizualizimin interaktiv, ju mund ta çoni konceptin një hap më tej duke përdorur teknologjinë për t'u futur në grafikët dhe grafikët për më shumë detaje, duke ndryshuar në mënyrë interaktive të dhënat që shihni dhe si përpunohen.
konkluzioni 
Analiza e të dhënave të mëdha ka qenë një nga përparimet më të rëndësishme në industrinë e teknologjisë së informacionit. Në fakt, Big Data ka treguar rëndësinë dhe nevojën e saj pothuajse në të gjithë sektorët dhe në të gjitha departamentet e atyre industrive. Nuk ka asnjë aspekt të jetës që nuk është prekur nga Big Data, madje as jeta jonë personale. Prandaj, ne kemi nevojë për Big Data Analytics për të menaxhuar me efikasitet këtë sasi të madhe të të dhënave.
Siç u tha më parë, kjo listë nuk është shteruese. Studiuesit janë ende duke eksperimentuar në mënyra të reja për të analizuar këto sasi të mëdha të dhënash, të cilat janë të pranishme në forma të ndryshme, shpejtësia e gjenerimit të të cilave po rritet me kalimin e kohës për të nxjerrë vlera për përdorimet tona specifike.