Innsýn í 26 stóra gagnagreiningartækni: 2. hluti

Innsýn í 26 stóra gagnagreiningartækni: 2. hluti

Hingað til í bloggum mínum um Big Data hef ég kynnt þér mismunandi hliðar Big Data, allt frá Hvað það þýðir í raun og veru til staðreynda og gera og ekki má. Í fyrra bloggi sáum við nokkrar Big Data Analytics tækni. Tek listann lengra í þessu bloggi.

  1. Mynsturþekking

Mynsturþekking er grein vélanáms sem einblínir á viðurkenningu á mynstrum og reglulegum gögnum, þó að það sé í sumum tilfellum talið vera næstum samheiti við vélanám. Mynsturþekkingarkerfi eru í mörgum tilfellum þjálfuð út frá merktum „þjálfunar“gögnum (stýrt nám), en þegar engin merkt gögn eru tiltæk er hægt að nota önnur reiknirit til að uppgötva áður óþekkt mynstur (nám án eftirlits).

  1. Forspárlíkön

Forspárgreining samanstendur af margvíslegum aðferðum sem spá fyrir um framtíðarniðurstöður byggðar á sögulegum og núverandi gögnum. Í reynd er hægt að beita forspárgreiningu á næstum allar greinar - allt frá því að spá fyrir um bilun þotuhreyfla út frá straumi gagna frá nokkur þúsund skynjara, til að spá fyrir um næstu hreyfingar viðskiptavina út frá því hvað þeir kaupa, hvenær þeir kaupa og jafnvel hvað segja þeir á samfélagsmiðlum. Forspárgreiningartækni byggir fyrst og fremst á tölfræðilegum aðferðum.

Sjá einnig:  Byrjendaleiðbeiningar um Big Data Analytics

  1. Aðhvarfsgreining

Þetta er tækni sem tekur notkun óháðra breyta og hvernig þær hafa áhrif á háðar breytur. Þetta getur verið mjög gagnleg tækni við að ákvarða greiningar á samfélagsmiðlum eins og líkurnar á að finna ást á netvettvangi.

  1. Viðhorfsgreining

Viðhorfsgreining hjálpar vísindamönnum að ákvarða viðhorf ræðumanna eða rithöfunda með tilliti til efnis. Viðhorfsgreining er notuð til að hjálpa:

  • Bættu þjónustu hjá hótelkeðju með því að greina athugasemdir gesta.
  • Sérsníddu hvata og þjónustu til að takast á við það sem viðskiptavinir eru í raun að biðja um.
  • Ákveða hvað neytendur hugsa í raun út frá skoðunum frá samfélagsmiðlum.
  1. Merkjavinnsla

Merkjavinnsla er tækni sem gerir kleift að ná yfir grundvallarkenningar, forrit, reiknirit og útfærslur á vinnslu eða flutningi upplýsinga sem eru á mörgum mismunandi líkamlegum, táknrænum eða óhlutbundnum sniðum sem almennt eru tilnefnd sem merki . Það notar stærðfræðilega, tölfræðilega, reiknifræðilega, heuristic og málfræðilega framsetningu, formalisma og tækni fyrir framsetningu, líkanagerð, greiningu, myndun, uppgötvun, bata, skynjun, öflun, útdrátt, nám, öryggi eða réttarfræði. Dæmi um forrit fela í sér líkanagerð fyrir tímaraðargreiningu eða innleiðingu gagnasamruna til að ákvarða nákvæmari lestur með því að sameina gögn úr safni minna nákvæmra gagnagjafa (þ.e. draga merkið úr hávaða).

  1. Staðbundin greining

Staðbundin greining er ferlið þar sem við breytum hráum gögnum í gagnlegar upplýsingar. Það er ferlið við að skoða staðsetningar, eiginleika og tengsl eiginleika í staðbundnum gögnum með yfirlögn og annarri greiningartækni til að svara spurningu eða öðlast gagnlega þekkingu. Landfræðileg greining dregur út eða býr til nýjar upplýsingar úr landgögnum.

  1. Tölfræði

Í tölfræði er könnunargagnagreining aðferð til að greina gagnasöfn til að draga saman helstu einkenni þeirra, oft með sjónrænum aðferðum. Tölfræðilegt líkan er hægt að nota eða ekki, en fyrst og fremst er EDA til að sjá hvað gögnin geta sagt okkur fyrir utan formlega líkanagerð eða tilgátuprófunarverkefni. Tölfræðilegar aðferðir eru einnig notaðar til að draga úr líkum á villum af tegund I („falskar jákvæðar“) og villur af tegund II („falskar neikvæðar“). Dæmi um forrit er A/B prófun til að ákvarða hvaða tegundir markaðsefnis munu auka tekjur mest.

Sjá einnig:  40 athyglisverðar staðreyndir um stór gögn

  1. Nám undir eftirliti

Stýrt nám er vélnámsverkefnið að álykta um virkni út frá merktum þjálfunargögnum. Þjálfunargögnin samanstanda af safni af þjálfunardæmum . Í námi undir eftirliti er hvert dæmi par sem samanstendur af inntakshlut (venjulega vektor) og æskilegt úttaksgildi (einnig kallað eftirlitsmerki ). Námsalgrím undir eftirliti greinir þjálfunargögnin og framleiðir ályktað fall sem hægt er að nota til að kortleggja ný dæmi.

  1. Greining á samfélagsnetum

Greining á samfélagsnetum er tækni sem var fyrst notuð í fjarskiptaiðnaðinum og síðan fljótlega tekin upp af félagsfræðingum til að rannsaka mannleg samskipti. Það er nú beitt til að greina tengsl fólks á mörgum sviðum og atvinnustarfsemi. Hnútar tákna einstaklinga innan nets en tengsl tákna tengslin milli einstaklinga.

  1. Uppgerð

Líkangerð fyrir hegðun flókinna kerfa, oft notuð til að spá, spá og skipuleggja atburðarás. Monte Carlo hermir, til dæmis, eru flokkur reiknirita sem treysta á endurtekna slembiúrtak, þ.e. keyra þúsundir uppgerða, hver byggt á mismunandi forsendum. Niðurstaðan er súlurit sem gefur líkindadreifingu á útkomum. Ein umsókn er að meta líkur á að ná fjárhagslegum markmiðum í ljósi óvissu um árangur ýmissa aðgerða

  1. Tímaröð greining

Tímaraðiragreining samanstendur af aðferðum til að greina tímaraðagögn til að draga fram marktæka tölfræði og aðra eiginleika gagnanna. Tímaraðir gögn koma oft upp þegar fylgst er með iðnaðarferlum eða rekja fyrirtæki viðskiptamælingar. Tímaraðargreining gerir grein fyrir því að gagnapunktar sem teknir eru yfir tíma geta haft innri uppbyggingu (svo sem sjálffylgni, þróun eða árstíðabundin breytileika) sem ætti að taka tillit til. Sem dæmi um tímaraðagreiningu má nefna tímagildi hlutabréfavísitölu eða fjölda sjúklinga sem greinast með tiltekið ástand á hverjum degi.

  1. Nám án eftirlits

Nám án eftirlits er vélanámsverkefnið að álykta um aðgerð til að lýsa falinni uppbyggingu út frá ómerktum gögnum. Þar sem dæmin sem gefin eru nemandanum eru ómerkt er engin villa eða verðlaunamerki til að meta hugsanlega lausn – þetta aðgreinir nám án eftirlits frá námi undir eftirliti og styrkingarnámi.

Innsýn í 26 stóra gagnagreiningartækni: 2. hluti

Hins vegar, án eftirlits nám nær einnig yfir margar aðrar aðferðir sem leitast við að draga saman og útskýra helstu eiginleika gagnanna.

  1. Visualization

Gagnasjónun er gerð gagna á myndrænu eða myndrænu formi. Það gerir ákvarðanatökumönnum kleift að sjá greiningar kynntar sjónrænt, svo þeir geti skilið erfið hugtök eða greint ný mynstur. Með gagnvirkri sjónmyndun geturðu tekið hugmyndina skrefinu lengra með því að nota tækni til að kafa niður í töflur og línurit til að fá frekari smáatriði, og breyta gagnvirkt hvaða gögnum þú sérð og hvernig þau eru unnin.

Niðurstaða

Stór gagnagreining hefur verið ein mikilvægasta byltingin í upplýsingatækniiðnaðinum. Reyndar hafa Big Data sýnt mikilvægi sitt og þörf nánast í öllum greinum og í öllum deildum þeirra atvinnugreina. Það er ekki einn þáttur lífsins sem hefur ekki orðið fyrir áhrifum af Big Data, ekki einu sinni persónulegt líf okkar. Þess vegna þurfum við Big Data Analytics til að stjórna þessu mikla magni gagna á skilvirkan hátt.

Eins og áður sagði er þessi listi ekki tæmandi. Vísindamenn eru enn að gera tilraunir með nýjar leiðir til að greina þetta mikla magn af gögnum sem eru til í margvíslegum myndum þar sem hraði kynslóðarinnar eykst með tímanum til að fá gildi fyrir sérstaka notkun okkar.


The Rise of Machines: Real World Applications of AI

The Rise of Machines: Real World Applications of AI

Gervigreind er ekki í framtíðinni, hún er hér í nútímanum Í þessu bloggi Lestu hvernig gervigreindarforrit hafa haft áhrif á ýmsa geira.

DDOS árásir: Stutt yfirlit

DDOS árásir: Stutt yfirlit

Ertu líka fórnarlamb DDOS árása og ruglaður með forvarnaraðferðirnar? Lestu þessa grein til að leysa spurningar þínar.

Hefur þú einhvern tíma velt því fyrir þér hvernig tölvuþrjótar græða peninga?

Hefur þú einhvern tíma velt því fyrir þér hvernig tölvuþrjótar græða peninga?

Þú gætir hafa heyrt að tölvuþrjótar græða mikið af peningum, en hefur þú einhvern tíma velt því fyrir þér hvernig þeir vinna sér inn svona peninga? við skulum ræða.

Byltingarkenndar uppfinningar frá Google sem munu auðvelda lífi þínu.

Byltingarkenndar uppfinningar frá Google sem munu auðvelda lífi þínu.

Viltu sjá byltingarkenndar uppfinningar frá Google og hvernig þessar uppfinningar breyttu lífi hvers manns í dag? Lestu síðan til að blogga til að sjá uppfinningar frá Google.

Föstudagur Nauðsynlegur: Hvað varð um gervigreindardrifna bíla?

Föstudagur Nauðsynlegur: Hvað varð um gervigreindardrifna bíla?

Hugmyndin um að sjálfkeyrandi bílar fari á göturnar með hjálp gervigreindar er draumur sem við höfum átt um tíma núna. En þrátt fyrir nokkur loforð eru þau hvergi sjáanleg. Lestu þetta blogg til að læra meira…

Tæknileg sérkenni: Fjarlæg framtíð mannlegrar siðmenningar?

Tæknileg sérkenni: Fjarlæg framtíð mannlegrar siðmenningar?

Þar sem vísindin þróast hratt og taka yfir mikið af viðleitni okkar, eykst hættan á því að verða fyrir óútskýranlegri einstæðu. Lestu, hvað sérkenni gæti þýtt fyrir okkur.

Þróun gagnageymslu – Infographic

Þróun gagnageymslu – Infographic

Geymsluaðferðir gagna hafa verið að þróast gæti verið frá fæðingu gagna. Þetta blogg fjallar um þróun gagnageymslu á grundvelli upplýsingamynda.

Virkni Big Data Reference Architecture Layers

Virkni Big Data Reference Architecture Layers

Lestu bloggið til að þekkja mismunandi lög í Big Data Architecture og virkni þeirra á einfaldasta hátt.

6 ótrúlegir kostir þess að hafa snjall heimilistæki í lífi okkar

6 ótrúlegir kostir þess að hafa snjall heimilistæki í lífi okkar

Í þessum stafræna heimi hafa snjallheimilistæki orðið afgerandi hluti af lífi. Hér eru nokkrir ótrúlegir kostir snjallheimatækja um hvernig þau gera líf okkar þess virði að lifa því og einfaldara.

macOS Catalina 10.15.4 viðbót uppfærsla veldur fleiri vandamálum en að leysa

macOS Catalina 10.15.4 viðbót uppfærsla veldur fleiri vandamálum en að leysa

Nýlega gaf Apple út macOS Catalina 10.15.4 viðbótaruppfærslu til að laga vandamál en svo virðist sem uppfærslan sé að valda fleiri vandamálum sem leiða til múrsteins á Mac vélum. Lestu þessa grein til að læra meira