I min siste blogg snakket vi om Open Source Data Extraction Tools. Hovedmålet med et "ETL-verktøy" er å samle innholdet i ulike databaser eller operasjonelle systemer på tvers av organisasjonen og flytte/kopiere/overføre alle disse dataene til en sentralisert database. Denne "sentraliserte databasen" kalles ofte et "Datavarehus". Alternativt brukes ETL-verktøy også til å utføre komplekse datatransformasjoner som er vanskelige å gjøre ved å bruke enkle SQL-setninger.

Her er en liste over noen kommersielle ETL-verktøy:
Det er et ETL-verktøy og en del av IBM Information Platforms Solutions suite og IBM InfoSphere. Den bruker en grafisk notasjon for å konstruere dataintegrasjonsløsninger. Den integrerer data på tvers av flere systemer ved å bruke et parallellrammeverk med høy ytelse, og den støtter utvidet metadataadministrasjon og bedriftstilkobling. Den skalerbare plattformen gir mer fleksibel integrasjon av alle typer data, inkludert stordata i hvile (Hadoop-basert) eller i bevegelse (strømbasert), på distribuerte og stormaskinplattformer.
![13 Kommersielle datautvinningsverktøy for Big Data 13 Kommersielle datautvinningsverktøy for Big Data]()
Microsoft SSIS er et verktøy for dataintegrasjon, datatransformasjon og datamigrering for bedrifter som er innebygd i Microsofts SQL Server-database. Den kan brukes til en rekke integrasjonsrelaterte oppgaver, som å analysere og rense data og kjøre uttrekk, transformere og laste inn prosesser for å oppdatere datavarehus.
Se også: Et innblikk i 26 analyseteknikker for store data
Adeptia tilbyr full ETL-funksjonalitet kombinert med et enkelt, intuitivt grensesnitt; gir brukerne muligheten til å transformere en rekke forskjellige filer. Adeptia ETL Suite er designet for til og med ikke-IT-personer, og gir bedriftsbrukerne makt til å få tilgang til dataene deres i sanntid og transformere sine egne data for å passe deres operasjoner, samtidig som IT-en kan administrere prosesser og sikre at data administreres sikkert og riktig.
Informatica Power Center er et mye brukt utvinnings-, transformasjons- og lasteverktøy som brukes til å bygge bedriftsdatavarehus. Hovedkomponentene til Informatica PowerCenter er klientverktøyene, serveren, depotserveren og depotet. Power Center-serveren og depotserveren utgjør ETL-laget, som fullfører ETL-behandlingen.
Data Migrator er et kraftig og omfattende automatisert verktøy designet for å dramatisk forenkle prosesser for utvinning, transformasjon og lasting (ETL), inkludert opprettelse, vedlikehold og utvidelse av datavarehus, datamars og operative datalagre. Et intuitivt grensesnitt muliggjør rask ende-til-ende ETL-prosessoppretting som involverer heterogene datastrukturer på tvers av forskjellige dataplattformer. I tillegg laster en endringsdatafangstfunksjon kun endrede poster inn i datakilden din, noe som reduserer tiden som trengs for å oppdatere data dramatisk, og letter et datavarehus i nesten sanntid.
Se også: Big Data-gråområdet – hva som bør gjøres og ikke gjøres
Elixir Data ETL er designet for å tilby selvbetjent datamanipulering på forespørsel for forretningsbrukere så vel som for databehandlingsbehov på bedriftsnivå. Dets visuelle modelleringsparadigme reduserer drastisk tiden det tar å designe, teste og implementere datautvinning, aggregering og transformasjon – en kritisk prosess for enhver applikasjonsbehandling, bedriftsrapportering og ytelsesmåling, datamarked eller datavarehusinitiativer.
![13 Kommersielle datautvinningsverktøy for Big Data 13 Kommersielle datautvinningsverktøy for Big Data]()
Syncsort DMX bringer alle datatransformasjoner til en ETL-motor med høyere ytelse i minnet. Transformasjoner behandles på flukt, noe som eliminerer behovet for kostbare databaseoppsettingsområder eller manuelt skyve transformasjoner til databasen.
SAS Data Management gjør det mulig for bedriftsbrukerne å oppdatere data, justere prosesser og analysere resultater selv, noe som frigjør for andre prosjekter. I tillegg holder en innebygd forretningsordliste samt SAS- og tredjeparts metadataadministrasjon og linjevisualiseringsfunksjoner alle på samme side.
Det hjelper med å integrere, transformere og forbedre data på prosjekt- eller bedriftsnivå. Den leverer én enkelt bedriftsklasseløsning for dataintegrasjon, datakvalitet, dataprofilering og tekstdatabehandling som lar brukere integrere, transformere, forbedre og levere data.
![13 Kommersielle datautvinningsverktøy for Big Data 13 Kommersielle datautvinningsverktøy for Big Data]()
Den leverer E-LT-teknologi (Extract Load and Transform) som forbedrer ytelsen og reduserer dataintegrasjonskostnadene – selv på tvers av heterogene systemer. Gir høy ytelse og lavere TCO, heterogen plattformstøtte for bedriftsdataintegrasjon og kunnskapsmoduler for optimalisert utviklerproduktivitet og utvidbarhet.
![13 Kommersielle datautvinningsverktøy for Big Data 13 Kommersielle datautvinningsverktøy for Big Data]()
Meta Suite gir deg rask tid-til-verdi, skalerbarhet og et rikt utvalg av støttede kilde- og målfil- og databasetyper. Annet enn den normale driften av å trekke ut, laste inn og slå sammen driftsdata, kan den også brukes til å konsolidere og rasjonalisere data og levere som sådan støtte for Master Data Management.
Les også: En nybegynnerveiledning til Big Data Analytics
Det er nå en del av Actian. Den utfører komplekse integrasjonsoperasjoner, selv om programvaren er bemerkelsesverdig enkel å bruke og ikke krever et spesialisert ferdighetssett. Dens rike funksjoner er svært intuitive og konfigurerbare for design, distribusjon og administrasjon – uten klistremerkesjokk. Den har det samme fullfunksjons web-UI som brukes for både premiss- og skyversjoner.
Det er en kraftig og fleksibel integrasjonsmotor som samler data fra ulike kilder. Den er designet av Pitney Bowes Software og gir et omfattende sett med datatransformasjonsverktøy for å forbedre forretningsverdiene. Det gjør det mulig å analysere informasjon og lage meningsfulle rapporter for å hjelpe til med forståelsen av virksomheten din
Les også: Topp 15 Big Data-verktøy i 2017
Valg av programvare eller verktøy avgjøres av hvilken type krav man har og som varierer fra virksomhet til virksomhet. En telekombedrift vil ha store og komplekse data å håndtere sammenlignet med klesbutikker. Så en telekombedrift vil velge et verktøy som har funksjoner for å operere på komplekse data. Mens en butikk ville gå for et brukervennlig verktøy med mindre kompleksitet, siden det ikke har programmeringskunnskaper og teknisk bakgrunn.
I min neste blogg vil jeg liste opp verktøy for neste lag i referansearkitekturen.