Legutóbbi blogomban a nyílt forráskódú adatkinyerési eszközökről beszéltünk. Az „ETL-eszköz” fő célja a különböző adatbázisok vagy operációs rendszerek tartalmának összegyűjtése a szervezetben, és mindezen adatok áthelyezése/másolása/átvitele egy központi adatbázisba. Ezt a „központosított adatbázist” gyakran „adattárháznak” nevezik. Alternatív megoldásként az ETL eszközöket olyan összetett adatátalakítások végrehajtására is használják, amelyeket nehéz egyszerű SQL utasításokkal végrehajtani.

Íme néhány kereskedelmi ETL-eszköz lista:
Ez egy ETL-eszköz, és az IBM Information Platforms Solutions Suite és az IBM InfoSphere része. Grafikus jelölést használ az adatintegrációs megoldások felépítéséhez. Integrálja az adatokat több rendszer között egy nagy teljesítményű párhuzamos keretrendszer segítségével, és támogatja a kiterjesztett metaadatkezelést és a vállalati kapcsolatot. A méretezhető platform rugalmasabb integrációt biztosít minden típusú adathoz, beleértve a nyugalmi (Hadoop-alapú) vagy mozgásban lévő (stream-alapú) big data-okat is, elosztott és nagyszámítógépes platformokon.

A Microsoft SSIS egy vállalati adatintegrációs, adatátalakítási és adatmigrációs eszköz, amely a Microsoft SQL Server adatbázisába van beépítve. Használható számos integrációval kapcsolatos feladathoz, például adatok elemzéséhez és törléséhez, valamint folyamatok kivonatolásához, átalakításához és betöltéséhez az adattárházak frissítéséhez.
Lásd még: Betekintés 26 Big Data elemzési technikába
Az Adeptia teljes ETL funkcionalitást kínál egy egyszerű, intuitív kezelőfelülettel kombinálva; lehetővé teszi a felhasználók számára, hogy számos különböző fájlt átalakítsanak. Az Adeptia ETL Suite még nem informatikai személyek számára készült, lehetővé téve az üzleti felhasználók számára, hogy valós időben hozzáférjenek adataikhoz és átalakítsák saját adataikat a működésükhöz igazodva, miközben továbbra is lehetővé teszi az IT számára a folyamatok kezelését és az adatok biztonságos kezelését és kezelését. helyesen.
Az Informatica Power Center egy széles körben használt kinyerési, átalakító és betöltő eszköz, amelyet vállalati adattárházak építésére használnak. Az Informatica PowerCenter fő összetevői a klienseszközök, a kiszolgáló, a tárolószerver és a repository. A Power Center-kiszolgáló és a tárolókiszolgáló alkotja az ETL-réteget, amely befejezi az ETL-feldolgozást.
A Data Migrator egy hatékony és átfogó automatizált eszköz, amelynek célja a kivonatolási, átalakítási és betöltési (ETL) folyamatok drámai egyszerűsítése, beleértve az adattárházak, adatpiacok és operatív adattárak létrehozását, karbantartását és bővítését. Az intuitív interfész lehetővé teszi a gyors, végpontok közötti ETL-folyamatok létrehozását, amelyek heterogén adatstruktúrákat tartalmaznak különböző számítási platformokon. Ezenkívül a változási adatrögzítés funkció csak a módosított rekordokat tölti be az adatforrásba, jelentősen csökkentve az adatok frissítéséhez szükséges időt, és megkönnyíti a közel valós idejű adattárház létrehozását.
Lásd még: The Big Data Gray Area – Mit kell és mit ne tegyünk
Az Elixir Data ETL-t úgy tervezték, hogy igény szerinti, önkiszolgáló adatkezelést biztosítson üzleti felhasználóknak, valamint vállalati szintű adatfeldolgozási igényekhez. Vizuális modellezési paradigmája drasztikusan csökkenti az adatkinyerés, aggregálás és átalakítás tervezéséhez, teszteléséhez és megvalósításához szükséges időt – ez kritikus folyamat minden alkalmazásfeldolgozás, vállalati jelentéskészítés és teljesítménymérés, adatpiaci vagy adattárházi kezdeményezések esetében.

A Syncsort DMX minden adatátalakítást egy nagyobb teljesítményű, memórián belüli ETL motorba visz. Az átalakítások feldolgozása menet közben történik, így nincs szükség költséges adatbázis-állomásozási területekre vagy az átalakítások manuális áthelyezésére az adatbázisba.
A SAS Data Management lehetővé teszi az üzleti felhasználók számára, hogy maguk frissítsék az adatokat, módosítsák a folyamatokat és elemezzék az eredményeket, így szabaddá válik más projektek számára. Ezenkívül a beépített üzleti szószedet, valamint a SAS és a harmadik féltől származó metaadat-kezelési és vonal-megjelenítési képességek mindenkit ugyanazon az oldalon tartanak.
Segít integrálni, átalakítani és javítani az adatokat projekt- vagy vállalati szinten. Egyetlen vállalati szintű megoldást kínál az adatintegrációhoz, az adatminőséghez, az adatprofil-alkotáshoz és a szöveges adatfeldolgozáshoz, amely lehetővé teszi a felhasználók számára az adatok integrálását, átalakítását, javítását és szállítását.

Extract Load and Transform (E-LT) technológiát kínál, amely javítja a teljesítményt és csökkenti az adatintegrációs költségeket – még heterogén rendszerek között is. Nagy teljesítményű és alacsonyabb TCO-t biztosít, heterogén platform támogatást a vállalati adatintegrációhoz és tudásmodulokat az optimalizált fejlesztői termelékenység és bővíthetőség érdekében.

A Meta Suite gyors felfutási időt, méretezhetőséget, valamint a támogatott forrás- és célfájl- és adatbázistípusok gazdag választékát kínálja. A működési adatok kivonatolása, betöltése és egyesítése normál működésén kívül az adatok konszolidálására és racionalizálására is használható, és mint ilyen támogatást nyújthat a törzsadatkezeléshez.
Olvassa el még: Útmutató kezdőknek a Big Data Analyticshez
Most az Actian része. Összetett integrációs műveleteket hajt végre, bár a szoftver rendkívül egyszerűen használható, és nem igényel speciális készségeket. Gazdag funkciói rendkívül intuitívak és konfigurálhatók a tervezéshez, telepítéshez és felügyelethez – matricaütés nélkül. Ugyanaz a teljes funkcionalitású webes felhasználói felület, amelyet mind a helyszíni, mind a felhőverziókhoz használnak.
Ez egy hatékony és rugalmas integrációs motor, amely különböző forrásokból származó adatokat gyűjt össze. A Pitney Bowes Software tervezte, és átfogó adatátalakítási eszközöket kínál üzleti értékeinek növelése érdekében. Lehetővé teszi az információk elemzését és értelmes jelentések készítését, hogy segítse vállalkozása megértését
Olvassa el még: A 15 legjobb Big Data eszköz 2017-ben
Bármely szoftver vagy eszköz kiválasztását az határozza meg, hogy milyen típusú követelmények vannak az adott személyre vonatkozóan, és amelyek vállalkozásonként változnak. Egy távközlési üzletágnak nagy és összetett adatokkal kell rendelkeznie a ruházati kiskereskedelmi üzletekhez képest. Tehát egy távközlési vállalkozás olyan eszközt választana, amely rendelkezik funkciókkal az összetett adatok kezelésére. Ezzel szemben egy kiskereskedelmi üzlet inkább könnyen használható, kevésbé bonyolult eszközt választana, mivel nem rendelkezik a programozási ismeretekkel és a technikai háttérrel.
Következő blogomban a Referenciaarchitektúra következő rétegéhez tartozó eszközöket sorolom fel.