MS Excel getur sýnt 1.048.576 línur. Þó að það kunni að virðast mjög mikill fjöldi við venjulega notkun, þá eru fullt af atburðarásum þar sem það er ekki alveg nóg.
Hvort sem þú ert að skoða annálaskrár eða stór gagnasöfn er auðvelt að rekast á CSV skrár með milljónum raða eða gríðarstórum textaskrám. Þar sem Excel getur ekki stutt svona stórar skrár, hvernig nákvæmlega opnarðu þær? Við skulum komast að því.
Af hverju geta venjulegir textaritillar ekki opnað mjög stórar skrár?
Tölva hefur gígabæta geymslupláss, svo hvers vegna geta textaritlar ekki opnað stórar skrár?
Það eru tveir þættir sem spila hér inn. Sum forrit hafa harðkóða hámark á hversu mikið af gögnum þau geta birt. Það skiptir ekki máli hversu mikið minni tölvan þín hefur, hún mun bara ekki nota hana.
Annað málið er vinnsluminni. Margir textaritlar hafa ekki takmörk á fjölda raða, en geta ekki birt stórar skrár vegna minnistakmarkana. Þeir hlaða allri skránni inn í vinnsluminni kerfisins, þannig að ef þetta minni er ekki nógu stórt mistekst ferlið.
Aðferð #1: Notkun ókeypis ritstjóra
Besta leiðin til að skoða mjög stórar textaskrár er að nota... textaritil. Ekki bara hvaða textaritil sem er, heldur verkfærin sem ætluð eru til að skrifa kóða. Slík forrit geta venjulega séð um stórar skrár án áfalls og eru ókeypis.
Large Text File Viewer er líklega einfaldasta af þessum forritum. Það er mjög auðvelt í notkun, virkar hratt og hefur mjög lítið auðlindafótspor. Eini gallinn? Það getur ekki breytt skrám. En ef þú vilt aðeins skoða stórar CSV skrár, þá er þetta besta tólið fyrir starfið.
Til að breyta stórum textaskrám líka ættirðu að prófa Emacs . Upphaflega búið til fyrir Unix kerfi, virkar það fullkomlega vel á Windows líka og ræður við stórar skrár. Á sama hátt eru Neovim og Sublime Text tvær léttar IDE sem hægt er að nota til að opna gígabæta CSV textaskrár.
Ef allt sem þú ert að leita að er að leita að gögnum í gegnum stórar annálaskrár, þá er klogg bara tólið fyrir þig. Þetta forrit er uppfærslugafli hins vinsæla glogg og gerir þér kleift að framkvæma flóknar leitaraðgerðir í gegnum gríðarlegar textaskrár á auðveldan hátt. Þar sem tölvugerðar annálarskrár geta oft haft milljónir raða er klogg hannað til að vinna með slíkar skráarstærðir án vandræða.
Aðferð #2: Skiptu í marga hluta
Allt vandamálið við að reyna að opna stórar CSV skrár er að þær eru of stórar. En hvað ef þú myndir skipta þessum í margar smærri skrár?
Þetta er vinsæl lausn, þar sem það felur almennt ekki í sér að þurfa að læra viðmót nýs textaritils. Þess í stað geturðu notað einn af mörgum CSV-kljúfurum sem til eru á netinu til að skipta stóru skránni upp í fjölda skráa sem auðvelt er að opna. Síðan er hægt að nálgast hverja þessara skráa á venjulegan hátt.
Hins vegar er þetta ekki besta leiðin til að fara að þessu. Að skipta stórri skrá getur oft leitt til undarlegra innsláttarvillna eða rangt stilltar skrár. Þar að auki kemur í veg fyrir að þú sért að sía í gegnum öll gögnin í einu að opna hvern bút fyrir sig.
Aðferð #3: Flytja inn í gagnagrunn
Texta- og .csv-skrár sem ná yfir mörg gígabæta eru almennt stór gagnasöfn. Svo hvers vegna ekki bara að flytja þá inn í gagnagrunn?
SQL er algengasta gagnagrunnsmerkjamálið sem notað er þessa dagana. Það eru margar útgáfur af SQL í notkun, en sú auðveldasta er líklega MySQL. Og eins og heppnin vill hafa það, þá er hægt að umbreyta CSV skrá í MySQL töflu .
Þetta er alls ekki auðveldasta aðferðin til að takast á við stórar CSV skrár, svo við mælum aðeins með þessu ef þú vilt fást við stór gagnasöfn reglulega. Ef MySQL hljómar of erfitt geturðu alltaf flutt inn .csv skrárnar þínar í MS Access í staðinn.
Aðferð #4: Greindu með Python bókasöfnum
Þegar þú ert að vinna með .csv skrá með milljón raða af gögnum muntu augljóslega ekki geta gert mikið vit í því handvirkt. Þú vilt líklega sía gögnin og keyra sérstakar fyrirspurnir til að skilja þróun.
Svo hvers vegna ekki að skrifa Python kóða til að gera einmitt það?
Enn og aftur, þetta er ekki notendavænasta aðferðin. Þó að Python sé ekki erfiðasta forritunarmálið til að læra , þá er það kóðun, svo það er kannski ekki besta aðferðin fyrir þig. Samt, ef þú finnur fyrir þér að þurfa að flokka í gegnum mjög stórar CSV skrár daglega, gætirðu viljað gera verkefnið sjálfvirkt með Python kóða .
Aðferð #5: Með úrvalsverkfærum
Textaritlarnir sem við sáum í fyrstu aðferðinni voru ekki sérstök verkfæri ætluð fyrir CSV-vinnslu. Þetta voru almenn verkfæri sem hægt var að nota til að vinna með stórar .csv skrár líka.
En hvað með sérhæfðar umsóknir? Eru engin forrit þarna úti sem eru búin til til að leysa þetta vandamál?
Það eru reyndar. CSV Explorer , til dæmis, byggir á ferlinu sem við lýstum í síðustu tveimur aðferðum (SQL gagnagrunni og Python kóða) til að búa til app sem getur skoðað og breytt CSV skrám af hvaða stærð sem er. Þú getur gert allt sem þú býst við af töflureikni eins og að búa til línurit eða sía gögnin í CSV Explorer.
Annar valkostur er UltraEdit . Ólíkt fyrra tólinu er þetta ekki bara ætlað fyrir .csv skrár heldur fyrir hvers kyns textaskrár. Það getur auðveldlega séð um texta og CSV skrár, allt upp í nokkur gígabæta, með viðmóti svipað mörgum af ókeypis ritstjórunum sem við ræddum áðan.
Eini gallinn við þessi verkfæri er að þau eru úrvalsforrit, sem krefst þess að þú fáir greitt leyfi til að geta notað þau. Þú getur alltaf prófað ókeypis prufuútgáfur þeirra til að skoða eiginleika þeirra, eða ef þú notar aðeins einu sinni.
Hver er besta leiðin til að opna stórar texta- og CSV-skrár?
Á þessum tíma stórra gagna er ekki óalgengt að rekast á textaskrár sem keyra á gígabætum, sem getur verið erfitt að skoða jafnvel með innbyggðum verkfærum eins og Notepad eða MS Excel. Til að geta opnað svona stórar CSV skrár þarftu að hlaða niður og nota þriðja aðila forrit.
Ef allt sem þú vilt er að skoða slíkar skrár, þá er Large Text File Viewer besti kosturinn fyrir þig. Til að breyta þeim í raun og veru geturðu prófað eiginleikaríkan textaritil eins og Emacs, eða farið í úrvalsverkfæri eins og CSV Explorer.
Aðferðir eins og að skipta CSV skránni eða flytja hana inn í gagnagrunn fela í sér of mörg skref. Það er betra fyrir þig að fá greitt leyfi fyrir sérstakt úrvalsverkfæri ef þú finnur fyrir þér að vinna mikið með risastórar textaskrár.