MS Excel kan vise 1.048.576 rækker. Selvom det kan virke som et rigtig stort antal ved normal brug, er der masser af scenarier, hvor det ikke er helt nok.
Uanset om du ser på logfiler eller store datasæt, er det nemt at støde på CSV-filer med millioner af rækker eller enorme tekstfiler. Da Excel ikke kan understøtte så store filer, hvordan åbner du dem så præcist? Lad os finde ud af det.
Hvorfor kan normale teksteditorer ikke åbne virkelig store filer?
En computer har gigabyte lagerplads, så hvorfor kan teksteditorer ikke åbne store filer?
Der er to faktorer, der spiller ind her. Nogle applikationer har en hårdkodet grænse for, hvor meget data de kan vise. Det er lige meget, hvor meget hukommelse din pc har, de vil bare ikke bruge den.
Det andet problem er RAM. Mange teksteditorer har ikke en hård grænse for antallet af rækker, men kan ikke vise store filer på grund af hukommelsesbegrænsninger. De indlæser hele filen i systemets RAM, så hvis denne hukommelse ikke er stor nok, mislykkes processen.
Metode #1: Brug af gratis redaktører
Den bedste måde at se ekstremt store tekstfiler på er at bruge ... en teksteditor. Ikke en hvilken som helst teksteditor, men de værktøjer, der er beregnet til at skrive kode. Sådanne apps kan normalt håndtere store filer uden problemer og er gratis.
Large Text File Viewer er sandsynligvis den enkleste af disse applikationer. Det er virkelig nemt at bruge, fungerer hurtigt og har et meget lavt ressourceaftryk. Den eneste ulempe? Den kan ikke redigere filerne. Men hvis du kun vil se store CSV-filer, er dette uden tvivl det bedste værktøj til jobbet.
For også at redigere store tekstfiler, bør du prøve Emacs . Oprindeligt skabt til Unix-systemer, fungerer det også perfekt på Windows og kan håndtere store filer. På samme måde er Neovim og Sublime Text to lette IDE'er, der kan bruges til at åbne gigabyte-størrelse CSV-tekstfiler.
Hvis alt du leder efter er at søge efter data gennem store logfiler, så er klogg lige værktøjet for dig. En opdateringsgaffel af den populære glogg , denne applikation giver dig mulighed for nemt at udføre komplekse søgeoperationer gennem enorme tekstfiler. Da computergenererede logfiler ofte kan have millioner af rækker, er klogg designet til at fungere med sådanne filstørrelser uden problemer.
Metode #2: Opdel i flere dele
Hele problemet med at prøve at åbne store CSV-filer er, at de er for store. Men hvad hvis du skulle opdele disse i flere mindre filer?
Dette er en populær løsning, da det generelt ikke indebærer at skulle lære grænsefladen til en ny teksteditor. I stedet kan du bruge en af de mange CSV -splittere, der er tilgængelige online, til at dele den store fil op i en række nemme at åbne filer. Hver af disse filer kan derefter tilgås normalt.
Dette er dog ikke den bedste måde at gøre dette på. Opdeling af en stor fil kan ofte føre til mærkelige tastefejl eller forkert konfigurerede filer. Desuden forhindrer åbning af hver chunk separat dig i at filtrere gennem hele data på én gang.
Metode #3: Importer til en database
Tekst- og .csv-filer, der strækker sig til flere gigabyte, er generelt store datasæt. Så hvorfor ikke bare importere dem til en database?
SQL er det mest almindelige databasemarkeringssprog, der bruges i disse dage. Der er mange versioner af SQL i brug, men den nemmeste er nok MySQL. Og som heldet ville have det, er det muligt at konvertere en CSV-fil til en MySQL-tabel .
Dette er på ingen måde den nemmeste metode til at håndtere store CSV-filer, så vi anbefaler kun dette, hvis du ønsker at håndtere store datasæt på en regelmæssig basis. Hvis MySQL lyder for hårdt, kan du altid importere dine .csv-filer til MS Access i stedet for.
Metode #4: Analysér med Python-biblioteker
Når du arbejder med en .csv-fil med millioner af rækker af data, vil du naturligvis ikke være i stand til at få meget mening ud af det manuelt. Du vil sandsynligvis filtrere dataene og køre specifikke forespørgsler for at forstå tendenser.
Så hvorfor ikke skrive Python-kode for at gøre netop det?
Endnu en gang er dette ikke den mest brugervenlige metode. Selvom Python ikke er det sværeste programmeringssprog at lære , er det kodning, så det er måske ikke den bedste tilgang for dig. Alligevel, hvis du finder dig selv nødt til at parse gennem virkelig store CSV-filer på daglig basis, vil du måske automatisere opgaven med noget Python-kode .
Metode #5: Med Premium Tools
De teksteditorer, vi så i den første metode, var ikke dedikerede værktøjer beregnet til CSV-behandling. De var generelle værktøjer, der også kunne bruges til at arbejde med store .csv-filer.
Men hvad med specialiserede applikationer? Er der ingen apps derude, der er skabt til at løse dette problem?
Det er der faktisk. CSV Explorer bygger for eksempel på selve den proces, vi beskrev i de sidste to metoder (SQL-database og Python-kode) til at skabe en app, der er i stand til at se og redigere CSV-filer af enhver størrelse. Du kan gøre alt, hvad du forventer af et regnearksværktøj som at oprette grafer eller filtrere dataene i CSV Explorer.
En anden mulighed er UltraEdit . I modsætning til det tidligere værktøj er dette ikke kun beregnet til .csv-filer, men til enhver type tekstfil. Det kan nemt håndtere tekst- og CSV-filer, der spænder op til et par gigabyte, med en grænseflade, der ligner mange af de gratis redaktører, vi diskuterede tidligere.
Den eneste ulempe ved disse værktøjer er, at de er premium-applikationer, der kræver, at du får en betalt licens for at kunne bruge dem. Du kan altid prøve deres gratis prøveversioner for at se deres funktioner, eller hvis du kun har en engangsbrug.
Hvad er den bedste måde at åbne store tekst- og CSV-filer på?
I denne tid med Big Data er det ikke ualmindeligt at løbe ind i tekstfiler, der løber op i gigabyte, hvilket kan være svært selv at se med indbyggede værktøjer som Notesblok eller MS Excel. For at kunne åbne så store CSV-filer skal du downloade og bruge et tredjepartsprogram.
Hvis alt du ønsker er at se sådanne filer, så er Large Text File Viewer det bedste valg for dig. For faktisk at redigere dem, kan du prøve en funktionsrig teksteditor som Emacs, eller gå efter et premium-værktøj som CSV Explorer.
Teknikker som at opdele CSV-filen eller importere den til en database involverer bare for mange trin. Du er bedre stillet at få en betalt licens til et dedikeret premium-værktøj, hvis du finder dig selv at arbejde meget med store tekstfiler.