Tengo un archivo CSV de tamaño razonable (40 Megabytes). Sé que algunas aplicaciones no funcionarán con ciertas codificaciones y que arrojarán un error si la codificación no es ASCII. Pero es alarmante que incluso TextEdit.app no pueda abrir este archivo.
Primero probé Numbers.app . Me aseguré de que esto no sea un error de los Servicios de lanzamiento, porque abrí el archivo dentro de la aplicación. No cargaría. La barra de progreso siempre se atasca a mitad de camino. Cuando abro este archivo CSV con TextEdit.app , tampoco se carga. Ni siquiera las Hojas de cálculo de Google. El archivo tiene solo 40 Megabytes y solo tiene caracteres ASCII. Ejecutar file
el comando en Terminal.app devuelve el siguiente mensaje:
file.csv: ASCII text, with very long lines
.
Puedo abrir el archivo usando Visual Studio Code pero no en TextEdit.app . ¿Cómo puedo arreglarlo? Limpié el archivo en busca de \r
caracteres.
Actualización : wc -l file.csv
el comando en ejecución regresa 176831
. Mi sistema es un MacBookPro 2016 con 16 GB de RAM.
Es bastante común que los programas GUI no puedan manejar archivos de texto grandes. Aunque 40 MB no parece demasiado grande con respecto a los estándares actuales, eso podría inflar mucho más en la memoria dependiendo de cómo esté escrita la aplicación. Y las aplicaciones GUI a menudo no son las más eficientes.
Es posible que desee dividir el archivo de texto en varios más pequeños usando la terminal. Primero, verifique si puede abrir el archivo usando less filename.csv
la Terminal y si los caracteres se leen bien. De lo contrario, el archivo podría estar dañado y ese podría ser el problema.
Para la división real, intente usar algo como esto en la terminal:
#!/bin/bash
N=10000 # Number of lines per file
i=1
j=0
filename="hugefile.csv"
extension=.csv
while [ $i -le $(wc -l $filename|awk '{print $1}') ]
do
newfilename="$(basename $filename $extension)$j$extension"
echo $newfilename: $i
sed -n $i,$((i+$N))p $filename > $newfilename
j=$((j+1)); i=$((i+$N))
done
Cópielo y péguelo en un documento de texto sin formato (por ejemplo, TextEdit en modo de texto sin formato o nano en la Terminal) y asígnele un nombre split.sh
o algo similar. Personalice los parámetros N
y filename
según sea necesario, por ejemplo, ingrese el número deseado de números por archivo N=...
y el nombre de archivo de su archivo de origen como filename="..."
. Esto generará la cantidad necesaria de archivos en su directorio actual para cubrir todas las líneas de los archivos fuente en archivos más pequeños de N
líneas cada uno. Los archivos tendrán un número adjunto, por ejemplo, hugefile0.txt
a hugefile9.txt
o algo así.
Ahora debería poder abrir cada uno de estos archivos en su aplicación deseada. A menudo es deseable trabajar con porciones más pequeñas de un archivo grande que con todo el archivo a la vez. Incluso podría abrir los archivos CSV resultantes en Numbers uno tras otro y copiar las líneas de cada archivo en un documento grande de Numbers. De esa manera, el importador probablemente no se colgará de un archivo tan grande.
En caso de que obtenga algún error con respecto sed
a o awk
, eso se debe a que Mac sed
y awk
son diferentes a los sed
o awk
. En ese caso, es posible que deba instalar regularmente sed
y awk
desde algo como macports o homebrew.
sin ladera
wc -l FILE.csv
en Terminal para verificar)? ¿Qué pasa si intentas abrirlo en Textedit?Nimesh Neema
Nimesh Neema
miguel ilie
miguel ilie
Nimesh Neema
less file.csv
y vea si puede leer bien los caracteres. Intente abrir el archivo nuevamente con TextEdit.app después de reiniciar.steve cámaras
miguel ilie
JBis
cat file.csv
en la terminal.sologusti