validation - pretty - review csv online
¿Hay servicios conocidos para validar un archivo CSV? (5)
¿Hay buenos sitios / servicios para validar la coherencia del archivo CSV?
Lo mismo que el validador W3C pero para CSV?
El Open Data Institute está desarrollando un servicio de validación CSV que permitirá a los usuarios verificar la estructura de sus datos y validarlos contra un esquema simple.
El servicio todavía está muy alfa pero se puede encontrar aquí:
El código para la aplicación y la biblioteca subyacente son ambos de código abierto:
https://github.com/theodi/csvlint
https://github.com/theodi/csvlint.rb
El archivo README en la biblioteca proporciona un resumen de los errores y advertencias que se pueden generar. Se pueden informar los siguientes tipos de error:
-
:wrong_content_type
- el tipo de contenido no es text / csv -
:ragged_rows
- row tiene un número diferente de columnas (que la primera fila en el archivo) -
:blank_rows
- fila completamente vacía, por ejemplo, línea en blanco o una línea donde todos los valores de columna están vacíos -
:invalid_encoding
- error de codificación al analizar la fila, por ejemplo, debido a caracteres no válidos -
:not_found
-:not_found
HTTP 404 al recuperar los datos -
:quoting
- problema con la cotización, por ejemplo falta o falta de cotización, campo citado no cerrado -
:whitespace
: una columna entre comillas tiene espacios en blanco iniciales o finales
Se pueden informar los siguientes tipos de advertencia:
-
:no_encoding
Content-Type devuelto en la solicitud HTTP no tiene un parámetro de juego de caracteres -
:encoding
- el juego de caracteres no es UTF-8 -
:no_content_type
: el archivo se sirve sin un encabezado Content-Type -
:excel
- sin encabezado Content-Type y la extensión del archivo es .xls -
:check_options
: el archivo CSV parece contener solo una columna -
:inconsistent_values
- valores inconsistentes en la misma columna. Se informó si <90% de los valores parecen tener el mismo tipo de datos (numéricos o alfanuméricos, incluida la puntuación)
Los Archivos Nacionales desarrollaron un CSV Schema Language y CSV Validator , un software escrito en Java. Es de código abierto.
Para validar un archivo CSV utilizo la extensión RAINBOW CSV en Visual Studio Code y también abro el archivo CSV en Excel.
Recientemente me encontré con Google Refine, no es un servicio para validar archivos CSV, es una herramienta que descargas localmente, pero proporciona muchas herramientas para trabajar con datos y detectar anomalías.
http://code.google.com/p/google-refine/
Como se menciona en una respuesta, "CSV" se ha convertido en un término mal definido, principalmente porque las personas no siguen el One True Way al usar datos separados por delimitadores.
http://www.catb.org/~esr/writings/taoup/html/ch05s02.html
EDITAR / ACTUALIZAR (2016-08-09):
CSV actualmente se está convirtiendo en un término bien definido por el grupo de trabajo de CSV del W3C
CSV Lint en csvlint.com (no .io :) es un servicio que estamos creando para resolver este problema. Comprueba los archivos CSV contra reglas / esquemas de validación definidos por el usuario, celda por celda.
Dedicamos mucho tiempo a ajustar la IU para permitir a los usuarios crear fácilmente esquemas / reglas de validación complejos que satisfagan las necesidades de su negocio sin una sola línea de código.
Nuestra función de validación fuera de línea permite a los usuarios ver los resultados en tiempo real incluso cuando validan múltiples archivos de gran tamaño (con millones + filas) y, lo que es más importante, protege al 100% la privacidad de los datos del usuario.