poblar para online generatedata generate generador for fake dummy datos data testing data-generation

testing - para - generatedata



¿Herramientas para generar datos falsos? (16)

Estoy buscando recomendaciones de una herramienta buena y gratuita para generar datos de muestra con el fin de cargar en las bases de datos de prueba. Por analogía, algo que produce texto " lorem ipsum " para cualquier RDBMS. Las características que estoy buscando incluyen:

  • Flexibilidad para generar datos para una definición de tabla existente.
  • Posibilidad de generar conjuntos de datos pequeños y grandes (> 1 millón de filas o más).
  • Genere en formato de script SQL ( INSERT ) o en un formato de archivo plano adecuado para la importación masiva (que generalmente es más rápido).
  • Una interfaz de línea de comandos para una creación de scripts sencilla.
  • Extensible, de código abierto, escrito en un lenguaje dinámico (estos son agradables de tener, requisitos no fuertes).

PD: busqué una pregunta duplicada en StackOverflow, pero no encontré ninguna. Si hay uno, le agradeceré que me lo muestre.

¡Gracias por las excelentes respuestas a todos! Debo modificar mis requisitos de que utilizo Mac OS X como mi entorno de desarrollo primario, no Windows (aunque sí dije que la interfaz de la línea de comandos es deseable, y eso prácticamente excluye a Windows). Sin embargo, las sugerencias específicas de Windows serán útiles para otros lectores de esta pregunta, así que gracias.

Aquí está mi conclusión:

  • GenerateData:
    • Interfaz de aplicación web PHP, no línea de comando
    • limitado a generar 200 registros (o pagar $ 20 por licencia para generar 5,000 registros)
  • RedGate SQL Data Generator
    • no es gratis, precio $ 295
    • requiere Windows, .NET, SQL Server
  • Edición de la base de datos de Visual Studio 2008
    • requiere Windows
    • requiere una costosa suscripción a MSDN o ISV
  • Banner Datadect
    • no es gratis, precio $ 595
    • requiere Windows (?)
    • no hay soporte para MySQL (?)
    • GUI, no línea de comandos o secuencia de comandos
  • Gema de Ruby Faker
    • demasiado lento para usar ActiveRecord para carga de datos masiva
  • Super Smack
    • principalmente una herramienta de prueba de carga, con un generador de datos aleatorios integrado
    • bastante simple de usar sin embargo
    • en general, una buena herramienta finalista
  • Beneficiario de Databene
    • La mejor solución para mis necesidades
    • Scripts XML, compatibles con DbUnit
    • Código Java de código abierto (GPL)
    • uso de línea de comandos
    • acceder a muchas bases de datos directamente a través de JDBC

+1 para el Beneficiario: Intenté 3 o 4 de las otras herramientas que se ofrecen (incluido dbmonster), pero encontré que Benerator es muy rápido, brinda datos realistas y es flexible. También obtuve comentarios muy rápidos y útiles del creador de la herramienta cuando publiqué en el foro.



Eche un vistazo a databene benerator , un generador de datos de prueba que se parece a sus requisitos.

  • puede generar datos para una definición de tabla existente (o incluso anonimizar datos de producción)
  • puede generar un gran conjunto de datos (tamaño ilimitado)
  • Admite varias entradas (CSV, Flat Files, DBUnit) y formato de salida (CSV, Flat Files, DBUnit, XML, Excel, Scripts)
  • se puede usar en la línea de comando o a través de un plugin maven
  • es de código abierto y personalizable

Yo lo probaría.

Por cierto, una lista de productos similares está disponible en el sitio web de databene benerator.


Esto parece bastante prometedor: generatedata.com . De código abierto, tiene muchos tipos de datos integrados.

Hay varios otros enumerados aquí: Test (Sample) Data Generators . No tengo experiencia con ninguno de ellos, pero algunos en esa lista parecen ser bastante decentes.


No es gratis, pero Visual Studio 2008 Database Edition es una buena alternativa y proporciona mucha más funcionalidad (integración con SCC, pruebas unitarias, refactorización de bases de datos, etc.)


No es una respuesta directa a su pregunta, pero esto puede ser útil para cierto tipo de datos:

Fake Name Generator puede ser útil: http://www.fakenamegenerator.com/ , no para todo menos para cuentas de usuario o cosas por el estilo. AFAIK Proporcionan soporte para pedidos en bloque.


Normalmente es muy costoso, pero si usted es un ISV pequeño, puede obtener Visual Studio 2008 Database Edition de manera muy económica, consulte las promociones de bizspark y bizspark . Proporciona mucha más funcionalidad que la generación de datos de prueba (integración con SCC, pruebas de unidades, refactorización de bases de datos, etc.)

Como me gusta el hecho de que las herramientas de Red-Grate son tan fáciles de aprender, aún vería SQL Data Generator



Pruebe http://www.mockaroo.com

Esta es una herramienta que mi compañía creó para ayudar a evaluar nuestras propias aplicaciones. Lo hemos hecho gratis para que cualquiera lo use. Básicamente es la gema rubí de la Falsificación con una aplicación web envuelta alrededor. Puede generar datos en formato CSV, txt o SQL. Espero que esto ayude.


Puede usar DbSchema, www.dbschema.com es una herramienta de administración de base de datos y tiene un generador de datos aleatorios para llenar su base de datos.


Sé que dijiste que estabas buscando una herramienta gratuita, pero este es un caso en el que sugeriría que gastar $ 295 te devuelva el dinero rápidamente a tiempo. He estado utilizando la herramienta RedGate SQL Data Generator para el último año y, para abreviar, es una herramienta increíble. Permite establecer dependencias entre columnas, genera datos realistas para objetos comerciales como números de teléfono, direcciones URL, nombres, etc. Honestamente puedo decir que esta herramienta se ha pagado una y otra vez.


Sé que no estás buscando un texto lorem ipsum real; pero en caso de que alguien más busque un generador real de lorem ipsum y encuentre este hilo: lipsum.com hace un gran trabajo al respecto.


Si está buscando o está dispuesto a usar algo específico de MySQL, puede echar un vistazo a Super Smack . Actualmente es mantenido por Tony Bourke.

Super Smack le permite generar datos aleatorios para insertar en las tablas de su base de datos. Es personalizable, lo que le permite usar el archivo de words.dat empaquetado, o cualquier información de prueba de su elección.

Una de las cosas buenas de esto es que es una línea de comandos altamente personalizable. Hay algunos ejemplos bastante decentes de uso en el libro High Performance MySQL, que también se extrae aquí .

No estoy seguro si eso está en línea con lo que está buscando, sino solo con un pensamiento.


Una secuencia de comandos de Ruby con uno de los generadores de datos falsos disponibles debería hacerlo bien.

http://faker.rubyforge.org/ es una de esas gemas. Lamentablemente, esto no cumple todos sus requisitos.

Aquí hay otro: http://random-data.rubyforge.org/

Y un tutorial para usar Faker: http://www.rubyandhow.com/how-to-generate-fake-names-addresses-in-ruby/

RE: Flexibilidad para generar datos para una definición de tabla existente. Combina la gema Faker con uno de los ORM disponibles. ActiveRecord probablemente sería más fácil.


Uso una herramienta llamada Datatect :

  1. Genera datos en archivos planos o en cualquier base de datos compatible con ODBC.
  2. Extensible a través de VBScript.
  3. Referencialmente consciente; rellenará claves foráneas con valores de la tabla padre.
  4. Los datos son conscientes del contexto; ciudad, estado y números de teléfono para códigos postales, nombres y títulos con género.
  5. Puede crear tipos de datos personalizados y complejos.
  6. Genere más de 2 mil millones de nombres propios, nombres comerciales, direcciones, ciudades, estados y códigos postales.

Utilicé esta herramienta para generar hasta 40,000,000 de filas de datos en una base de datos SQLServer y 8,000,000 filas de datos en una base de datos Oracle.

No estoy de ninguna manera afiliada con Banner Systems, solo soy un cliente satisfecho.


una herramienta que realmente no debería faltar en la lista es el Generador de datos de Datanamic que rellena bases de datos directamente o genera scripts de inserción, tiene una gran colección de generadores preinstalados (y admite múltiples bases de datos ...

http://www.datanamic.com/datagenerator/index.html