simpledb signin east dynamodb aws amazon-ec2 amazon-web-services amazon-simpledb amazon-ebs bigdata

amazon-ec2 - signin - aws simpledb vs dynamodb



¿Cómo importa conjuntos de datos públicos de Big Data en AWS? (2)

Cargar cualquiera de los conjuntos de datos públicos enumerados de Amazon (http://aws.amazon.com/datasets) tomaría muchos recursos y ancho de banda. ¿Cuál es la mejor manera de importarlos a AWS para que pueda comenzar a trabajar con ellos rápidamente?


Tendrá que crear una nueva instancia de EBS utilizando el ID de Snapshot para el conjunto de datos público. De esa forma, no tendrá que pagar por la transferencia.

Pero tenga cuidado, algunos conjuntos de datos solo están disponibles en una región, muy probablemente denotados por una nota similar a esta. Debería registrar su instancia de EC2 en la misma región.

Estos conjuntos de datos están alojados en la región us-east-1. Si procesa estos desde otras regiones, se le cobrarán tarifas de transferencia de datos.


FYI: SDBExplorer usa BatchPutAttributes multiproceso para lograr un alto rendimiento de escritura mientras se cargan datos masivos a Amazon SimpleDB. SDB Explorer permite múltiples cargas paralelas. Si tiene ancho de banda, puede aprovechar al máximo ese ancho de banda ejecutando una cantidad de procesos BatchPutAttributes a la vez en una cola paralela que reducirá el tiempo que se gasta en el procesamiento. SDBExplorer admite Importar datos de MySql y CSV a Amazon SimpleDB.

http://www.sdbexplorer.com

Divulgación: soy el desarrollador de SDBExplorer.