Servicios web de Amazon: Redshift
Amazon Redshiftes un servicio de almacenamiento de datos totalmente gestionado en la nube. Sus conjuntos de datos van desde cientos de gigabytes hasta un petabyte. El proceso inicial para crear un almacén de datos es lanzar un conjunto de recursos informáticos llamadonodes, que están organizados en grupos llamados cluster. Después de eso, puede procesar sus consultas.
¿Cómo configurar Amazon Redshift?
A continuación, se muestran los pasos para configurar Amazon Redshift.
Step 1 - Inicie sesión e inicie un Redshift Cluster siguiendo los siguientes pasos.
Inicie sesión en la consola de administración de AWS y utilice el siguiente enlace para abrir la consola de Amazon Redshift: https://console.aws.amazon.com/redshift/
Seleccione la región donde se creará el clúster usando el menú Región en la esquina superior derecha de la pantalla.
Haga clic en el botón Iniciar clúster.
Se abre la página Detalles del clúster. Proporcione los detalles requeridos y haga clic en el botón Continuar hasta la página de revisión.
Se abre una página de confirmación. Haga clic en el botón Cerrar para finalizar de modo que el clúster esté visible en la lista Clústeres.
Seleccione el clúster en la lista y revise la información de Estado del clúster. La página mostrará el estado del clúster.
Step 2- Configure el grupo de seguridad para autorizar las conexiones del cliente al clúster. El acceso de autorización a Redshift depende de si el cliente autoriza una instancia EC2 o no.
Siga estos pasos para agrupar la seguridad en la plataforma EC2-VPC.
Abra la consola de Amazon Redshift y haga clic en Clústeres en el panel de navegación.
Seleccione el clúster deseado. Se abre su pestaña Configuración.
Haga clic en el grupo Seguridad.
Una vez que se abra la página del grupo Seguridad, haga clic en la pestaña Entrante.
Haga clic en el botón Editar. Configure los campos como se muestra a continuación y haga clic en el botón Guardar.
Type - Regla TCP personalizada.
Protocol - TCP.
Port Range- Escriba el mismo número de puerto utilizado al iniciar el clúster. El puerto predeterminado para Amazon Redshift es 5439.
Source - Seleccione IP personalizada, luego escriba 0.0.0.0/0.
Step 3 - Conéctese a Redshift Cluster.
Hay dos formas de conectarse a Redshift Cluster: directamente o mediante SSL.
Los siguientes son los pasos para conectarse directamente.
Conecte el clúster mediante una herramienta de cliente SQL. Admite herramientas de cliente SQL que son compatibles con controladores PostgreSQL JDBC u ODBC.
Utilice los siguientes enlaces para descargar: JDBC https://jdbc.postgresql.org/download/postgresql-8.4-703.jdbc4.jar
ODBC https://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_08_04_0200.zip o http://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_09_00_0101x64.zip para máquinas de 64 bits
Utilice los siguientes pasos para obtener la cadena de conexión.
Abra la consola de Amazon Redshift y seleccione Clúster en el panel de navegación.
Seleccione el clúster de su elección y haga clic en la pestaña Configuración.
Se abre una página como se muestra en la siguiente captura de pantalla con la URL de JDBC en Propiedades de la base de datos del clúster. Copie la URL.
Utilice los siguientes pasos para conectar el clúster con SQL Workbench / J.
Abra SQL Workbench / J.
Seleccione el archivo y haga clic en la ventana Conectar.
Seleccione Crear un nuevo perfil de conexión y complete los detalles requeridos como nombre, etc.
Haga clic en Administrar controladores y se abrirá el cuadro de diálogo Administrar controladores.
Haga clic en el botón Crear una nueva entrada y complete los detalles requeridos.
Haga clic en el icono de la carpeta y navegue hasta la ubicación del controlador. Finalmente, haga clic en el botón Abrir.
Deje en blanco el cuadro Nombre de clase y el cuadro URL de muestra. Haga clic en Aceptar.
Elija el controlador de la lista.
En el campo URL, pegue la URL de JDBC copiada.
Ingrese el nombre de usuario y la contraseña en sus respectivos campos.
Seleccione la casilla Autocommit y haga clic en Guardar lista de perfiles.
Características de Amazon Redshift
Las siguientes son las características de Amazon Redshift:
Supports VPC - Los usuarios pueden iniciar Redshift dentro de VPC y controlar el acceso al clúster a través del entorno de red virtual.
Encryption - Los datos almacenados en Redshift se pueden cifrar y configurar mientras se crean tablas en Redshift.
SSL - El cifrado SSL se utiliza para cifrar las conexiones entre los clientes y Redshift.
Scalable- Con unos pocos clics, la cantidad de nodos se puede escalar fácilmente en su almacén de datos de Redshift según los requisitos. También permite escalar sobre la capacidad de almacenamiento sin ninguna pérdida de rendimiento.
Cost-effective- Amazon Redshift es una alternativa rentable a las prácticas tradicionales de almacenamiento de datos. No hay costos iniciales, compromisos a largo plazo y una estructura de precios bajo demanda.