AWS Quicksight: uso de fuentes de datos

AWS Quicksight acepta datos de varias fuentes. Una vez que hace clic en "Nuevo conjunto de datos" en la página de inicio, le brinda opciones de todas las fuentes de datos que se pueden utilizar.

A continuación se muestran las fuentes que contienen la lista de todas las fuentes internas y externas:

Veamos cómo conectar Quicksight con algunas de las fuentes de datos más utilizadas:

Subiendo un archivo del sistema

Le permite ingresar archivos en formato .csv, .tsv, .clf, .elf.xlsx y Json solamente. Una vez que selecciona el archivo, Quicksight reconoce automáticamente el archivo y muestra los datos. Cuando haces clic enUpload a File , debe proporcionar la ubicación del archivo que desea utilizar para crear el conjunto de datos.

Usando un archivo de formato S3

La pantalla aparecerá como se muestra a continuación. En Nombre de la fuente de datos, puede ingresar el nombre que se mostrará para el conjunto de datos que se crearía. Además, necesitaría cargar un archivo de manifiesto desde su sistema local o proporcionar la ubicación S3 del archivo de manifiesto.

El archivo de manifiesto es un archivo de formato json, que especifica la URL / ubicación de los archivos de entrada y su formato. Puede ingresar más de un archivo de entrada, siempre que el formato sea el mismo. A continuación, se muestra un ejemplo de un archivo de manifiesto. El parámetro "URI" utilizado para pasar la ubicación del archivo de entrada es S3.

{
   "fileLocations": [
      {
         "URIs": [
            "url of first file",
            "url of second file",
            "url of 3rd file and so on"
         ]
      },
   
   ],
}
"globalUploadSettings": {
   "format": "CSV",
   "delimiter": ",",
   "textqualifier": "'",
   "containsHeader": "true"
}

Los parámetros pasados globalUploadSettingsson los predeterminados. Puede cambiar estos parámetros según sus necesidades.

MySQL

Debe ingresar la información de la base de datos en los campos para conectarse a su base de datos. Una vez que esté conectado a su base de datos, puede importar los datos desde ella.

Se requiere la siguiente información cuando se conecta a cualquier base de datos RDBMS:

  • Nombre de DSN
  • Tipo de conexión
  • Nombre del servidor de base de datos
  • Port
  • Nombre de la base de datos
  • Nombre de usuario
  • Password

Las siguientes fuentes de datos basadas en RDBMS son compatibles con Quicksight:

  • Amazonas Atenea
  • Amazonas Aurora
  • Amazon Redshift
  • Espectro de Redshift de Amazon
  • Amazon S3
  • Análisis de Amazon S3
  • Apache Spark 2.0 o posterior
  • MariaDB 10.0 o posterior
  • Microsoft SQL Server 2012 o posterior
  • MySQL 5.1 o posterior
  • PostgreSQL 9.3.1 o posterior
  • Presto 0.167 o posterior
  • Snowflake
  • Teradata 14.0 o posterior

Atenea

Athena es la herramienta de AWS para ejecutar consultas en tablas. Puede elegir cualquier tabla de Athena o ejecutar una consulta personalizada en esas tablas y utilizar la salida de esas consultas en Quicksight. Hay un par de pasos para elegir la fuente de datos

Cuando elige Athena, aparece la siguiente pantalla. Puede ingresar cualquier nombre de fuente de datos que desee dar a su fuente de datos en Quicksight. Haga clic en“Validate Connection”. Una vez validada la conexión, haga clic en el“Create new source” botón

Ahora elija el nombre de la tabla en el menú desplegable. El menú desplegable mostrará las bases de datos presentes en Athena que además mostrarán tablas en esa base de datos. De lo contrario, puede hacer clic en“Use custom SQL” para ejecutar consultas en tablas de Athena.

Una vez hecho esto, puede hacer clic en “Edit/Preview data” o “Visualize” para editar sus datos o visualizarlos directamente según sus necesidades.

Eliminar una fuente de datos

Cuando elimina una fuente de datos que está en uso en cualquiera de los paneles de Quicksight, puede inutilizar el conjunto de datos asociado. Suele suceder cuando consulta una fuente de datos basada en SQL.

Cuando crea un conjunto de datos basado en S3, Sales force or SPICE, no afecta su capacidad para utilizar ningún conjunto de datos, ya que los datos se almacenan en SPICE; sin embargo, la opción de actualización no está disponible en este caso.

Para eliminar una fuente de datos, seleccione la fuente de datos. Vaya a la pestaña Desde fuente de datos existente para crear una página de conjunto de datos.

Antes de la eliminación, también puede confirmar el tamaño estimado de la tabla y otros detalles de la fuente de datos.