tutorial studio services que intelligence español development business sql-server reporting-services ssas business-intelligence pentaho

sql server - studio - Pentaho vs Microsoft BI Stack



sql server integration services español (9)

Advertencia: hay numerosos sitios que enumeran las numerosas deficiencias, errores y molestias con SSIS. No estoy seguro de por qué SSIS salió en la parte superior con la publicación, pero antes de apostar a su proyecto, mire lo que la gente tiene que decir en la blogósfera. Según mi experiencia, hay 20: 1 despotricando sobre lo horrible que es trabajar con SSIS. También puedo estar de acuerdo, actualmente estoy buscando alguna alternativa.

Mi empresa está muy involucrada en MS BI Stack (SQL Server Reporting Services, -Analysis Services y -Integration Services), pero quiero echarle un vistazo a lo que aparentemente es Pentaho, la alternativa de código abierto más comentada.

He instalado una versión, y la puse en funcionamiento sin problemas. Así que eso es bueno. Pero realmente no tengo el tiempo para comenzar a usarlo para el trabajo real para obtener una comprensión completa del paquete.

¿Alguno de ustedes tiene alguna idea de cuáles son los pros y los contras de Pentaho vs MS BI, o cualquier enlace a tales comparaciones?

¡Muy apreciado!


Empecé a usar MS Reporting Services hace muchos años y me encanta. No he probado la solución de informes de Penaho, así que no puedo comentar al respecto. Tampoco probé ni Analysis Services ni la alternativa de Pentaho.

Recientemente necesité una solución ETL y estar familiarizado con MSSQL y MSRS me pareció obvio que revisaría y probablemente elegiría MS Integration Service. Pero para mí, MSIS fue horrible. Principalmente porque no fue intuitivo. Después de pasar un par de días tratando de aprender la herramienta, decidí buscar una alternativa y encontré Pentaho Data Integration, anteriormente conocida como Kettle. Lo tuve funcionando en cuestión de minutos e inmediatamente creé mi primera transformación. Simplemente funciona.

Es cierto que mis necesidades son bastante simples, pero el rendimiento ha sido excelente y la comunidad parece muy útil.


Gran información aquí? No he probado Pentaho pero y estoy planeando verificarlo. Soy un experimentado consultor de MS BI, que lo usa desde 1998. SSIS es muy rápido y muy poderoso, pero las críticas son acertadas. Encontré los siguientes problemas con SSIS:

(1) Es difícil de depurar, se obtienen errores crípticos que pueden no dar ninguna pista sobre qué y dónde está realmente el problema.

(2) Según un comentario anterior, ¡es el entorno de desarrollo más chiflado de todos los tiempos! No tengo idea de lo que están pensando.

(a) Cree una tabla con 100 o más columnas y coloque una fusión en ella. Ahora regrese y trate de hacer una actualización de la combinación de combinación (como pasar una nueva columna). Puede tardar varios minutos, incluso en la máquina más rápida después de hacer clic en Aceptar en la combinación de combinación para guardar el cambio. Tengo un gran flujo de datos con muchos registros amplios y muchas combinaciones de fusión. Agregar una columna al flujo de datos lleva más de medio día. Actualizo una combinación de fusión y luego tengo que hacer otra cosa y volver a comprobar 5-10 minutos más tarde para ver si se ha completado. La respuesta de Microsoft a esto es dividir su paquete en múltiples paquetes, colocar los datos en una tabla o binario entre ellos. Bueno, si va al disco entre todos los pasos, ¡puede estar bien hacer todo en SQL! Uno de los propósitos principales de una herramienta de ETL es guardar todo esto en la memoria y evitar la E / S del disco.

(b) El diseñador se cuelga a veces, perdiendo todo su trabajo desde la última vez que guardé (hago ctrl-S en mi sueño ahora debido a esto)

(c) Tuve que encontrar un truco y generar el paquete XML de SSIS en Excel para registros amplios. Tengo un cliente de atención médica donde más de 600 registros de columna son comunes. ¡Si intenta definir un formato de archivo con 600 columnas en SSIS, debe escribir cada columna en una a la vez! Incluso el acceso a MS le permite cortar y pegar un diseño de una hoja de cálculo en un diseño de archivo, pero no en SSIS. Así que tuve que generar el XML del diseño y pegar el código XML en el lugar correcto del paquete. Una manera fea de hacerlo, pero ahorró días enteros de trabajo y muchos errores.

(d) Similar a (c), si necesita recortar todas sus columnas y tiene más de 600, ¿adivina qué? En el componente de la columna derivada, debe escribir trim (columna1) ¡más de 600 veces! Ahora hago todas las transformaciones simples como esta en la consulta SQL para obtener los datos, ya que pueden generarse fácilmente desde una hoja de Excel.

(e) Hay muchas cosas estrafalarias, componentes que se vuelven invisibles, a veces se abre el paquete y todos los componentes se reorganizan completamente incoherentemente.

(f) La función de FTP, posiblemente una de las cosas más comunes que necesita en ETL, es débil y solo es compatible con FTP simple y plano que nadie usa. Todo el mundo en estos días usa SFTP, FTPS, https, etc. Así que casi todas las implementaciones requieren el uso de una aplicación de transferencia de archivos impulsada por la línea de recomendación de terceros que el paquete debe llamar.

(g) Al tratar de CYA, similar a la seguridad ridícula en Windows Vista, Microsoft ha hecho extremadamente difícil promover realmente un paquete SSIS de un entorno a otro. De manera predeterminada, esta cosa estúpida de "cifrar información confidencial con la clave de usuario" de seguridad, lo que significa que debe ejecutarse bajo la misma cuenta en el entorno que lo está moviendo como el entorno que desarrolló, algo que rara vez es el caso. Hay mejores formas de configurar, pero siempre intenta volver a esta protección de seguridad completamente inútil.

(h) Finalmente, la mayoría de estos problemas se encuentran ahora en la tercera versión, indicando claramente que Microsoft no tiene un plan para solucionarlos.

(i) La depuración no es tan fácil como otros lenguajes.

SSIS todavía tiene muchos beneficios, pero no sin algunos dolores serios.


He usado SSIS y Pentaho Kettle, y recomiendo usar Pentaho Kettle para su herramienta ETL en lugar de SSIS.

Mis razones: el flujo de SSIS es tarea por tarea. Kettle te hace pensar en filas de datos que fluyen a través del sistema. El enfoque de Kettle me parece mucho más intuitivo. -SISIS está mal documentado. Esto pasa. Pero parece que hay un montón de chasquidos y ajustes de variables. Muy complejo. Pentaho tiene un foro comunitario que es bastante útil. Confío en que Pentaho se integre con múltiples tipos de bases de datos, incluido SQL Server. También puedes usar JDBC, lo cual es bueno. Además, lo he usado para ir entre SQL Server y Oracle por un lado y Vertica por el otro. Tiene un cargador a granel disponible en Vertica. Eso es bastante bueno. -He encontrado que es muy difícil hablar en términos relativos para obtener un paquete de SSIS para que se ejecute en un servidor. Simplemente no valía la pena mi tiempo. -Me resultó bastante fácil para Pentaho enviar una advertencia o un mensaje de error a una persona o lista de personas. -Pentaho permite realizar tareas en JavaScript para cosas que necesitan un poco de lógica. Simple y fácil de hacer con un idioma que la mayoría de nosotros hemos encontrado.


No puedo ofrecer ninguna opinión sobre MS BI Stack, pero en el Barcamp Orlando más reciente, la gente de Pentaho estuvo allí y habló sobre sus productos y fue una demostración extremadamente impresionante.

El hecho de que sea un proyecto de código abierto que puede extenderse usted mismo y un paquete pagado por un servicio realmente bueno le deja con muchas opciones. Demostraron un trabajo remunerado que hicieron por un cliente y definitivamente cautivaron a la multitud.

También tuve la oportunidad de conversar un poco con un desarrollador que trabajaba en el lado del almacenamiento de datos para Pentaho y él era extremadamente astuto y estaba muy abierto a las sugerencias y no tenía problemas para responder cualquier pregunta.

Por lo que respecta a una empresa, Pentaho realmente me impresionó tanto por su trabajo como por lo amigable y accesible que eran todos sus desarrolladores.


Recientemente probé pentaho open source BI. Encontré que es extremadamente torpe. No fue muy intuitivo y el tiempo de desarrollo tomó mucho más tiempo.

Es bastante diferente de las soluciones Oracle o ms BI. Tal vez la edición empresarial es mejor.


Revisé varias pilas de Bi mientras estaba en una ruta para salir de Business Objects. Muchos de mis comentarios son preferidos. Ambos juegos de herramientas son excelentes. Algunas cosas son como prefiero el helado de brownie de chocolate con chocolate puro.

Pentaho tiene algunos tipos muy inteligentes que trabajan con ellos, pero Microsoft ha estado en una ruta bien financiada y bien planificada. Tenga en cuenta que los MS siguen siendo los menos favorecidos en el mercado de bases de datos. Oracle es el rey aquí. Para ser competitivo, MS ha estado regalando muchos artículos cuando compra la base de datos y se han visto obligados a reinventar su plataforma un par de veces. Sé que esto no se trata de la base de datos, pero la batalla de DB ha causado que MS regale mucho para agregar valor a su pila.

1.) Plataforma
El servidor SQL no se ejecuta en Unix o Linux, por lo que se excluyen automáticamente de este mercado. Windows es casi el mismo precio que algunas versiones o Unix ahora. Windows es bastante barato y funciona ahora bastante bien. Me da tantos problemas como Linux.

2.) OLAP
Los servicios de análisis se reinventaron en 2005 (actual es 2008) con respecto a la versión 2000. Es una orden de magnatud más poderosa que 2000. El pentaho (Mondrian) no es tan rápido una vez que te haces grande. También tiene algunas características. Es bastante bueno, pero hay menos herramientas. Ambos soportan Excel como la plataforma que es esencial. La versión MS es más robusta.

3.) ETL
MS - DTS ha sido reemplazado por SSIS. De nuevo, el orden de aumento de la velocidad, potencia y habilidad. Controla cualquier movimiento de datos o control de programa. Si no puede hacerlo, puede escribir un script en Powershell. A la par con Informatica en el lanzamiento de 2008. Pentaho: mucho mejor de lo que solía ser. No tan rápido como me gustaría, pero puedo hacer casi todo lo que quiero hacer.

4.) tablero
Pentaho ha mejorado esto. Es algo incómodo y antipático desarrollarlo, pero realmente no hay un equivalente real para MS.

5.) informes
Los informes de MS son realmente potentes, pero no tan difíciles de usar. Ahora me gusta, pero lo odié al principio, hasta que lo conocí un poco mejor. He estado usando informes de cristal y el generador de informes MS es mucho más poderoso. Es fácil hacer cosas difíciles en MS, pero es un poco más difícil hacer cosas fáciles. Pentaho es un poco torpe. No me gustó para nada pero podrías. Me pareció demasiado complejo. Ojalá fuera más parecido al generador de informes de Crystal o al generador de informes de MS, pero es similar a jaspe. Encuentro que es ser duro. Eso puede ser una preferencia.

6.) ad hoc
MS: este fue el verdadero ganador para mí. Lo probé con mis usuarios y se enamoraron al instante del creador de informes de usuarios de MS. Lo que marcó la diferencia fue que no solo era fácil de usar, sino también productivo. Pentaho - es bueno pero bonita en la vieja escuela. Utiliza el modelo más típico basado en asistente y tiene herramientas potentes, pero lo odio. Es una excelente herramienta para lo que es, pero hemos pasado de este estilo y nadie quiere regresar. Mismo problema que tuve con logiXML. La interfaz funcionó bien para lo que era, pero en realidad no es un gran cambio de lo que usamos hace 12 años. http://wiki.pentaho.com/display/PRESALESPORTAL/Methods+of+Interactive+Reporting

Hay algunas personas con experiencia que pueden hacer que Pentaho realmente funcione bien. Acabo de encontrar que la suite MS es más productiva.


Si está buscando una alternativa robusta y de bajo costo para los niños grandes, LogiXML cuenta con paneles de control e informes ad hoc en una plataforma .NET. Los hemos estado usando desde fines de 2006 cuando Pentaho recién estaba comenzando, pero no lo he visto en mucho tiempo.


un par de puntos para agregar

  • Aunque hay una versión de ventana de todas las herramientas de Pentaho, la instalación en Windows es onerosa. Pentaho (especialmente el inicio y parada del servidor que está separado de la herramienta de la GUI) se usa generalmente en Linux, no en Windows Shop, y existe una curva de aprendizaje empinada que va de Windows a Linux.
  • cualquier herramienta tiene una curva de aprendizaje cuando te desplazas hacia ella. Cuando te acostumbras a hacer clic siempre en Aceptar y refrescar los metadatos cuando tienes problemas, SSIS no es tan malo. Pentaho puede ser escamoso, también.

Las preguntas de la herramienta deben abordarse en términos de preguntas culturales más amplias: ¿qué tipo de tiendas usan herramientas de código abierto? en mi experiencia, descubrí que aunque las tiendas de Microsoft parezcan más rígidas, cuando tienes problemas con una cadena de conexión en una tienda de Microsoft puedes obtener ayuda ... en las tiendas Pentaho y Linux es más DYI.

Por cierto, ten cuidado con los vendedores de Pentaho que hacen demos: ¡todas las cosas que muestran son mucho más difíciles de conseguir de lo que parece! :)