El Rincon del BI

Descubriendo el Business Intelligence…

Comparativa ETL´s OpenSource vs ETL´s Propietarias

Posted by Roberto Espinosa en 10 enero 2010


La elección de una herramienta ETL puede ser una tarea compleja que va a tener mucha repercusión en el desarrollo posterior de un proyecto. Podeis ver la comparativa de ETL´s OpenSource vs ETL´s Propietarias a continuación ( gracias a http://www.jonathanlevin.co.uk/). Aqui se habla de que las herramientas OpenSource ya estan empezando a ser una alternativa real a los productos existentes y se estan desarrollando con rapidez.

En la web EtlTools.net también se hace una comparación de las herramientas ETL propietarias y las Open mas conocidas. De la misma manera, se analizan los productos Open de una forma muy rigurosa en el portal openmethodology.org.

Igualmente, os dejo el link a un documento donde se habla de todo lo que tendremos que tener en cuenta a la hora de realizar la selección de una herramienta ETL (características que habrán de tener, criterios para la evaluación, etc). Acceder al documento aquí.

Comparativa Talend / Pentaho

Si finalmente os decidis por utilizar herramientas ETL Open, la empresa francesa ATOL ha realizado una comparativa entre Pentaho y Talend con varios casos de ejemplo, comparativa de características, etc. (acceder al informe aquí , esta escrita en Frances pero es bastante completa).

Tambien os puede resultar interesante para comparar ambos productos la entrada del blog Wiki Wednesday, donde Vincent McBurney nos habla de los pros y contras de cada una de las herramientas, de una forma bastante completa (ademas hace referencia a varios sitios donde se estan analizando ambos productos).

5 comentarios to “Comparativa ETL´s OpenSource vs ETL´s Propietarias”

  1. Valen said

    que tal?
    hice ya unas pruebas con Kettle y cumple con lo que andaba buscando, pero tengo unas preguntas espero me puedas ayudar:
    tengo el programa funcionando en una estacion de trabajo, necesito ponerlo en produccion, necesito otro programa para que cuando cierre Kettle sigan los Jobs funcionando? pro ejemplo en SQL se suben los jobs a SQL y el agente de SQL se encarga de ejecutarlos, Kettle con que programa trabaja para dejar los jobs trabajando?

    espero me puedas ayudar

    gracias y saludos

  2. Hola:

    Tu preparas las transformaciones en Spoon ( y los jobs, que son la orquestación de varias transformaciones ). Una vez los tienes preparados, tienes unas herramientas para ejecutarlos, a través de linea de comandos, que son las que te permiten preparar scripts para automatizarlos. Las herramientas son:

    -Pan: es la herramienta que nos permite la ejecución de las transformaciones diseñadas en spoon (bien desde un fichero o desde el repositorio). Nos permite desde la linea de comandos preparar la ejecución mediante scripts.
    -Kitchen: similar a Pan, pero para ejecutar los trabajos o jobs.
    -Carte: es un pequeño servidor web que permite la ejecución remota de transformaciones y jobs.

    Las herramientas te valen tanto si has creado las transformaciones como ficheros xml (extension ktr) o si estas trabajando con el repositorio.

    Puedes automatizar los procesos utilizando adicionalmente el crontab (en unix/linux) o el winat (en windows), para establecer calendarios de ejecución de los scripts.

    Un saludo y suerte.

  3. valen said

    que tal Roberto,
    sigo con kettle, y me he topado con el problema del cache, estoy insertando datos de un server a otro, cuando hago modificaciones en la estructura de la tabla destino y despues veo el layout de esta tabla dentro de kettle no me actualiza el cambio, al parecer se queda el cache con la tabla vieja, hay alguna forma de eliminar para que reconozca los cambios?

    gracias y saludos

    • Hola Valen:

      En los parametros de Kettle (opción de menú Edit –> Options), tienes el parametro “Use Database Cache”. Prueba a desactivarlo a ver si asi te funciona como tu quieres.

      De todas, como consejo, yo tendria bien diseñado mi modelo de base de datos antes de empezar a hacer nada. Asi te evitas ese tipo de problemas.

      Suerte!!

  4. Juan V. said

    Buenos días Roberto,
    Estoy creando procesos ETL con Pentaho Data Integration y desearía saber como activar en la solapa ‘execution results’ la opción para ver la tabla temporal creada en cada paso de transformación. Por ejemplo, en un paso de lectura poder ver una tabla con los registros que ha leído. Estoy en la versión spoon 3.2.0.
    Un saludo, gracias,

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

 
A %d blogueros les gusta esto: