Archivo de la categoría: datos

Eres un buen desarrollador con Pentaho Data Integration? PDI, Pentaho Data Integration, Kettle

162612973_5e3eeacdbeLa plataforma de inteligencia de negocios de Pentaho es muy conocida y utilizada en toda Latinoamérica. Matrix CPM Solutions fue uno de sus primeros aliados certificados de Pentaho en la región ya hace mas de 8 años y sin duda colaboró mucho en la creación del ecosistema de aliados cuando en los primeros años se hizo un gran esfuerzo para dictar los cursos oficiales de Pentaho en las ciudades mas importantes de Centro y Sur América.

Hoy en día Pentaho sigue teniendo cientos de miles de “downloads” en todo el mundo y América Latina representa un porcentaje muy alto en la descargas y uso de la versión comunitaria, todo lo contrario al resto de las regiones donde se prioriza el uso de la versión comercial o paga del software.

Posiblemente sea Kettle (nombre que también se le da a Pentaho Data Integration) la herramienta mas usada y conocida de toda la suite. Puedo decir con conocimiento de causa que Kettle es muy popular en Venezuela, México, Colombia, Ecuador y en varios países de Centro América, en especial en Guatemala y El Salvador. La verdad es que es una herramienta de ETL fantástica. Es muy completa y poderosa, además de ser muy fácil de entender y utilizar. Esto posiblemente es a su vez su gran problema, porque la gente piensa que con utilizarla y hacerla funcionar lo están haciendo bien.

Hoy en día cualquiera persona con un conocimiento básico de bases de datos puede hacer procesos de ETL con PDI. ¿Pero los hacen bien?, y con bien entendemos que se ejecute eficientemente utilizando los recursos disponibles. La experiencia dice que NO.

Por nuestra empresa han pasado decenas de personas que han tenido varios meses o años trabajando con Kettle y al ponerlos a desarrollar una prueba técnica muy básica, no son capaces de terminarlo. También hemos visto que muchas empresas con su equipos internos o consultores ofrecen sus servicios en Kettle y cuando empieza a enfrentar retos interesantes de volúmenes de datos, disparidad en orígenes o utilización de bases de datos “modernas” como Columnares, NoSQL o Hadoop, todo se complica y le terminan echando la culpa a la herramienta. Un tema común que encontramos en estos equipos es que nadie ha recibido una formación oficial en ETL o en el uso de Kettle. Todos han aprendido por sus propios medios, teniendo a los foros como guía principal.

Ronald Rojas, socio, líder técnico de la empresa y posiblemente una de las personas con mayor experiencia en el uso de Pentaho en la región, afirma con frecuencia que todos pueden usar Kettle, pero hoy en día son muy pocos lo que han aprendido a desarrollar procesos eficientes. La verdad es que ni siquiera existe una capacitación oficial sobre “entonación” u “optimización” en PDI.
Conclusión: Si eres usuario de Kettle (Pentaho Data Integration, PDI) no pierdas la oportunidad de capacitarte y orientar tu conocimiento no solo al uso de la herramienta sino a explotar bien todo su potencial.

—————————————

Puedes revisar la disponibilidad de cursos en http://www.pentaho.com/service/training, consulta nuestra página: www.matrixcpmsolutions.com o escribe a pentaho@matrixcpmsolutions.com para consultar sobre nuestra oferta de cursos.

¿Que hace a Tableau tan exitoso?

     En Matrix CPM Solutions tenemos ya más de 2 años ofreciendo Tableau a nuestros clientes. Yo en lo personal he tenido la oportunidad de trabajar con cerca de 10 distintas herramientas de BI a lo largo de mis mas de 20 años dedicado exclusivamente a este tema, y he logrado ver y experimentar cuando una herramienta se destaca en algo por encima de la demás. En mis ultimas presentaciones he insistido que el Éxito de Tableau está en su capacidad de adopción dentro de las empresas.

Los proyectos de BI siempre han tenido un Ìndice de fracaso muy alto y aunque los factores son “multidimensionales” (no cumple con las expectativas, no se terminó, se entregó muy tarde o simplemente cambiaron las fuentes o requerimientos y se hizo imposible actualizarlo) el resultado final es que la inversión realizada en el software se pierde por completo y la empresa entra en pánico o shock al pensar de nuevo que tiene que empezar un nuevo proyecto de BI, posiblemente con otra herramienta.

Cuando hablo de adopción, es que a pesar de que cualquier de estos factores ocurran, el usuario que haya utilizado Tableau, va a intentar seguir utilizándolo, porque no depende del todo del área de TI para poder utilizarlo, sino que el mismo es capaz de hacer grandes visualizaciones con los datos que estén a su disposición. A los usuarios de Tableau, les duele dejar de utilizar Tableau.

Novedades en Tableau 10, la Herramienta de Visualización de Datos

     Cada vez que Tableau lanza una nueva versión, aunque sea en pruebas, la gran comunidad en torno a esta herramienta de visualización de datos complejos hace retumbar el sonajero de la promoción. Tableau 10 es la última edición de una herramienta bien valorada.

No solo está bien considerada por sus usuarios, ya sean periodistas o analistas, y bien promocionada por los conocidos como Tableau Zen Master, sino que gran parte de las consultoras de medio mundo emiten informes muy positivos de Tableau en comparación con otras herramientas de inteligencia de negocio. Gartner publica anualmente un cuadrante con los líderes del sector, un informe que ellos llaman el ‘Cuadrante Mágico para las Plataformas de Inteligencia de Negocio y Analítica’, que este febrero de 2016 vuelve a colocar a Tableau entre las mejores opciones del mercado junto a las soluciones de Microsoft, Qlik o Alteryx.

Fruto de su enorme éxito es la evolución casi constante de la propia herramienta. Rara vez hace caso omiso a las peticiones de la comunidad, realmente involucrada en la mejora de la plataforma, y siempre implementa mejoras que generan valor y perpetúan el uso por parte de los usuarios, tanto de pago como la versión libre (en este caso conocida como Tableau Public).

La versión 10, que incluye algunas cuestiones interesantes para sus usuarios:

1.     Tableau responsive para dispositivos móviles Android

Si existía alguna petición de los usuarios de Tableau, esa era sin duda la adaptación sencilla de los paneles a los dispositivos móviles. Tableau se había convertido en una herramienta de cuadros de mando bastante útil para su visionado en escritorio, pero cuando esas consultas se realizaban desde teléfonos móviles la experiencia de usuario era bastante negativa.

Por ahora Tableau permite una adaptación responsive de los cuadros de mando para los dispositivos móviles que utilizan sistema operativo Android (Google). Con esta versión los usuarios pueden compartir sus visualizaciones de datos en cualquier tipo de pantalla, ya que personaliza y publica los cuadros de inteligencia de negocio optimizados tanto para escritorio, como para tabletas o teléfonos móviles.

2. Control de versiones en los libros de trabajo

Tableau 10 ha incorporado una nueva funcionalidad que puede resultar realmente útil cuando se tratan con grandes volúmenes de datos. Es algo similar a cualquier sistema de control de versiones, como que el que pueden utilizar los sistemas de gestión de contenidos (CMS). A día de hoy, cualquier usuario de Tableau 10 puede volver a una versión anterior de sus libros de trabajo a través del Tableau Server. Con la versión 10, los libros de trabajo se pueden restaurar directamente, sin necesidad de tener que descargar y publicar los datos de nuevo. Un avance que aporta facilidad.

Además, el usuario de Tableau 10 tiene la ventaja de que antes de restaurar una versión anterior de su cuadro de mandos, tiene la opción de previsualizarla para escoger la versión exacta que quiere publicar. En ese flujo de trabajo, el usuario puede incluso abrir varias versiones previas a la vez en distintas pestañas. Tableau ofrece la opción de que los usuarios puedan limitar desde la configuración del propio Tableau Server el número de revisiones por libro que se puede permitir.

3. Mejoras en la API de JavaScript

Tableau ha decidido introducir mejora en la API REST de JavaScript, un movimiento esencial si quiere extender sus tentáculos y ofrecer todo tipo de oportunidades a usuarios y desarrolladores que quieren integrar Tableau con otros servicios. Además, la propia interfaz de usuario de aplicaciones tiene mejoras en las llamadas que podemos hacer a la API para obtener datos para nuestras visualización. En concreto, una de los avances más importantes la posibilidad de filtrar y ordenar.

Para extraer un dato concreto en las versiones anteriores de Tableau era necesario hacer una petición GET a la API REST e iterar con todos y cada uno de esos datos para encontrar una aguja en un pajar. Ahora ese flujo de trabajo ha quedado atrás. Se automatiza el proceso de la búsqueda final: primero se hace una petición GET a la API REST y después se aplica un filtro para hallar el dato, sin ir uno a uno. El filtro en cuestión sería algo parecido a esto, con la idea de obtener la información de un usuario llamado, por ejemplo, juan: /users?filter=name:eq:juan.

4. Filtrar a la vez en varios conjuntos de datos

Esta característica parece una tontería, pero cuando estás haciendo visualizaciones de datos, tener la capacidad de usar un único filtro para dos gráficos distintos con dos tablas de datos diferentes puede ser una maravilla. Única condición en Tableau 10: que el campo por el que queramos filtrar en ambas visualizaciones se llame igual en las dos tablas de datos. Una condición lógica.

5. Punto extra de novedades en Tableau 10

Los cuatro puntos anteriores no resumen del todo las nuevas funcionalidades que Tableau ha decidido incorporar a su nueva versión recién estrenada. Hay más:

- Incluye una nueva tipografía especial para facilitar la compresión de las visualizaciones de datos. Su creador es el conocido Tobias Frere-Jones, un diseñador que ya tiene más de 700 tipos a su nombre.

Tableros por tipo de dispositivos: con Tableau 10 los usuarios pueden compartir sus libro de trabajo escogiendo el tipo de pantallas según el dispositivo en el que lo quieran hacer: móviles, tabletas o escritorio.

Creación de regiones personalizadas: ahora es posible seleccionar con el cursor una región concreta dentro de una visualización tipo mapa y después eliminar el campo geográfico original para mantener esa selección propia.


Fuente: BBVAOpen4U

¿Que Pasa Con La Integración de Datos en la Empresas?

     Hace unas semanas tuve la oportunidad de reunirme con los socios de la empresa y revisando entre números y proyectos regionales, llegamos a la conclusión que cerca del 70% de los proyectos activos, estaba relacionado con requerimientos y necesidades de integración de Datos de nuestros clientes. Entonces, porque cuando mas esfuerzo están haciendo los software de BI en mejorar sus capacidades de visualización, nos llegan tantas oportunidades en la integración y preparación de Datos?. Estas son mis suposiciones:

- A pesar de tener que manejar solamente datos estructurados, la cantidad de los mismos está sobrepasando a los manejadores tradicionales de Bases de Datos y las empresas están adoptando las Bases de Datos Columnares como repositorio para sus consultas y análisis.
– Algunas empresas están experimentado con datos no estructurados y no saben como incorporarlos a sus procesos analÌticos.
– Las soluciones en la nube que se comercializan como SaaS cada vez son más populares y se necesita integrar sus datos con las aplicaciones tradicionales de la empresa
– A pesar de los esfuerzos que se han realizado para tener todo lo que se necesita en los ERP, muchas empresas tienen una variedad alta de fuentes de datos que aún no logran integrar.
– Es posible que el uso de herramientas avanzadas de visualización estén permitiendo a las empresas entender los vacíos o necesidades que tienen en la integración de datos y esto hace que se impulsen estos requerimientos.

¿Están sus empresas dentro de estas suposiciones?