Archivo por meses: noviembre 2016

Eres un buen desarrollador con Pentaho Data Integration? PDI, Pentaho Data Integration, Kettle

162612973_5e3eeacdbeLa plataforma de inteligencia de negocios de Pentaho es muy conocida y utilizada en toda Latinoamérica. Matrix CPM Solutions fue uno de sus primeros aliados certificados de Pentaho en la región ya hace mas de 8 años y sin duda colaboró mucho en la creación del ecosistema de aliados cuando en los primeros años se hizo un gran esfuerzo para dictar los cursos oficiales de Pentaho en las ciudades mas importantes de Centro y Sur América.

Hoy en día Pentaho sigue teniendo cientos de miles de “downloads” en todo el mundo y América Latina representa un porcentaje muy alto en la descargas y uso de la versión comunitaria, todo lo contrario al resto de las regiones donde se prioriza el uso de la versión comercial o paga del software.

Posiblemente sea Kettle (nombre que también se le da a Pentaho Data Integration) la herramienta mas usada y conocida de toda la suite. Puedo decir con conocimiento de causa que Kettle es muy popular en Venezuela, México, Colombia, Ecuador y en varios países de Centro América, en especial en Guatemala y El Salvador. La verdad es que es una herramienta de ETL fantástica. Es muy completa y poderosa, además de ser muy fácil de entender y utilizar. Esto posiblemente es a su vez su gran problema, porque la gente piensa que con utilizarla y hacerla funcionar lo están haciendo bien.

Hoy en día cualquiera persona con un conocimiento básico de bases de datos puede hacer procesos de ETL con PDI. ¿Pero los hacen bien?, y con bien entendemos que se ejecute eficientemente utilizando los recursos disponibles. La experiencia dice que NO.

Por nuestra empresa han pasado decenas de personas que han tenido varios meses o años trabajando con Kettle y al ponerlos a desarrollar una prueba técnica muy básica, no son capaces de terminarlo. También hemos visto que muchas empresas con su equipos internos o consultores ofrecen sus servicios en Kettle y cuando empieza a enfrentar retos interesantes de volúmenes de datos, disparidad en orígenes o utilización de bases de datos “modernas” como Columnares, NoSQL o Hadoop, todo se complica y le terminan echando la culpa a la herramienta. Un tema común que encontramos en estos equipos es que nadie ha recibido una formación oficial en ETL o en el uso de Kettle. Todos han aprendido por sus propios medios, teniendo a los foros como guía principal.

Ronald Rojas, socio, líder técnico de la empresa y posiblemente una de las personas con mayor experiencia en el uso de Pentaho en la región, afirma con frecuencia que todos pueden usar Kettle, pero hoy en día son muy pocos lo que han aprendido a desarrollar procesos eficientes. La verdad es que ni siquiera existe una capacitación oficial sobre “entonación” u “optimización” en PDI.
Conclusión: Si eres usuario de Kettle (Pentaho Data Integration, PDI) no pierdas la oportunidad de capacitarte y orientar tu conocimiento no solo al uso de la herramienta sino a explotar bien todo su potencial.

—————————————

Puedes revisar la disponibilidad de cursos en http://www.pentaho.com/service/training, consulta nuestra página: www.matrixcpmsolutions.com o escribe a pentaho@matrixcpmsolutions.com para consultar sobre nuestra oferta de cursos.

Decálogo MATRIX para el desarrollo de proyectos de Inteligencia de Negocios

1. ¡Calidad, ciclo de vida y validación! Todo está en los datos

Las soluciones de Inteligencia de Negocios parten en los datos. Es imprescindible entender cómo, cuándo y dónde se generan los datos ya que provienen de distintas fuentes, gestionadas y ubicadas en diferentes aplicaciones y repositorios. Al hacer esto, por lo general aparecen inconsistencias en los datos, lo que nos obliga a recordar estas afirmaciones: “Si lees basura, sale basura” y, “Siempre hay basura”. Como consecuencia, es preciso validar, validar y validar los datos fuentes en los repositorios y en los cubos hasta asegurar resultados correctos.

2. Participación activa de los usuarios del negocio

El objetivo final de un proyecto de Inteligencia de Negocios es proveer información valiosa a los actores del negocio. Por tanto, estos deben participar activamente en la conceptualización, diseño y certificación de la solución. Cuando el usuario participa y se involucra en el desarrollo del proyecto es capaz de hacer análisis con el modelo y la herramienta igual o mejor que el desarrollador y/o consultor.

3. Entender el negocio y los procesos

Debe tenerse una visión completa del negocio y sus procesos, llegar a entenderlo como usuarios finales (terminología, cálculos, flujo de datos y procesos, indicadores clave de desempeño, etc.). Esto permitirá aclarar el panorama del proyecto y garantizará resultados óptimos.

4. Definir estándares de desarrollo

Definir los estándares de desarrollo es una actividad primordial. En este punto, el equipo deberá plantearse cómo definir:
– Nombre del modelo, de las dimensiones (en singular, por el elemento más granular) y de las medidas
– Nombre de campos, tablas, vistas, funciones y otros objetos del repositorio de datos
– Ubicación de archivos ETL, cubos, parámetros, etc.
– Procesos Extracción, Transformación y Carga (ETL)
– Estrategia de sustitución de caracteres especiales (áóñ&%$#@)

5. El Modelo de datos debe dar respuestas a las interrogantes del negocio

Se debe trabajar en un diseño que garantice cubrir las necesidades y requerimientos de los usuarios. Definir el esquema de la base de datos apropiado (estrella, copo de nieve o big table), las dimensiones y métricas, las jerarquías, los atributos, su granularidad, la frecuencia, el periodo de lectura, el uso de elementos dummy y todo aquello que permita visualizar de forma correcta los requerimientos del usuario. Es importarse preguntarse: ¿El modelo da respuestas a todas las interrogantes de los usuarios?

6. Metodología de desarrollo de ciclos cortos e incrementales

Es recomendable apegarse desde el inicio a una metodología de diseño incremental por prototipos (ej. SCRUM). A través de este tipo de metodologías, se podrán realizar entregas y vistas analíticas relevantes en períodos cortos del tiempo del proyecto. Esto permitirá acelerar la disponibilidad de la información y trabajar de forma iterativa con los usuarios, suministrando entregas funcionales concertadas. Al momento de ofertar o inclusive, de iniciar un proyecto, se recomienda definir, acotar y desarrollar una parte especifica en tiempo breve para que las partes interesadas tengan una visión clara de las características del desarrollo y de su alcance.

7. Claridad en la distribución de la información

Si la definición del modelo datos es importante para garantizar la efectividad y desempeño de la solución, no menos importante es definir la estrategia para distribuir los resultados de la información. Es vital conocer cómo se va a representar y distribuir la información y el uso de: reportes fijos, reportes dinámicos, vistas de cubos, paneles de control, mapas y portales. Cada usuario de acuerdo a su rol, debe acceder lo que necesita para cubrir sus requerimientos usando las distintas opciones antes mencionadas en la capa de visualización.

8. Pensar en el mañana y tomar en cuenta el mantenimiento después del pase a producción

Aunque los proyectos requieran siempre resultados inmediatos, se debe reflexionar sobre la adaptabilidad de la solución a futuras modificaciones. El negocio se encuentra siempre bajo un ambiente de cambios, por lo que un sistema de Inteligencia de Negocios solo se mantendrá a lo largo del tiempo si el modelo es simple y fácil de mantener.

9. Conocer las bondades de la herramienta a utilizar

Se deben conocer las prestaciones y limitantes del habilitador tecnológico a utilizar, así como también las diferentes opciones que éste ofrece para lograr el mismo resultado. Se debe dar siempre la mejor opción al usuario sobre sus requerimientos. De igual manera, es menester que el usuario final comprenda y conozca las características de la herramienta y su alcance para no crearse falsas expectativas.

10. Agregar Valor

En todo desarrollo, el cliente tiene una visión sobre qué es lo que quiere y cómo lo quiere. El consultor y su equipo intercambiarán ideas y conocimientos para agregar valor a cada elemento desarrollado. En otras palabras; suministrarle al usuario final más de lo que esperado sin incurrir en costos adicionales ni en variaciones del proyecto.

Decálogo BI MATRIX

Análisis predictivo

     La razón de su uso estaría en las grandes ventajas que ofrece a las organizaciones, muchas de ellas vinculadas a las posibilidades de contribuir de forma importante a la toma de decisiones estratégicas de marketing.

¿Qué es el análisis predictivo?

Son el conjunto de algoritmos matemáticos, técnicas estadísticas, minería de datos, Big Data que nos permiten mediante el análisis de datos actuales realizar predicciones sobre eventos futuros.

Un análisis que se realiza través de la recopilación de datos estructurados como son por ejemplo la edad, el género, el estado civil, el nivel de ingresos, etc.; como los datos no estructurados que pueden ser los contenidos en redes sociales u otros tipos de textos.

Obtener información a partir de los datos, que puedan revelar tendencias futuras, así como la identificación por parte de las empresas de riesgos y oportunidades y que poner en práctica esta tecnología, es una de las prioridades para un 34% de las empresas a nivel mundial en los próximos dos años.

¿Cómo puede aplicarse en Marketing?

Las posibilidades de aplicación del análisis predictivo son enormes, desde predecir que clientes van a fugarse en una entidad financiera o predecir qué clientes pueden incrementar su cesta de productos ante una determinada oferta en un retail. O poder conocer cuánto dinero hay que invertir por soporte publicitario en una empresa de marketing u optimizar la demanda por tipo de revista y kiosco en una empresa de periódicos.

Pero además, lo primordial es entender cuál es el objetivo sobre el que se desea inferir una predicción, sin dejar de lado que este tipo de análisis tiene entre sus ventajas la posibilidad de simular escenarios “what – if”. Eventos simulados sobre los que se busca predecir los resultados bajo diferentes hipótesis, al poder cambiar datos, como por ejemplo conocer, cuantas ventas vamos a tener de un producto en función de la inversión, soporte y franja horaria que vamos a usar para un anuncio concreto.

Dentro de los análisis predictivos pueden aplicarse los propiamente predictivos, es decir, aquellos que detectan factores de riesgo y nuevas oportunidades de negocio, mediante el análisis de datos históricos y, sobretodo, actuales, en tiempo real, mientras se lleva acabo una determinada operación o proceso.

A los que se suman la posibilidad de aplicación de los modelos de descripción, para detectar relaciones entre servicios/productos y clientes (actuales o potenciales), para establecer relación de función entre ambas partes, con base en datos información sobre preferencias del consumidor.

También se puede acudir al uso de modelos orientados a la toma de decisión, mediante los cuales se usan los resultados de las operaciones de analítica predictiva para ponerlos a disposición de los responsables en la toma de decisiones corporativas.

Las operaciones que brinda la analítica predictiva son múltiples, tanto para grandes empresas como para pymes que deseen gestionar mejor sus inversiones en marketing y publicidad a través de esta herramienta, de tecnologías de la información, con la que ir más allá de las corazonadas y la experiencia.


Fuente: Merca 2.0 Por Valeria Murgich

Business Intelligence & Analytics y marketing

     Datos que pueden ser útiles cuando se trata de establecer una estrategia de marketing, siempre y cuando se logre una pertinente identificación, análisis y aplicación de los mismos para dar información que sea aplicable y pueda transformarse en acción.

     Para ello una de las herramientas con las que cuentan marcas y empresas es la Business Intelligence (BI) & Analytics. Después de todo, “quien tenga acceso a todos estos datos y sepa cómo interpretarlos correctamente, tendrá una gran ventaja con respecto a la competencia.

    La conjunción entre Business Intelligence y marketing permite a los profesionales que acuden a ellas.

A nivel mundial, el uso de Business Intelligence & Analytics es tal que alcanzará los 16,900 millones de dólares en 2016, lo que representa un incremento del 5.2 por ciento con respecto al año pasado.

Los Perfiles Mas Solicitados

      Este reconocimiento por parte de las empresas sobre la importancia que tiene el uso de las herramientas de Business Intelligence para poder dar respuesta a la necesidad de más información sobre los clientes y usuarios que permita personalizar las campañas u ofertas, ha llevado a que los perfiles profesionales relacionados con el manejo de data, se encuentren entre los más solicitados en marketing online.

    Así lo muestra un análisis llevado a cabo por Digilant tomando como base su experiencia en mercados como España, Reino Unido, México, Chile, Colombia, Italia y Perú y en el que los perfiles con mayor demanda serían los de Chief Data Officer (CDO), Chief Analytical Officer (CAO) y Data Scientist.

    La productiva relación entre los profesionales de la data y el marketing “en definitiva, se trata de extraer en tiempo real y accionable a partir del Big Data para ayudar a las marcas a tomar mejores decisiones de negocio y que afecten positivamente a su ROI.”


Fuente: Merca 2.0 Por Valeria Murgich