{"id":1019,"date":"2018-02-23T15:26:19","date_gmt":"2018-02-23T15:26:19","guid":{"rendered":"http:\/\/matrixcpmsolutions.com?p=1019"},"modified":"2018-07-23T15:28:03","modified_gmt":"2018-07-23T15:28:03","slug":"los-datos-son-petroleo","status":"publish","type":"post","link":"https:\/\/matrixcpmsolutions.com\/es\/los-datos-son-petroleo\/","title":{"rendered":"\u00a1Los datos son petr\u00f3leo!"},"content":{"rendered":"<article id=\"post-588\" class=\"post-588 post type-post status-publish format-standard has-post-thumbnail hentry category-sin-categoria tag-data-warehouse tag-datos tag-petroleo tag-refineria-de-datos\">\n<div class=\"entry-content\">\n<p>Cada vez m\u00e1s, las empresas ven a sus datos como su activo m\u00e1s preciado. Son el \u201cnuevo petr\u00f3leo\u201d descubierto y por tanto requieren de procesos de refinamiento para convertirlos en combustible del \u00e9xito.<\/p>\n<p>La refinaci\u00f3n de datos es el proceso mediante el cual se pueden depurar datos heterog\u00e9neos dentro de un contexto com\u00fan (la empresa), para hacer posible su comprensi\u00f3n y la obtenci\u00f3n de informaci\u00f3n de los mismos. Esto se logra eliminando la variabilidad de los datos y su redundancia, con lo que se obtiene un recurso de datos integrados de mucho valor para la toma de decisiones.<\/p>\n<p>Estudios recientes demuestran que el 90% de los datos disponibles hoy son de fuentes de\u00a0<a href=\"http:\/\/matrixcpmsolutions.com\/wp-content\/uploads\/2015\/10\/Objeto-inteligente-vectorial3-01.png\"><img loading=\"lazy\" decoding=\"async\" class=\" size-medium wp-image-589 alignright\" src=\"http:\/\/matrixcpmsolutions.com\/wp-content\/uploads\/2015\/10\/Objeto-inteligente-vectorial3-01-300x300.png\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" srcset=\"http:\/\/matrixcpmsolutions.com\/wp-content\/uploads\/2015\/10\/Objeto-inteligente-vectorial3-01-300x300.png 300w, http:\/\/matrixcpmsolutions.com\/wp-content\/uploads\/2015\/10\/Objeto-inteligente-vectorial3-01-150x150.png 150w, http:\/\/matrixcpmsolutions.com\/wp-content\/uploads\/2015\/10\/Objeto-inteligente-vectorial3-01-624x624.png 624w, http:\/\/matrixcpmsolutions.com\/wp-content\/uploads\/2015\/10\/Objeto-inteligente-vectorial3-01.png 862w\" alt=\"Objeto inteligente vectorial3-01\" width=\"300\" height=\"300\" \/><\/a>datos no estructuradas. La refiner\u00eda de datos es la primera oferta capaz de procesar grandes cantidades de datos no estructurados provenientes de diferentes tipos de organizaciones, en todos los tipos de formatos (oraciones largas y complejas, frases cortas con errores ortogr\u00e1ficos y gramaticales y otros tipos de datos) y provenientes de diferentes tipos de medios (p\u00e1ginas web, art\u00edculos de blog, mensajes y respuestas en redes sociales, quejas recogidas, etc.) de manera eficiente.<\/p>\n<p>El proceso de refinaci\u00f3n de datos es uno de los aspectos m\u00e1s importantes al almacenarlos porque los datos no refinados pueden causar un desastre en la producci\u00f3n de informaci\u00f3n de una empresa. Tradicionalmente se desarrolla un proceso de extracci\u00f3n, transformaci\u00f3n, y carga de datos (ETL) con el cual se recopilan datos de varias fuentes, se transforman para cumplir con las reglas de negocio y las mejores pr\u00e1cticas de arquitectura de datos y finalmente se procede a la carga en un almac\u00e9n de datos centralizado para efectos de an\u00e1lisis (el Data Warehouse).<\/p>\n<p>Para automatizar el proceso de aprovisionamiento y explotaci\u00f3n de grandes vol\u00famenes de datos en una organizaci\u00f3n de manera eficiente, debe echarse mano de herramientas que lo permitan. Con Pentaho Data Integration y Hadoop se puede lograr un hub de informaci\u00f3n multi-fuente de alto rendimiento, donde se pueden almacenar, mezclar y luego publicar autom\u00e1ticamente los datos en forma de conjuntos de datos en motores de bases anal\u00edticas tales como HP Vertica, para su consumo y explotaci\u00f3n por parte del usuario final mediante el descubrimiento de datos, informes, cuadros de mando y procesos anal\u00ed\u00adticos avanzados.<\/p>\n<p>D\u00e9 un paso adelante.<\/p>\n<\/div>\n<footer class=\"entry-meta\">\n<div class=\"author-info2\">\n<div class=\"author-avatar\"><\/div>\n<div class=\"author-description\">\n<h2><\/h2>\n<div class=\"author-link\"><\/div>\n<\/div>\n<\/div>\n<\/footer>\n<\/article>\n<div class=\"autor-biografia\"><img loading=\"lazy\" decoding=\"async\" class=\"avatar avatar-145 wp-user-avatar wp-user-avatar-145 photo avatar-default\" src=\"http:\/\/2.gravatar.com\/avatar\/eb80723e7ecb25e6f4196c0fb4767cf2?s=145&amp;d=mm&amp;r=g\" alt=\"\" width=\"145\" height=\"145\" \/><\/p>\n<div class=\"autor-info\">\n<h3 class=\"autor-nombre\">Leonardo Astudillo<\/h3>\n<p class=\"autor-descripcion\">Ingeniero de Sistemas egresado de la UNEXPO\u200b \u200b\u200b&#8221;\u200bAntonio Jos\u00e9 de Sucre&#8221; con m\u00e1s de 15 a\u00f1os de experiencia en el desarrollo e implantaci\u00f3n de proyectos de soluciones inform\u00e1ticas, bases de datos relacionales y columnares, plataformas de datos compartidos, aplicaci\u00f3n de procesos bajo el marco de trabajo de ITIL, proyectos de Inteligencia de Negocios, facilitaci\u00f3n y adiestramiento. Posee m\u00faltiples certificaciones en habilitadores tecnol\u00f3gicos y marcos metodol\u00f3gicos de Microsoft, CA, ITIL, Tableau y Pentaho entre otras. Leonardo Astudillo comparte su pasi\u00f3n entre la tecnolog\u00eda y la m\u00fasica, es cantante l\u00edrico y cursa estudios de clarinete. Actualmente se desempe\u00f1a como Consultor L\u00edder de Business Intelligence en Matrix CPM Solutions.<\/p>\n<ul class=\"autor-enlaces\">\n<li class=\"autor_tw\">\n<div class=\"icon-twitter\"><\/div>\n<\/li>\n<li class=\"autor_lin\"><\/li>\n<\/ul>\n<\/div>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Cada vez m\u00e1s, las empresas ven a sus datos como su activo m\u00e1s preciado. Son el \u201cnuevo petr\u00f3leo\u201d descubierto y por tanto requieren de procesos de refinamiento para convertirlos en combustible del \u00e9xito. La refinaci\u00f3n de datos es el proceso mediante el cual se pueden depurar datos heterog\u00e9neos dentro de un contexto com\u00fan (la empresa), [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":1020,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[23],"tags":[],"class_list":["post-1019","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-news"],"_links":{"self":[{"href":"https:\/\/matrixcpmsolutions.com\/es\/wp-json\/wp\/v2\/posts\/1019","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/matrixcpmsolutions.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/matrixcpmsolutions.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/matrixcpmsolutions.com\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/matrixcpmsolutions.com\/es\/wp-json\/wp\/v2\/comments?post=1019"}],"version-history":[{"count":1,"href":"https:\/\/matrixcpmsolutions.com\/es\/wp-json\/wp\/v2\/posts\/1019\/revisions"}],"predecessor-version":[{"id":1021,"href":"https:\/\/matrixcpmsolutions.com\/es\/wp-json\/wp\/v2\/posts\/1019\/revisions\/1021"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/matrixcpmsolutions.com\/es\/wp-json\/wp\/v2\/media\/1020"}],"wp:attachment":[{"href":"https:\/\/matrixcpmsolutions.com\/es\/wp-json\/wp\/v2\/media?parent=1019"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/matrixcpmsolutions.com\/es\/wp-json\/wp\/v2\/categories?post=1019"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/matrixcpmsolutions.com\/es\/wp-json\/wp\/v2\/tags?post=1019"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}