El Rincon del BI

Descubriendo el Business Intelligence…

Archive for the ‘Microstrategy’ Category

Suites de Business Intelligence.

Posted by Roberto Espinosa en 12 septiembre 2010


Cuando intentamos conocer algo sobre las soluciones de Business Intelligence de los principales fabricantes (o venimos de conocer un fabricante concreto), se hace dificil aclararse entre la maraña de siglas, productos, suites, versiones (mas en algunos fabricantes tras la compra masiva de competidores de los ultimos años).

He estado buscando un poquito y pidiendo ayuda, y aquí os dejo algunos links interesantes donde se explican los principales productos de algunos de los fabricantes mas importantes de soluciones BI. Espero que os ayude a aclararos.

SUITES DE ORACLE

En Dataprix, Carlos Fernández nos explica muy bien las diferentes suites que incluye Oracle en su repertorio, así como las novedades recien presentadas en la versión 11g:

http://www.dataprix.com/las-suites-business-intelligence-oracle

http://www.dataprix.com/blogs/carlos/lo-que-trae-oracle-business-intelligence-11g

Pau de BI Facil nos habla de la confusión de los diferentes productos Oracle (motivada por las adquisiciones realizadas en los últimos tiempos ):

http://www.businessintelligence.info/productos/oracle-bi-vs-oracle-bi.html

SUITES DE SAP BUSINESS OBJECTS

Gracias a Anibal Goicochea que me ha pasado la información amablemente en  respuesta a un comentario en su blog.

anibalgoicochea.com
myBPC-BO.com

Criterios para elegir componentes
http://www.mybpc-bo.com/2010/01/criterios-para-elegir-el-componente-sap.html
http://anibalgoicochea.com/2010/06/08/un-tipo-de-reporting-para-cada-circunstancia/
http://anibalgoicochea.com/2010/04/15/simplificando-la-seleccion-de-componentes-sap-businessobjects/
http://anibalgoicochea.com/2010/01/12/la-herramienta-de-bi-mas-idonea-para-el-usuario/

Altenativas para la PYME
http://www.mybpc-bo.com/2010/01/criterios-para-elegir-el-componente-sap.html
http://anibalgoicochea.com/2010/02/25/sap-businessobjects-para-la-pyme-otra-propuesta/

Herramientas para cuadros de mando
http://www.mybpc-bo.com/2009/07/sap-businessobjects-herramientas-para.html
http://www.mybpc-bo.com/2009/07/dashboards-y-scorecards-con-xcelsius.html

Recuento de herramientas BO en SAP
http://www.mybpc-bo.com/2009/07/sap-y-business-objects-una-union.html
http://anibalgoicochea.com/2010/05/06/sap-bo-componentes-de-bi-como-en-ninguna-plataforma/

Web Intelligence – Reporting Self Service
http://anibalgoicochea.com/2010/05/03/bi-self-service-un-complemento-para-el-reporting/
http://www.mybpc-bo.com/2010/04/conectividad-de-bo-con-sap-vista-desde.html

Buscador Empresarial – Una Tendencia
http://anibalgoicochea.com/2010/04/21/sap-businessobjects-explorer-el-protagonista-de-cualquier-evento/
http://anibalgoicochea.com/2010/06/02/otra-forma-de-consumir-contenidos-bi/

RoamBI – el mejor complemento para el móvil
http://anibalgoicochea.com/2010/04/17/roambi-un-excelente-complemento-para-el-bi-en-el-movil/

InfoView, el portal
http://anibalgoicochea.com/2010/04/30/el-lado-2-0-de-infoview/

BO para tratamiento de datos
http://www.mybpc-bo.com/2009/07/la-plataforma-de-bi-lider-tiene-mas-de.html

Lo que viene …
http://anibalgoicochea.com/2010/07/06/pioneer-o-sap-businessobjects-advanced-analysis-ya-mas-visible/
http://anibalgoicochea.com/2010/06/30/sap-presenta-innovacion-total-2015/

Otros links interesantes sobre Business Objects (Manuales, Comparativa con Oracle y Microstrategy, Información sobre Crystal Reports, etc):

http://todosap.blogspot.com/2010/01/manuales-sap-business-objects.html

http://anibalgoicochea.com/2010/07/09/novedades-de-obiee-11g-oracle-bi-pendientes-en-sap-businessobjects/

http://anibalgoicochea.com/2010/07/17/microstrategy-vs-sap-businessobjects/

http://anibalgoicochea.com/2010/06/11/crystal-reports-forever/

http://anibalgoicochea.com/2010/05/26/soluciones-sap-crystal-en-%e2%80%9cfree-trial%e2%80%9d/

http://anibalgoicochea.com/2010/05/18/rebranding-o-presentacion-de-la-marca-sap-crystal-reports/

SUITES DE IBM COGNOS

Otra vez Carlos de Dataprix nos describe muy acertadamente los componentes de las suites de IBM-Cognos:

http://www.dataprix.com/introduccion-cognos-bi-suite-business-intelligence-ibm

David Soto, en su blog de Integración y Calidad de Datos también nos explica muy bien los productos de IBM, haciendo mas hincapie en los productos de integración de datos:

http://integracionycalidad.blogspot.com/2010/02/el-portfolio-de-ibm-ibm-information.html

SUITES DE MICROSTRATEGY

Microstrategy ofrece un abanico mucho mas reducido de productos, intentando siempre que su suite aparezca como una aplicación integrada donde los diferentes elementos que la conforman forma un conjunto integrado de herramientas.

Podeis ampliar información sobre el producto en el analisis de la plataforma publicado en este blog:

https://churriwifi.wordpress.com/2010/04/05/14-12-conclusiones-evaluacion-final-microstrategy9/

En la web del fabricante podeis ver un detalle de los elementos que forman la suite:

http://www.microstrategy.es/Software/businessintelligence/

SUITES DE MICROSOFT

Respecto a Microsoft, podeis ampliar información en la web del fabricante:

http://www.microsoft.com/spain/sql/2008/business-intelligence.aspx

Sitios relacionados

Tambien en el blog SQLServer Si, de Salvador Ramos.

Creo que con todos estos links y análisis podemos hacernos algo más de idea de los diferentes productos que tenemos en el mercado, de cara a la selección de una plataforma de Business Intelligence (fuera del ambito del Open Source, donde no he querido entrar).

Posted in Business Intelligence, IBM Cognos, Microsoft, Microstrategy, Oracle, Sap | 12 Comments »

14.12. Conclusiones. Evaluación final de Microstrategy 9.

Posted by Roberto Espinosa en 5 abril 2010


Durante los ultimos dos meses hemos estado validando las funcionalidades que nos proporciona la suite Microstrategy 9 (gran parte de ellas incluidas, como ya vimos,  en la versión gratuita Reporting Suite). Para hacer esto, definimos un proyecto sencillo ambientado en el análisis de ventas, con el que hemos podido desarrollar y explotar el sistema de BI, así como validar y profundizar en todas y cada una de las funcionalidades del producto de una forma detallada (y ampliar nuestros conocimientos en las diferentes técnicas asociadas con el Business Intelligence).

Ejemplo de Cuadro de Mando utilizando Microstrategy

Hemos intentado hacer mas didáctica la prueba incluyendo ejemplos reales de todo y ampliando los aspectos de teoria de Business Intelligence relacionados para ponernos en situación. Aquí os dejo los links a las diferentes entradas del Blog:

Llega el momento de las conclusiones y de hacer una recopilación de todo lo visto hasta ahora. Para ello, vamos a hacer un resumen de las funcionalidades mas importantes, y un cuadro donde describiremos lo que nosotros pensamos que son los puntos fuertes y los puntos débiles de Microstrategy.

Cuadro de funcionalidades

Reporting

Las funcionalidades mas destacables en lo referente al reporting son las siguientes:

  • Utiliza crosstab o tablas cruzadas donde se pueden formatear y personalizar todos los componentes (filas, columnas, titulos, subtotales), a todos los niveles.  Renombrado de indicadores en los informes. Se pueden crear estilos personalizados ( aparte de los estandar).
  • Uso de umbrales de formato o con simbolos para destacar valores en rangos determinados (permiten configurar alertas, aviso de desviaciones o cumplimiento previsiones).
  • Ordenación avanzada: ordenación a todos los niveles, utilizando tanto atributos como indicadores (de forma individual o combinada).
  • Filtros en informes sobre indicadores. Selección de N valores: se pueden realizar filtrado de los indicadores, y limitación de N valores (N primeros, N ultimos, N valores entre el 10 y 15, etc).
  • Paginación: creación de atributos de paginado para permitir analisis de información en conjuntos muy grandes de datos.
  • Definicion de totales y subtotales totalmente personalizados (podemos crear los nuestro propios). Tipos de totalizacion multiple: total, maximo, minimo, mediana, moda.  Selección de la posición de salida en el informe.
  • Visualizacion jerarquica de resultados. Desglose automatico de la visualización de datos por niveles.
  • Insercion de calculos entre indicadores. Porcentajes sobre el total y transformaciones: indicadores adicionales en los informes que reflejan calculo de otros indicadores o atributos, o bien reflejan información porcentual (a nivel de fila o columna o a nivel de atributo).
  • Diferentes formatos de exportacion de los informes: excel, html, csv, pdf.
  • Ejecucion de informes integrados en Office: con el componente Office podemos abrir informes y ejecutarlos desde Word, Excel o Powerpoint.
  • Navegacion. Movilidad de componentes: navegación dimensional por los datos según las jerarquias de usuario. Mapas de navegacion personalizables (para permitir solo navegar por determinados atributos) o para prohibir la navegación.
  • Filtros de visualizacion: filtros que se aplican sobre la visualización del informe una vez calculado. Limites a nivel de informes: definido en la creación de un informe.
  • Uso de cache: guardado de resultados de ejecución en memoria para mejorar el rendimiento. Programación de actualizaciones de cache. Expiraciones.
  • Grupos personalizados y consolidaciones: creación de grupos de atributos o valores de indicadores de grupos de atributos para reflejar estructuras al vuelo o no definidos en el modelo de datos. Creación de Datamarts para exportar subconjuntos de datos para otros análisis (como data mining) o para crear datamarts departamentales.
  • Generacion de informes a partir de sentencias SQL.
  • Definición avanzada de filtros: estaticos, dinamicos. Funciones avanzadas de definicion de filtros. Filtros para selección de objetos (por ejemplo, para seleccionar en tiempo de ejecución que indicadores o atributos se incluiran en el informe) . Filtros de seguridad: filtros para limitar el acceso a los valores de atributos a determinados usuarios.
  • Multitud de tipos de gráficos disponibles: area, linea, barras, tarta o circular, dispersión, polar, radial, burbuja. Graficos avanzados como Cotizacion, Histograma, Indicador, Embudo, Pareto, Diagrama de Caja, Gant, etc.
  • Resultado de informes como filtro de otros informes. Links desde atributos a la ejecución de otros informes.
  • Amplitud de caracteristicas de analisis en la creación de indicadores con los diferentes tipos de funciones matemáticas, estadísticas, numéricas, etc.

Navegación Olap

En lo referente a la navegación Olap, podemos destacar lo siguiente:

  • Plataforma Olap Relacional (ROLAP).
  • Cliente Olap: navegación multidimensional, grupos (Grupos Personalizados y Consolidaciones), paginación, subtotales, ordenación avanzada, visualización jerarquica, umbrales, Filtros de visualización e indicadores, columnas calculadas, agregacion dinámica (todo ello integrado en el sistema de reporting, tal y como hemos visto anteriormente) .
  • Elementos Derivados: grupos de atributos creados al vuelo. Seria algo complementario a los grupos personalizados y las consolidaciones.
  • Cubos inteligentes: cubos MOLAP que se construyen mediante informes donde seleccionamos atributos, indicadores y filtros. Los cubos construidos almacenan los datos en un lugar diferente y  son atacados por los informes sin necesidad de volver a consultar la base de datos.
  • Conexion MDX para atacar a otros sistemas (Sap, Hyperion, Microsoft) a traves del lenguaje MDX.
  • Dynamic Sourcing: característica avanzada que permite la creación automática de cubos inteligentes por parte del Integrity Server sobre los datos que son utilizados con mas frecuencia (requiere configuración adicional en el sistema).

Ejemplo de Tablero en Analisis de Datos Públicos

Documentos.Cuadros de Mando y Tableros. Report Services.

Con respecto a los Tableros y Cuadros de Mando, podemos considerar lo siguente:

  • Diseño de documentos: informes del tipo documento para preparar presentaciones de información tipo pdf (con secciones, encabezados, pies de pagina, grupos) o para la construcción de formularios. En ellos se integran informes, gráficos, texto, imagenes. Multiples posibilidades de formato. Orientados a la impresión o a exportación de otros formatos.
  • Diseño de tableros: documentos para construir tableros, tarjetas de puntuación y cuadros de mando. Permiten crear documentos de alta calidad combinando informes y gráficos, ademas de controles (selectores, botones, casillas de selección, etc).
  • Conjunto de datos: los documentos del tipo tablero utilizan como origen de datos uno o varios informes, que determinan el conjunto de datos que se pueden utilizar en los componentes del tablero. A partir de un único origen de datos, podemos construir multiples presentaciones de la misma información en cuadriculas o gráficos (incluso con filtros de visualización especificos en cada uno), para visualizar la información con diferentes presentaciones o agrupaciones.
  • Uso Widgets Flash, HTML. Los widgets nos permiten utilizar componentes flash de alto contenido visual para presentaciones vistosas. Uso de HTML propio para personalizar los tableros (quizas para publicar los resultados en una intranet corporativa).
  • Otros elementos: Vinculacion de objetos (un control o los elementos seleccionados de una tabla pueden determinar los elementos a visualizar en otros controles).  Multiples formatos de visualización (html, pdf, flash) y exportación (excel ademas de los anteriores).

DataMining.

  • Importación / exportación de modelos de analisis previsible con el formato estandar de la industria PMML.
  • Integración con el reporting, permitiendo desarrollar y analizar los resultados de los modelos en informes estandar.
  • Visor de modelos previsibles grafico integrado donde construir, perfeccionar y validar los analisis de data mining.
  • Tipos de analisis permitidos: Regresión lineal , Regresión Exponencial, Regresión Logistica, Agrupación (Clustering), Arbol de Decisiones, Series Temporales y Asociacion.

Data Mining en Microstrategy - Arbol Decision

Distribución de resultados.

  • Distribución de resultados a través del sistema de ficheros, impresoras de sistema o via correo electrónico.
  • Multiples formatos para la distribución de la información: pdf, excel, html, csv, texto.
  • Procesos de distribución automaticos programados en el Integrity Server. Suscripciones gestionadas por el administrador o por los mismos usuarios.

Acceso Web / Otros

  • Portal personalizable integrado con Integrity Server y con Microsoft IIS, desde el cual se pueden diseñar informes o documentos y realizar la ejecución de estos.
  • Administración de servicios desde la consola Desktop.

Cuadro de Ventajas / Inconvenientes

Como ventajas o puntos fuertes y destacables de Microstrategy 9, podríamos enumerar las siguientes:

Ambito

Descripción

Instalación Instalación y configuración del sistema muy sencilla e intuitiva.
Configuración Todo esta centralizado en un par de herramientas (Desktop/Architect) desde las que se realizan todas las tareas. El Architect es una herramienta gráfica muy fácil de utilizar, desde la cual implementamos el modelo lógico de DW a partír de las tablas físicas. Desde el Desktop configuramos el resto de objetos del metadatos (todo desde la misma herramienta), como son indicadores, filtros, selecciones, grupos personalizados, plantillas, informes, documentos, etc.
Documentación Amplia documentación en pdf para todos los componentes (traducidos al castellano el Reporting Básico y Avanzado y la creación de Documentos).
Ejemplos Proyectos de ejemplo (Tutorial) y proyectos tematicos (Analytic Modules) que nos permiten una profundización en el conocimiento del producto, viendo ejemplos reales de todos los componentes.
Arquitectura Arquitectura SOA a través del Intelligent Server. En el se centralizan toda la ejecución de informes y consultas, así como los procesos de actualización desasistidos y la distribución de resultados. Producto consistente e integrado. Generador de querys optimizado. Soporta particionamiento.
Reporting Herramienta de reporting muy avanzada, que deja puertas abiertas para hacer casi de todo. Multiples formatos de gráficos disponibles con gran capacidad de personalización. Interfaz de usuario unificada.

Olap

Navegación dimensional integrada con el reporting. Funcionalidades avanzadas, como el uso de Cubos Inteligentes, que permiten navegación en memoria. Conexión con otros sistemas a traves de MDX.
SDK Creación de aplicaciones via Narrowcast Server. Integración de las funcionalidades de Microstrategy en otras aplicaciones a traves del SDK.
Tableros y cuadros de mando Generación de documentos y tableros con multiples funcionalidades para realizar presentaciones vistosas, en los que se integran varios informes o gráficos. Exportación en Html o Flash para publicación. Uso de origenes de datos (informes) como fuentes que se pueden visualizar de multiples maneras con controles separados y cada uno con su filtro de visualización.
Distribucion de Resultados Automatización de la distribución de resultados muy completa, via email, impresoras o ficheros y en diferentes formatos (Excel, Pdf, Html, Flash, Csv).
Datamining Posibilidad de integración con herramientas especificas de Data Mining a traves del estandar PMML. La mineria de datos esta totalmente integrada con el reporting. Uso de Datamarts para crear subconjuntos de datos en BD.
Web Acceso Web para el diseño y ejecución de informes/documentos con funcionalidades completas.
Conectividad Cliente para Blackberrys, iPhone(Beta). Integracion con webs via SDK.
Licencias Reporting Suite: funcionalidad completa de forma gratuita (con la limitación de licencias, productos y el uso de 1 Cpu). Paso a Microstrategy 9 ampliando licencias y funcionalidades con costes adicionales.

Como inconvenientes o puntos débiles de Microstrategy 9, podríamos destacar los siguientes:

Ambito

Descripción

Complejidad Técnica Complejidad: hay elementos que tienen una complejidad alta (dimensionalidad atributos, diseño de documentos, data mining). Seguramente muchas funcionalidades avanzadas no se utilizaran en un entorno de empresa media.
Reporting Limitaciones en el formato (aunque se pueden compensar en parte utilizando los documentos).
Cuadros de Mando/Tableros Complejidad en el diseño de los documentos. No es el producto más logrado de la Suite. Diferentes resultados visuales según el tipo de presentación (es muy labioroso conseguir el formato deseado). Hay tipos de gráfico, por ejemplo, que no estan soportados en flash.
Data Mining No es una herramienta especifica de Data Mining. Número de técnicas limitadas.
Licencias Producto propietario. Costes altos en el momento salimos de la Reporting Suite.

Si habeis trabajado con Microstrategy, quizas se os ocurra algo mas que se pueda incluir o rectificar. No estarían mal vuestros comentarios para completar la evaluación.

Posted in Business Intelligence, Microstrategy | 1 Comment »

14.11.2. Explotando los datos públicos de Londres con Microstrategy.

Posted by Roberto Espinosa en 31 marzo 2010


Con los datos de Londres recién sacados del horno y cargados en la base de datos, hemos construido un proyecto dentro de Microstrategy, dando de alta los atributos y sus jerarquias, todos los indicadores vistos, así como otros indicadores adicionales para el calculo de porcentajes o valores intermedios. El proyecto de analisis se ha simplificado lo máximo posible, pues no es nuestro objetivo considerar todas las posibles variantes y casuisticas que nos podriamos encontrar, pero si el plantear una serie de ejemplos reales que nos permitan ver las posibilidades de analisis que se presentan con los datos públicos y ver el partido que se podría sacar de ellos.

Definicion del modelo de datos en Microstrategy

Resultados de elecciones

Hemos procesado los ficheros de resultados de elecciones europeas de 2004 y 2009, así como las elecciones regionales de 2004. Para analizar los resultados, hemos creado un informe donde podemos seleccionar el año de la elección a visualizar, el tipo de elección de ese año, y el area de Londres de la que queremos ver el resultado. Para ello, añadimos los atributos Año, Tipo Elección y Area en la sección de paginación del informe, y los indicadores de análisis en las columnas (tenemos la opción en cada criterio de selección de indicar el valor Total para ver toda la información). Por ejemplo, en la imagen estamos viendo los resultados de las elecciones Europeas de 2004 para todas las areas de Londres.

Resultados Electorales - Porcentaje por Partido Politico

Igualmente, hemos definido otro gráfico para poder ver de una forma rápida la evolución del voto en las tres elecciones que hemos analizado. En este informe, igualmente, permitimos ver el analisis del total de resultados o el análisis de un distrito en concreto. Así podemos ver que area es de voto Conservador o de Izquierdas, y como ha evolucionado el voto. Por ejemplo, en la imagen podeis ver los datos del distrito de Newham, que es mayoritario de voto Socialista (Partido Laborista), ademas con un aumento de este partido en las últimas elecciones.

Comparativa Evolución Voto por Partido

Para cerrar el tema de los resultados electorales, hemos construido un informe resumen de resultados (con los valores númericos), incluyendo datos de participación, total de votos y porcentajes. Igualmente, podemos ver los resultados totales de la región o el detalle de cada distrito.

,

Datos Completos de Resultados Electorales y Participacion

Evolución del precio de la vivienda.

De todas las estadísticas relacionadas con la vivienda, tenemos tres muy interesantes (además con una serie temporal amplia que incluye varios años). En concreto, son los valores de precio medio de venta de las viviendas, el número de ventas realizadas en el ejercicio y el total de viviendas construidas (inicio de construccion). Hemos juntado las tres variables de análisis en un informe grafico de ejes de lineas verticales con dos ejes. Ademas, hemos incluido para todas las variables un linea de tendencia lineal para ver hacia donde apuntan los valores futuros según los serie histórica. El resultado del informe es el siguiente:

Evolucion Anual del Precio de la Vivienda, Ventas y Construccion

Como podeis ver, en Inglaterra también estan viviendo su propia crísis inmobiliaria con una bajada profunda de las ventas de casas, asi como una estabilización e incluso descenso moderado de los precios debido a la bajada de la demanda y a la crisis financiera. Sería interesante ver este mismo informe con los datos reales de nuestro pais.

Series Históricas de Poblacion.

Los datos de población histórica, incluidos en los datos públicos de Londres, abarcan desde el año 1801 al 2001. Estos datos pueden ser interesantes para ver series y poder ver como se ha modificado la población historicamente de forma general o en cada zona en particular. En el ejemplo siguiente, podeis ver la evolución por Zona (Circunscripción), desde el año 1901 al 2001.

Evolucion Poblacion 1901-2001 por Zona (Circunscripcion)

Utilizando la misma información, hemos preparado un documento Pdf que muestra, para cada distrito o area, la evolución de la población desde 1901 hasta la actualidad, comparandola con la evolución de la población total. Hemos generado la información utilizando un documento que se ha exportado en formato Pdf para su distribución. Os dejo el acceso al documento para que lo veais:

Distribución de población por edad.

En todo análisis demográfico que se precie, es de gran interes el estudio de la distribución de la población por edades. Esto determina muchos aspectos, como pueden ser las necesidades de colegios en una zona (al tener gran cantidad de población infantil), los servicios sociales para atender población jubilada (si el numero de personas de determinadas edades es muy grande), o simplemente para ver como evoluciona la población en la llamada piramide poblacional.

Con los datos del censo de 2001 referente a edades, hemos elaborado dos interesantes gráficos. En el primero, vemos de forma conjunta la distribución de la población total y de cada uno de los distritos de Londres. Es muy gráfico pues se ve toda la información junta y es sencillo realizar comparaciones y ver pesos de cada rango de edades.

Distribucion de la poblacion por Edad - Comparativa de todos los distritos

Hemos incluido la misma información en otro gráfico para poder ver de forma mas clara la piramide poblacional para cada distrito de forma separada (o para el total de la población de Londres). El resultado es el siguiente:

Distribucion de la Poblacion por Edad - Total de la Region de Londres

Podemos observar que mas de la mitad de la población tiene una edad superior a 30 años. Esto puede adelantar problema de envejecimiento de la población en el horizonte de dentro de 20 años (como ocurre, por ejemplo, en España). Incluso, podemos ver en el primer gráfico como la población de la ciudad de Londres (area llamada City of London), esta especialmente envejecida, pues casi el 75% de la población tiene mas de 30 años.

Economia.

Un tema muy de moda en todos los paises es la economía sostenible. De los datos de Londres, referidos a este tema, hemos analizado los ratios de reciclado de basuras (evolución histórica entre los años 1999-2009). Para ello, hemos utilizado un informe tipo tabla, usando umbrales para procesar los porcentajes de una forma mas visual. Veamos los resultados:

Informe de Ratios de Reciclado de Basuras (Evolución)

De forma gráfica, se ve claramente el aumento de los ratios de reciclado, lo que indica la concienciación cada vez mayor de la gente. Se podría completar esta información con el número de contenedores instalados para poder establecer políticas que permitieran aumentar los valores.

Grafico Evolucion Reciclaje por Circunscripcion

Otro aspecto muy interesante de estudio dentro de la economia es la población activa e inactiva y su distribución. Veamos un ejemplo de análisis con la información del censo del año 2001. Para ello, hemos construido un documento de Microstrategy del tipo tablero, donde hemos incluido la información de la distribucion de la poblacion por actividad (activos y no activos), y dentro de cada grupo, su detalle. La información se presenta de forma global y también desglosada por Sexo. El tablero nos permite igualmente ver la información total de la región de Londres o ver de forma detallada cada uno de los distritos.

Analisis de Actividad de la Población

Del informe se obtienen bastantes conclusiones curiosas. El porcentaje de mujeres inactivas es claramente superior al de los hombres (40% frente al 18% de los hombres). Igualmente, las mujeres aceptan mas trabajos a tiempo parcial que los hombres, y hay mas hombres autonomos que mujeres. De las personas que se dedican a cuidar a los niños y el hogar, el porcentaje de hombres es infimo con respecto al de las  mujeres (todo ello lógico, pues son más las mujeres que renuncian a trabajar o aceptan trabajos de menos horas para poder compaginar vida laboral y familiar).

Vehiculos

La información referente a los vehículos de una ciudad también puede resultar interesante. En nuestro ejemplo hemos combinado la siguiente información en un tablero: evolución del número de vehiculos en una serie temporal, evolución de la población para analizar el contexto del número de habitantes, distribución del numero de vehículos por hogar ( hogares sin vehiculo, hogares con 1 vehiculo, con 2, con 3 o con 4 o mas), distribución de vehículos por tipo y propietario (particulares o empresas/organismos), tipos de vivienda y evolución del precio de la vivienda. Con estos ultimos dos datos intentamos dar el contexto economico a la estadística (seguramente en zonas con viviendas con precios mas alto hay mas nivel adquisitivo y seguramente mas vehiculos o mas vehiculos por hogar). Igualmente, si la zona es residencial (tipo de viviendas bungalow o casas), también habrá mas vehiculos por hogar. El resultado del informe es el siguiente:

Tablero de Analisis de Parque Movil por Distrito

Hemos incluido la posibilidad de ver los datos totales o cada distrito por separado. Del analisis de un par de distritos, obtenemos conclusiones curiosas:

  • Distrito London City: el censo de vehiculos disminuye año tras año, lo que adivina que seguramente es una zona donde se esta produciendo una salida de población hacia zonas perifericas con la vivienda mas barata y sin los problemas tipicos de las zonas más centricas. Ademas, vimos que era una de las zonas con la población mas envejecida. Tambien es curioso que el 62% de los hogares no tiene ningún vehículo (seguramente será también la zona mejor comunicada con trasporte público, tipo Metro o Autobus). De la misma manera, en la City predominan los coches cuyos propietarios son empresas u organismos (53%), a la vez que la mayoria de viviendas (un 89%), son apartamentos.
  • Distrito Kingston-upon-Thames: el censo de vehiculos aumenta año tras año, y ademas, el 47% de los hogares tiene 1 coche y el 23% hasta 2 coches. Se podría explicar seguramente por la distribución de las viviendas, ya que el 64% de ellas son del tipo casa o bungalow. Seguramente estemos hablando de una zona residencial. Aquí el 95 por ciento de los coches son propiedad de particulares.
  • Distrito de Chelsea: es una de las zonas con la vivienda mas cara,pero ello no implica mas vehiculos por hogar, como habiamos supuesto anteriormente.

Tablero de Analisis del Censo. Cuadro de Mando de Londres.

Para terminar, vamos a construir un tablero (nuestro cuadro de mando de Londres), donde vamos a incluir información variada de la región, referente principalmente al censo de 2001 (el censo es uno de los mayores estudios estadísticos que se realiza, como en España, cada 10 años). Hemos construido tres pestañas diferentes en el tablero: Información Demografica, Actividad y Vivienda/Turismo.

En la pestaña Demografía, incluimos un lote de gráficos donde reflejamos: distribución de la población por Estado Civil, Nivel Estudios, Etnia, Religion, Pais Origen y Sexo. Ademas, hemos incluido los resultados electorales de la ultimas elecciones regionales, y una grafica dinámica para ver la evolución de la población desde 1801. Finalmente, se incluye otra gráfica para ver la distribución de la población por edades.

Cuadro de Mando - Londres (Informacion Demográfica)

En las pestaña Actividad, hemos incluido otro lote de gráficos con el objetivo de analizar la población desde un ambito sociolaboral, pudiendo ver la distribución total de profesiones, así como el detalle por sexo de estas, los porcentajes de personas activas e inactivas, y la distribución de dichos colectivos, para finalmente detallar esta información igualmente por sexo. Finalmente, en la pestaña Vivienda/Turismo hemos incluido una gráficas de evolución de los impuestos por vivienda y los ratios de reciclaje por un lado, y por otro lado el precio medio de venta de viviendas y el número de casas vendidas. Igualmente, hemos incluido un gráfico con la evolución de los ingresos por turismo, así como dos gráficos de area para detallar la distribución de los hogares y la tipologia de las viviendas.

Cuadro de Mando - Londres (Informacion de Vivienda)

La información es abudante  y se observan gran cantidad de cosas curiosas en los datos. Os enumero algunas:

  • London City:  el 60% de la población tiene nivel de estudios universitario, lo que se refleja en las profesiones ( el 77% son profesionales, manager o tecnicos, llegando al 81% en los hombres). Es una zona de voto conservador, con una poblacion en su mayoria mayor de 30 años y ateos (55%), y con un porcentaje alto de extranjeros (25%). Todo esto puede deberse a que en Londres tienen su sede muchos grandes bancos y entidades financieras.
  • Barking: distrito con un 60% de la poblacion sin estudios o con estudios primarios. Eso se nota en las profesiones (donde el 34% de los hombres son operarios o empleos básicos, y las mujeres el 36% son administrativas). Hay una mayor población juvenil y el voto mayoritario es laborista (socialista). La etnia dominante es la britanica (90%), al igual que la nacionalidad (87%). Seguramente se trata de un barrio obrero. Es mas, si teneis en cuenta la información de la Wikipedia, donde se habla de este municipio, podeis observar que este fue un distrito de vivienda social entre 1921-31, donde se construyeron 27.000 casas que alojaron a mas de 100 mil personas. Igualmente, después de la 2ª Guerra Mundial se construyeron allí casas para alojar a gente que perdio su vivienda durante la guerra. Eso explicaria muchos de los datos que hemos observado.
  • Wetmister: es una zona eminentemente turística, con unos ingresos por este concepto muy altos. Si leeis igualmente en la Wikipedia, podeis ver que este municipio o distrito es el que alberga la mayoria de instalaciones del gobierno de Gran Bretaña (el Palarmento, el Palacio de Buckingham o la Abadia de Wetmister). Igualmente incluye algunos de los puntos turísticos mas importantes de Londres, como son Trafalgar Square, Victoria Station,  el Soho, Hyde Park, Piccadilly Circus o la National Gallery. Esto puede explicar que también sea una de las zonas con la vivienda mas cara.
  • Tower Hamlets: es una zona donde hay una gran población de etnia asiatica (ver la Wikipedia). Esto fue debido a que hubo una gran necesidad de mano de obra para la industria textil, que se cubrió con habitantes asiaticos, sobre todo de Bangladesh. En esta zona, la religion musulmana constituye el 36% de la población y hay una población infantil y juvenil bastante alta con respecto a otras zonas de Londres.

Os dejo el enlace al flash generado para que vosotros mismos podais jugar con los datos reales (link aquí) y sacar vuestras propias conclusiones de análisis. Para poder trabajar con el flash, es necesario descargarse primero el fichero en local y luego utilizar Internet Explorer para abrirlo (primero abrimos el programa y luego desde él abrimos el fichero, con la opción Archivo–> Abrir), permitiendo la ejecución de los controles ActiveX que lleva incluidos. Según la resolución de pantalla, es posible que tengais utilizar el zoom del Explorer para poder ver los datos correctamente.

Como hemos podido ver con estos pocos ejemplos, con una información consolidada y correctamente normalizada, la cantidad de cosas que podemos analizar. Todo un mundo de posibilidades. Y quizas un nicho de mercado con mucho potencial para vender aplicaciones de Business Intelligence a las administraciones públicas. Espero que os haya resultado interesante el experimento.

Posted in Business Intelligence, Datos Publicos, Microstrategy | 3 Comments »

14.10. Otras funcionalidades de Microstrategy 9. Distribución de resultados. Modelos de ejemplo (Analytics Modules).

Posted by Roberto Espinosa en 7 marzo 2010


Analytic Modules

Como un add-on muy interesante dentro de la plataforma de Microstrategy, los Analytics Modules son un conjunto de componentes analíticos paquetizados construidos utilizando la plataforma de Microstrategy. Lo podemos considerar como una solución de Business Intelligence predefinida, enfocada en un area concreta de las mas comunes dentro de la empresa, y que incorpora todos los elementos necesarios para construir un sistema de inteligencia de negocio. Los modulos estan mapeados contra una base de datos de ejemplo (para que podamos empezar a trabajar con ellos y validarlos de una forma inmediata), aunque  podriamos mapearlos contra nuestros propios DW o utilizarlos como un kit de iniciación para desarrollar aplicaciones o para tomar ideas de la forma de diseñar la base de datos, el modelo dimensional, o informes, gráficos, documentos y tableros.

Analytic Modules - Arbol de Proyectos

Cada módulo esta relacionado con un ambito dentro de la empresa, teniendo disponibles los siguientes:

  • Customer Analysis Module: análisis de clientes.
  • Sales Force Analysis Module: análisis de fuerzas de venta.
  • Financial Reporting Analysis Module: reporting financiero.
  • Sales and Distribution Analysis Module: ventas y distribución.
  • Human Resources Analysis Module: recursos humanos.

Analytic Modules - Cuadro Mando Recursos Humanos

Cada uno de estos módulos contiene los siguientes elementos:

  • Project metadata: metadata de cada uno de los proyectos configurado para trabajar contra el DW de ejemplo. Estos proyectos estan preparados para trabajar contra los Access que contienen los datos de ejemplo, aunque utilizando la Guia de Instalación y de Portabilidad de los Analytic Modules podremos configurarlos para que accedan a otros almacenes de datos.
  • Demo warehouses: base de datos de ejemplo en Access, como ya hemos indicado,que nos permite trabajar con los componentes del proyecto para evaluarlos o desarrollar nuevos componentes de test sin tener que construir nuestro propio DW.
  • Reference Guide: guia completa para cada uno de los modulos en PDF. En esta guia se detallan cada informe, lista de metricas, atributos y otros objetos, como el modelo lógico de los datos y el diccionario de datos. Con esta guia podemos entender el modelo de datos que hay detras del sistema BI de ejemplo, para construir los procesos de llenado en el caso de que decidamos utilizarlo con su configuración original o para el caso de que queramos modificarlo para construir nuestro propio sistema personalizado (pero tomando este modelo como punto de partida). En la documentación proporcionada con los Analytic Modules se nos explica la forma de «migrar» los módulos para hacerlos atacar nuestro propio Data Warehouse. Sería la forma de hacer que el modelo lógico definido en cada uno de los módulos apunte a nuestros datos, en lugar de apuntar a las bases de datos de ejemplo en Access.
  • Physical Data Model: modelo fisico de datos en el formato Erwin (Computer Associates). Con el podemos, utilizando la correspondiente herramienta, generar los scripts para la creación de las tablas de nuestro DW (replicariamos el DW de ejemplo del Access en la base de datos que vamos a utilizar para nuestro sistema de BI).

Cada uno de los módulos incluye ejemplos de todos los componentes de Microstrategy enfocados al ámbito de referencia de este, incluyendo ejemplos de atributos, indicadores, jerarquías, filtros, selecciones dinámicas, grupos personalizados, informes, gráficos y documentos. De la misma forma, también hay ejemplos de Data Mining, con la definición de los indicadores de formación y los informes necesarios para realizar el muestreo de datos y la verificación de los modelos de análisis con los indicadores previsibles.

Analytic Modules - Modelo Datos del Modulo HR

Tomando como referencia estos modulos, junto con el Proyecto Tutorial que también nos proporciona Microstrategy, tenemos un punto de partida consitente para profundizar en el conocimiento de la herramienta. Igualmente, estos proyectos predefinidos nos podrían ayudar a construir de forma rapida un proyecto piloto en el ambito seleccionado para mostrar las posibilidades de BI dentro de las organizaciones, con un esfuerzo limitado al estar utilizando componentes ya existentes y validados en muchas organizaciones (que pueden incluir los componentes mas habituales, por ejemplo, en gestión de personal, análisis de ventas o clientes, finanzas, etc).

Distribution Services

Es un componente integrado en la plataforma de Microstrategy 9 que permite la distribución automatizada  de informes, cuadros de mando y alertas a través de diferentes canales, como pueden ser vía email, impresoras de sistema o carpetas de red. La distribución de los resultados puede ser activada por procesos planificados, eventos o excepciones. Deberan existir en el sistema procesos de planificación (con su configuración de horario de ejecución, por ejemplo, semanal, diario, cada hora, etc), para poder asociar a ellos las suscripciones y asi poderse llevar a cabo los procesos de distribución de información.

La distribución de los resultados de informes y documentos se puede realizar en los formatos habituales de Microstrategy, que pueden ser HTML, Excel, Pdf, Zip, Texto, CSV o Flash. A la hora de distribuir los resultados, se tendrán en cuenta los perfiles de autorización de los que disponga cada usuario, al igual que a la hora de realizar suscripciones.

En la imagen, podemos ver la forma de crear una suscripción de archivo. Seleccionamos el informe que queremos procesar con la suscripción, e indicamos los parámetros de Planificación (inmediata o a través de los Planificadores existentes en el sistema), tipo de fichero (Html,Pdf, Excel, Texto sin formato o csv), ubicación, propiedades adicionales (permisos, compresión del fichero, contraseña) y si queremos notificar la entrega.

Distribution services - Suscripción de archivo

Cuando se ejecute el proceso, se creara el correspondiente fichero en el formato indicado con los datos provenientes del informe seleccionado en la carpeta indicada. Puede ser una funcionalidad util para dejar preparados en un determinado lugar información que luego consultarán una serie de usuarios autorizados a entrar en esa ubicación. Además de la suscripción de archivo, podemos crear de los siguientes tipos:

  • Historial: publicamos los resultados de la ejecución de los informes en la sección historial del sistema. Seria algo así como una ejecución guardada (una foto de los resultados), que podemos visualizar en cualquier momento sin necesidad de que los datos se vuelvan a leer del Data Warehouse. Al planificar, podremos seleccionar uno o varios usuarios. Todos esos usuarios podran ver en su sección Historial los resultados de la ejecución de la suscripción.
  • Mobile: envio de resultados via móvil, utilizando el correspondiente producto de Microstrategy.
  • Correo electrónico: creación de listas de distribución para enviar, via correo electrónico, los resultados de ejecución de los informes anexados dentro de los emails.
  • Impresora: impresión de los resultados de informes en impresoras de sistema.

Distribution services - Tipos de Suscripción

A continuación, podeis ver un ejemplo de la creación de una suscripción de correo electrónico. Podeis ver como indicamos una planificación de la ejecución del envio, el formato de entrega de los resultados y la personalización del texto del correo electrónico (asunto, mensaje, etc).

Distribution services - Suscripción de email

Las suscripciones las podrá parametrizar y gestionar el administrador del sistema, aunque los propios usuarios también podran crear o gestionar sus propias suscripciones, siempre que esten autorizados para ello (o autorizados a modificar los datos de suscripciones creadas por otros usuarios en las que ellos esten incluidos).

Este sistema puede ser util para realizar una distribución de la información en los diferentes ambitos de la organización conforme se vaya generando o actualizando el DW, de una forma desasistida y automática, y manteniendo siempre los requisitos de seguridad y control de acceso a la información que habremos configurado al establecer los diferentes permisos a los usuarios y las restricciones de visualización de información utilizando los filtros de seguridad (que también se tienen en cuenta a la hora de la generación de las suscripciones).

Los administradores del sistema tienen sus propias herramientas para gestionar todas las suscripciones que hay definidas en el sistema y poder realizar sus controles o ajustes (tal y como vemos en la imagen siguiente, donde vemos la gestión de suscripciones utilizando la herramienta Desktop).

Gestion de Suscripciónes del sistema usando Desktop

Antes de realizar las conclusiones de nuestro proyecto y el cuadro de evaluación final de los productos que hemos utilizado en él, vamos a desarrollar un mini proyecto de Business Intelligence utilizando datos públicos, en concreto, datos proporcionados por la autoridad de la ciudad de Londres. En este proyecto aplicaremos todo los visto hasta ahora para ver las posiblidades de aplicación del BI en el ambito público y asi cerrar las conclusiones del análisis de herramientas (Talend y Microstrategy).

Posted in Business Intelligence, Microstrategy | Leave a Comment »

14.9.2. DataMining en Microstrategy 9 (II).

Posted by Roberto Espinosa en 5 marzo 2010


Ejemplo 2. Segmentación de clientes (Analisis de cluster).

El analisis de clúster ofrece un método para agrupar valores de datos basado en similitudes dentro de estos. Esta técnica segmenta distintos elementos en grupos según el grado de asociación entre los elementos. El grado de asociación entre dos objetos es máximo si pertenecen al mismo grupo y mínimo si no pertenecen al mismo grupo. Se forma un número determinado o especificado de grupos, o clusteres, lo que permite clasificar matematicamente cada valor de los datos en el grupo adecuado.

El analisis de cluster se considera una técnica de aprendizaje sin guía debido a que no hay variable de destino o dependiente. Generalmente, hay características subyacentes (que habrá que descubrir) que determinan el motivo por el que determinadas cosas aparecen relacionadas y otras no lo estan. El análisis de cluster de elementos relacionados proporciona información significativa sobre cómo se relacionan entre sí los diversos elementos de un conjunto de datos.

Microstrategy emplea el algoritmo de promedio k para determinar los clusteres. Con esta técnica, los clústeres se definen por un centro en un espacio multidimensional. Las dimensiones de este espacio se determinan mediante las variables independientes que caracterizan cada elemento. Las variables continuas se normalizan en el rango de cero a uno (de modo que no haya una variable dominante). Las variables categóricas se reemplazan con una variable de indicador binario para cada categoría ( 1 = un elemento está en la categoria, 0 = un elemento no esta en la categoría). De esta manera, cada variable abarca un rango similar y representa una dimensión en este espacio.

El usuario especifica el número de clústeres, k y el algoritmo determina las coordinadas del centro de cada cluster. En Microstrategy, el usuario o el software de manera automática pueden determinar el número de agrupaciones que se generarán de un conjunto de datos. Si se determina mediante el software, el número de agrupaciones se basa en varias iteraciones para descubrir la agrupación óptima. El usuario establece un valor máximo para limitar el número de agrupaciones determinadas por el software.

La creación de un modelo de clústeres es el primer paso porque, aunque el algoritmo simpre generará los clústeres adecuados, el usuario debe comprender de qué manera difiere cada clúster de los demás. El analisis de cluster no genera ninguna conclusión en si mismo, y habrá que analizar los resultados para buscar esas relaciones ocultas entre los atributos que nos permitan determinan la segmentación, en este caso, de los clientes.

Vamos a ver un ejemplo de segmentación de clientes, en el que intentaremos formar grupos de forma que los miembros de cada uno de ellos se parezcan mas entre si que los miembros de los otros grupos. Vamos a crear cinco segmentos de clientes basandonos en criterios demográficos y psicográficos, que son:

  • Rango de edades.
  • Formación.
  • Sexo.
  • Tipo de vivienda.
  • Estado civil.

La información reside en los datos de los clientes, y ha sido previamente elaborada para normalizarla según vemos en el informe siguiente (que es el informe de partida para el análisis):

Informe de Datos de clientes

Podemos observar que la información de edades ha sido clasificada en rangos de edad, al igual que la información de Nivel Educativo (formación), Sexo del cliente, Tipo de alojamiento (vivienda) y estado civil. Los valores de estos atributos del cliente ha sido codificados (valor 1, 2, 3, etc). Esta información puede haber sido generado en los procesos de carga del DW o bien definida por indicadores calculados, o por grupos personalizados. Para analizar los clientes, realizaremos un muestro de ellos extrayendo un porcentaje del total de clientes (en nuestro caso, vamos a analizar un 20%).

Para realizar el muestro de datos nos vamos a crear un indicador para luego poder filtrarlo y extraer exactamente el 20% de los clientes. Como vemos en la imagen, con la función Randbetween, que devuelve un numero aleatorio entre dos valores dados, creamos un valor, que luego filtraremos en el informe de creación de los indicadores previsibles a través de un filtro.

Cluster- Indicar de filtrado para muestreo

A continuación, al igual que en el ejemplo anterior, realizaremos la definición del indicador de formación. En este caso, selecciones el tipo de analisis Agrupación. Podremos realizar dos tipos de análisis. Indicar un número especifico de clusteres, lo que determinara que se analice la información para formar exactamente N grupos o bien la opción segunda, que es especificar un número máximo de clusters y un porcentaje de mejora. En este caso, el algoritmo crea dos clusteres y evaluará la calidad del modelo. A continuación, se crearán 3 clusteres y se comprobara si el modelo ha mejorado. Sino ha mejorado, nos quedamos con el modelo de 2 clusteres. Si mejora, se construira el de 4 clusters y se comparara con el de 3. El proceso continuará hasta que se alcance el número máximo de clusteres especificados o hasta que la mejora no supere el porcentaje indicado.

Indicador de formación en Analisis Cluster - Propiedades Análisis

En nuestro ejemplo, indicamos un número especifico de clusteres, en concreto 5.

A continuación, indicaremos los indicadores independientes que van a formar parte del modelo. Como ya indicamos, aunque estamos analizando atributos de los clientes, tendremos que crear indicadores para estos atributos, pues en el indicador de formación somo podemos incluir indicadores. Tendremos un indicador para cada atributo de los que queremos incluir en el análisis.

Finalmente, definiremos los indicadores previsibles que se generaran cuando ejecutemos un informe incluyendo el indicador de formación. Recordemos que en estos indicadores previsibles, cuando sean creados, podremos ver el modelo generado con el visor de Microstrategy. También podremos utilizarlos en informes para analizar los resultados de la segmentación y sacar conclusiones.

Analisis Cluster - Indicadores previsibles a generar con el modelo

El siguiente paso, una vez creado el indicador de formación, es incluirlo en un informe de Microstrategy junto con todos los atributos necesarios para el análisis. Ejecutaremos el informe, con el muestreo visto anteriormente (a traves de un filtro), y se generaran los indicadores previsibles que podremos analizar. A partir de los indicadores previsibles creados, con el visor de modelos, observamos los resultados del análisis:

Analisis de Cluster - Visor de Modelo Previsible

Aparece una tabla con los diferentes valores de los atributos de los clientes (edades, nivel educativo, sexo, tipo de vivienda y estado civil) y con los valores de peso de cada valor de cada atributo para pertenecer a cada unos de los clusteres. Vemos que los valores mas determinantes para determinar si un cliente entra en un cluster u en otro es el tipo de vivienda. El factor edad, educación o sexo es menos relevante (tiene menos peso). Por ejemplo, en el cluster 1, el tipo de vivienda «Dependiente»  es condición para formar el cluster 1. Igualmente para el cluster 5, es condición el tipo de vivienda «Alquiler» y el estado civil soltero. La tabla nos puede hacer una idea de las relaciones entre los valores de los atributos y la pertenencia a un cluster u a otro.

El modelo previsible tiene en la pestaña Simulación una herramienta para ir jugando con las diferentes variables y ver la relación entre ellas. También nos puede ayudar para el análisis crear un informe que incluya todos los atributos y el indicador previsible creado (que devuelve al ejecutar el informe el cluster al que pertenece un cliente). Con el analisis de los datos, filtrado, conteo, ordenación podremos seguramente también descubrir relaciones entre los datos).

En nuestro ejemplo hemos limitado los atributos de clientes que utilizamos para el analisis, pero en una situación real, podriamos ir cambiando los atributos utilizados en el analisis por otros (o eliminando atributos no relevantes), hasta conseguir un modelo que satisfaga nuestra perspectiva de análisis.

Una funcionalidad interesante de Microstrategy es crear un grupo personalizado utilizando el indicador previsible creado, y utilizar este grupo personalizado dentro de los informes. La creación de los grupos personalizados es tan sencilla como vemos en la imagen:

Grupos Personalizado utilizando el indicador previsible Segmento de cliente

Podemos incluir este objeto dentro de un informe para realizar analisis de las características de la segmentación o para analizar información de los clientes incluidos en cada grupo (por ejemplo, ventas, número de clientes, promedio por cliente). Esto nos puede ayudar a conocer mas características del grupo. Igualmente, podriamos realizar detalles y navegacion dentro de cada segmento por zona geográfica, tipo de material u otros aspectos que nos ayudaran a profundizar aun mas en características especificas de cada grupo.

Analisis de Segmento de Clientes usango Grupos Personalizados

El modelo descrito se puede validar en otro conjunto de datos para darle un contenido definitivo y presentar los resultados del análisis de cara a establecer las correspondientes medidas dentro del area de ventas o marketing.

Ejemplo 3. Predicción de ventas en una campaña (Arbol de decisión).

En este analisis utilizaremos un arbol de decisión para determinar la respuesta de un determinado grupo de clientes a rebajas en determinados productos en la epoca de vuelta al colegio. Para ello, utilizaremos arboles de decisión del tipo binario (recordemos que los arboles de decisión se pueden utilizar tanto para clasificación como para analisis de regresión, como en este caso). Intentaremos determinar como influyen factores como la edad, el sexo o el numero de hijos en la probabilidad de realizar compras en esa campaña de rebajas.

Los arboles de decisión son uno de los modelos de mineria de datos mas intuitivos, debido a que muestran una estructura «si-entonces-otro», facil de comprender. Los arboles de decisión separan un conjunto de datos en distintos subconjuntos de datos. En lugar de utilizar un enfoque de aprendizaje sin guia (como en el análisis cluster), el arbol de decisión utiliza un algoritmo guiado, de forma que los subconjuntos de datos creados comparten una característica de destino determinada, que proporciona una variable dependiente. Las demas características las proporcionan las variables independientes, que se utilizan para dividir los conjuntos de datos originales en subconjuntos de datos. Normalmente, se utiliza la variable independiente con mayor poder previsible y asi sucesivamente. Microstrategy implementa el algoritmo de árbol de clasificación y regresión (CART).

Ejemplo de arbol de decision en Microstrategy

Cada nodo incluye la información siguiente:

  • Puntuación (node´s score): el resultado más común (o dominante) de los registros de datos para el nodo.
  • Predicado (predicate): una sentencia lógica que se usa para separar registros de datos del origen de un noto. Los registros pertenecen a un nodo si se evalua como verdadero (pueden incluir una o varias sentencias lógicas combinadas con los operadores AND, OR, XOR, etc).
  • Gráfico de ojo (eye chart): representación gráfica de la distribución de puntuaciones.
  • Distribución de puntuaciones (score distribution): tabla que muestra el desglose de registros de datos de formación asociados con el nodo. Sirve de leyenda para el gráfico de ojo. La distribución de puntuaciones contiene el conteo real de los registros de datos de formacion del nodo que se representa mediante cada clase de destino. La proporción de cada clase de registros de datos se muestra como porcentaje de los conteos totales de este nodo y como porcentaje de la población total.
  • Resumen de nodo (node summary): porcentaje de todos los registros de datos de formación asociados con el nodo.
  • ID de nodo (node id): identificador unico o referencia para cada nodo. Se usa un formato de profundidad en nivel (el id es una serie de numeros ).

Vamos a realizar un analisis de una campaña utilizando un arbol de decision. Como indicador dependiente utilizaremos el indicador «Respuesta a Rebajas vuelta al cole año X». Como indicadores independientes, los valores sociodemográficos del cliente como rango de edades, número de mienbros de la familia, sexo o educación. Con estos valores, construiremos, de la forma habitual (e igual que en el resto de ejemplos), el indicador de formación, seleccionando el tipo de análisis Arbol de decisión:

Arbol Decision - Indicador Formacion

El indicador dependiente, cuya definición vemos en la imagen siguiente, es un numero cuyo valor indica un uno si una compra del cliente en el año X fue dentro de la campaña de rebajas y un 0 sino lo fue. Este va a ser el indicador dependiente dentro de nuestro modelo, y el resto los independientes.

Arbol Decision - Indicador Dependiente

El siguiente paso, como en los ejemplos anteriores, es definir un informe de Microstrategy e incluir el indicador de formación para generar los indicadores previsibles en cuyo contenido podremos analizar los resultados del modelo con el visor de modelos previsibles. En nuestro ejemplo, construimos un informe que lee los datos de pedidos de un periodo de tiempo determinado, incluyendo la información del cliente y el indicador de formación (tal y como vemos en la imagen).

Arbol Decision - Informe creación modelo

Ejecutaremos el informe y se realizará la creación de los indicadores previsibles, donde podremos validar el modelo creado. Podremos ir jugando con las variables dependientes que incluimos en el modelo hasta dar con un arbol de decisión acorde con el objetivo de nuestro análisis. En nuestro caso, hemos obtenido el siguiente árbol de decisión:

Arbol Decision - Resultados Ejemplo

Podemos observar los resultados del arbol. El sexo es una factor determinante para participar en la campaña (Gender <> Male). Los hombres no han comprado utilizando la rebaja en el 94,5% de los casos. Para las mujeres, si han comprado en el 41% de los casos. Ademas, para mujeres en familias numerosas (3, 4, 5, 6 hijos o mas), se utilizo la promoción en el 71,4% de los casos.

Una vez ajustado el modelo previsible, podremos realizar un analisis de previsión de ingresos de la campaña utilizando en informes (en forma de tabla o gráficos) los indicadores previsibles creados. Podremos de estar manera hacer una predicción de respuesta haciendo simulaciones con los datos de ventas anteriores, con estimaciónes según la predicción de respuesta o ver de forma gráfica el aumento de predictor de respuesta.

Arbol Decision - Grafico Aumento Respuesta

Los analisis nos permitiran realizar un analisis de los resultados de la campaña  en un escenario basado en la respuesta prevista de un cliente a una campaña.

Conclusiones.

He intentado en estos ejemplos entender y transmitiros los conceptos básicos, la metodologia de aplicación y algunas técnicas de las que se utilizan en datamining con ejemplos prácticos que hacen mas fácil su comprensión. Como desconocedor del datamining y sus técnicas, siempre encontraba la carencia de no encontrar ejemplos prácticos que me hiciesen entender un poco mas a fondo y sin un enfoque técnico o estadístico, como es su aplicación, como se desarrollan las técnicas y como se sacan conclusiones de los resultados obtenidos. Espero haber conseguido con esta serie de ejemplos este objetivo.

Por otro lado, a nivel de Microstrategy 9, he constatado algunas ventajas e incovenientes, que os enumero:

Ventajas

  • Total integración de los servicios de Data Mining con la plataforma. Se utilizan informes para generar los modelos predictivos a traves de los indicadores de formación. Los resultados obtenidos se analizan y ajustan con el visor de modelos y se pueden validar y explotar las conclusiones utilizando los indicadores previsibles como un elemento mas de los informes (o como parte de otros objetos, como filtros, grupos personalizados, nuevos indicadores, etc). Esto ultimo nos da gran potencia para realizar simulaciones o analisis de posibles resultados siempre trabajando en el entorno de nuestro DW o de los subconjutos de datos extraidos y preparados para el análisis (a través de la creación, por ejemplo, de los Datamarts).
  • El uso del estandar XML para exportacion/importación de modelos (PMML), nos permite tanto exportar desde Microstrategy los analisis a otras herramientas de data mining que soporten el estandar para utilizar los modelos en ellas, o bien importar en nuestro sistema modelos desarrollados en otras herramientas (y poder validar los resultados de los análisis, pues al importar los modelos también creamos los indicadores previsibles, que podremos incluir en los informes para verificar resultados o previsiones).

Inconvenientes

  • Microstrategy no es una herramienta especifica de Data Mining. Tiene limitaciones respecto al tipo de analisis que se pueden realizar y no es una herramienta diseñada especificamente para dicho proposito, con lo que en muchos aspectos no podrá competir con herramientas especificas.

Posted in Business Intelligence, Data Mining, Microstrategy | Leave a Comment »

14.9.1. DataMining en Microstrategy 9 (I).

Posted by Roberto Espinosa en 2 marzo 2010


La orientación de Microstrategy 9 con el Data Mining es integrarlo totalmente en su plataforma de Business Intelligence y que no sea un producto aparte como en muchos otros fabricantes (lo que nos obliga a realizar los análisis en un sistema paralelo). Esta integración se realiza a traves de las métricas predictivas, que estaran disponibles en el sistema como un elemento mas del sistema de BI.

Ademas, soporta el estandar de la industria PMML (Predictive Model Markup Language), lo que nos permite importar modelos de data mining desde otras plataformas y crear de forma automatica en el repositorio de metadatos las metricas predictivas. Recordemos que PMML es un estandar de la industria en XML desarrollado por el Data Mining Group(DMG) para describir los modelos predictivos. En su desarrollo han participado los principales fabricantes de software de datamining, incluyendo Microstrategy. Este estandar soporta un gran numero de algoritmos de data mining, como son las Redes Neuronales, Clustering, Regresion, Arboles de Decision y Asociacion. PMML se puede generar en las principales aplicaciones de DM como son SAS®, SPSS®, Microsoft®, Oracle®, IBM®, KXEN™, ANGOSS y otros. Microstrategy es la primera plataforma BI que soporta el estandar, y su plataforma incluye, de forma integrada con el resto de elementos, la creación de modelos y la distribución de los resultados a los usuarios a traves del visor de modelos previsibles, que presenta unas características e información gráfica diferente según el tipo de análisis que estemos realizando. Los resultados de los estudios se pueden incluir como un elemento mas en los Dashboards de analisis.

Los tipos de algoritmos soportados por Microstrategy 9 son los siguientes: Regresión lineal , Regresión Exponencial, Regresión Logistica, Agrupación (Clustering), Arbol de Decisiones, Series Temporales y Asociacion.

Tipos de analisis de Datamining soportados por Microstrategy 9

Ademas de estas características DataMining puras, Microstategy va mas alla y enumera otros elementos de la plataforma BI que también son utiles y necesarios para un analisis avanzado (como parte incluida dentro de la preparación del modelado de DataMining o como analisis previos o especificos). Estas caracteristicas las hemos visto en diferentes entradas del Blog cuando hemos analizado las principales componentes de la Suite ( Reporting en Microstrategy 9  I y II, Navegación Dimensional y cubos OLAP en Microstrategy 9). Resumiendo, serían las siguientes:

Funcionalidad de Reporting Guiada por Parámetros.

Partiendo de los informes construidos, y mediante el uso de parametros, podemos construir analisis de una forma variable y sencilla. Esos parametros podrán interactuar contra los valores de los indicadores para hacer analisis interactivos, permitiendons crear informes sofisticados. Por ejemplo, podemos pedir un valor en tiempo de ejecución que se utilizara dinamicamente en la formula de calculo de un indicador, pudiendo realizar analisis de suposiciones y predictivos utilizando diferentes variables, algunas de las funciones proporcionadas por la suite y los valores de indicadores de nuestro modelo. Mediante las selecciones dinamicas de valor y la utilización de estos valores en las formulas de los indicadores dispondremos de una forma sencilla de esta funcionalidad.

Capacidades de Navegación Drill-Anywhere.

Mediante estas capacidades de navegación, los usuarios pueden visualizar tanto información sumarizada como detallada y tienen acceso a la totalidad de los datos contenidos en el data warehouse en cualquier lugar de estos. Esta navegación nos permite navegar en los detalles tal como aparecen en el modelo de negocio y detectar tendencias, desviaciones o aspectos que sera interesante analizar mas a fondo. No es necesario que los usuarios comprendan en profundidad la base de datos, las estructuras de las tablas, ni el lenguaje de las consultas. Simplemente deben saber dónde posicionarse y cómo hacer clic.

Análisis de Conjuntos y Segmentación de Datos

Los usuarios pueden potenciar los análisis de conjuntos que trae MicroStrategy para realizar una fácil segmentación de los datos. Los usuarios pueden manipular y combinar los sets de datos definidos para obtener un set de datos más refinado para llevar adelante análisis más profundos. Para ello podemos utilizar los filtros, las selecciones dinámicas, los filtros de visualización, los filtros sobre los indicadores, la navegación a través de grupos de atributos, etc. Las herramientas de reporting pueden ser el punto de partida para los analísis mas profundos utilizando todas las posibilidades que nos proporciona.

Grupos de Datos Definidos por Usuarios

Cuando construimos el data warehouse, definimos en el una estructura que refleja el modelo de negocio de la empresa, pero dicha estructura no siempre refleja los requerimientos de negocio de los departamentos individuales, ni de los equipos de trabajo ni de los decisores. Con los Grupos Personalizados y Consolidaciones, podemos cambiar el enfoque del modelo de negocio y construir nuevos atributos o agrupaciones mas acordes con el tipo de analisis que queremos realizar. No pueden ayudar a realizar analisis previos antes de la realización de estudios de data mining. Con ellos podemos perfeccionar el modelo de negocios hasta alcanzar los requerimientos departamentales o individuales, sin impactar en la estructura del modelo de datos de la empresa. Podemos realizar simulaciones de segmentación que luego analizaremos en profundidad utilizando las técnicas de Data Mining.

Tratamiento Analítico de los Datos

MicroStrategy nos proporciona un amplio conjunto de funciones analíticas para interactuar sobre los datos.  MicroStrategy contiene una libreria de mas de 270 funciones, incluyendo las básicas, funciones Olap, funciones matematicas, financieras, estadísticas y de data mining, que pueden ser utilizadas para crear metricas e indicadores de rendimiento (pki).

Microstrategy - Funciones estadísticas

Las funciones disponibles, de forma resumida, son las siguientes:

  • Funciones básicas: suma, promedio, media aritmetica, contadores, minimo, maximo, varianza, media geometrica, moda, desviación estandar, etc.
  • Funciones de cadena: concatenacion, longitud de cadenas, tratamiento de subcadenas, paso a mayusculas o minusculas, eliminación espacios, etc.
  • Funciones de fecha y hora: operaciones sobre fechas; hora, minuto, segundo, dia, mes, año, dia de la semana, dia del mes, dia del año de una fecha, etc.
  • Funciones de orden y NTile: funciones ntile, percetiles o rankings.
  • Funciones Olap: funciones relacionadas con el procesamiento Olap.
  • Funciones de extraccion de datos: funciones para data mining como modelo asociacion, modelo regresion, arbol de decision, clustering, etc.
  • Funciones estadisticas: distribucion beta, distribucion binomial, confianza, correlacion, covarianza, distribucion chi cuadrado, distribucion gamma, permutaciones, distribución de poisson, etc.
  • Funciones financieras: funciones financieras para el calculo de interes, rentabilidad, prestamos, etc.
  • Funciones matematicas: valor absoluto, seno, coseno, tangente, redondeo, truncate, logaritmos, raiz cuadrada, etc.

Ademas, como características avanzadas, y en las que no habiamos entrado todavia, podemos destacar las siguientes:

Plug-ins para Funciones a Medida

Microstrategy permite incorporar a la plataforma de BI nuestras propias funciones, desarrolladas mediante DLL´s.  Por medio de un asistente plug-in para funciones a medida, los usuarios de MicroStrategy pueden incorporar dichas funciones para usarlas en la creación de informes. Una vez importadas, se ponen a disposición de todos los usuarios de manera automática para que se definan las métricas y las medidas.

Creación de Datamarts utilizando informes de Microstrategy.

Esta es una funcionalidad muy interesante, que nos puede servir tanto para la preparación de los datos sobre los que luego aplicar nuestros analisis de Data Mining o como para la construcción de Datamarts departamentales o de un area especifica (que incluyen solo un conjunto de datos de todos los que disponemos en nuestro sistema). Los datos extraidos son almacenados en una tabla de base de datos en el lugar que nosotros indiquemos. Los datos estaran en ese momento disponibles para analizarlos en el mismo Microstrategy o para utilizarlos con otras aplicaciones externas.

La idea es muy sencilla. Construimos un informe donde incluimos la información necesaria (el conjunto de atributos e indicadores que queremos «extraer» de nuestro sistema), con los correspondientes filtros o selecciones dinámicas para restringir o calificar el proceso de extracción a nuestras necesidades. Una vez definido el informe, en la seccion Datos –> Configurar Datamart indicamos el destino donde se guardarán los datos (tal y como vemos en la imagen):

Microstrategy - Creación de Datamart

Indicaremos la instancia de la base de datos donde queremos guardar los datos (que podrá ser cualquier base de datos de las soportadas), la tabla, pudiendo además indicar una serie de opciones avanzadas, como número máximo de filas, sentencia sql a ejecutar antes y despues de crear la tabla o sentencia a ejecutar antes de insertar los datos. Además, en el nombre de la tabla podemos insertar calificadores que pueden ser utiles para crear tablas diferentes según algún criterio (usuario, fecha, nombre de informe). Para ello, marcamos la opción «El nombre de esta tabla contine marcadores» e indicamos alguno de los siguientes valores:

  • !U – Nombre de usuario.
  • !D – Fecha.
  • !O – Nombre de informe.

Una vez indicados los parametros correctos en la sección, ejecutaremos el informe, momento en el cual se creara la tabla en el destino indicado y se llenara con los datos recuperados por el informe. La ejecución del informe no devuelve ningún resultado. Igualmente, podremos configurar la ejecución automatica de este tipo de informes para que se llene el Datamart de una forma desasistida (al igual que cuando vimos los cubos inteligentes).

Microstrategy - Ejemplo de Datamart

En la imagen podeis ver la vinculación desde Access a una tabla del tipo Datamart creada con un informe. En el informe utilizamos los grupos personalizados de zonas geografícas (que agrupan los valores de varias regiones, por ejemplo, Zona Levante agrupa Murcia, Valencia y Cataluña) para extraer los datos de ingresos, unidades y margen por mes para cada zona geográfica. Podemos ver como, aunque los grupos personalizados no son algo que exista en nuestro modelo, al realizar la exportación de datos al Datamart si se ha creado su correspondiente columna en la tabla creada (campos F_ID y F_NAME en el ejemplo ). Los primeros registros del ejemplo tienen los datos totales de la zona geográfica LEVANTE por mes y los 9 registros siguiente el desglose de la zona por cada una de las regiones).

Con esta funcionalidad, junto con el uso de las multiples funciones que proporciona Microstrategy, podremos realizar la extracción de datos adaptada a nuestras necesidades para realizar los analisis de data mining sobre los datos o cualquier otro tipo de operativa.

Construcción de Analisis de DataMining en Microstrategy.

Para llevar a cabo la construcción del análisis, tendremos que determinar primero un objetivo. Es objetivo incluira los resultados deseados para mejorar un aspecto determinado en una organización. Por ejemplo, objetivos pueden ser mejorar la respuesta en una campaña de marketing, evitar la perdida de clientes, previsión de tendencias o segmentación de clientes. Este objetivo ha de ser especifico, pues a a ver determinar que analisis se puede utilizar y que datos nos haran falta.

Una vez definido el objetivo, comenzaremos a explorar en los datos para conocer mas de ellos y preparar el camino para el análisis. En nuestro caso, en Microstrategy, construiremos unos reports de ejemplo que nos permitiran ir observando los datos. Con el conjunto de datos que nos va a hacer falta para el analisis (dependeran del tipo de este), podemos construir un Datamart de la forma vista anteriormente (al que podremos atacar incluyendolo la definición de atributos e indicadores  en el metadata)  y a partir de el comenzar el análisis o continuar trabajando directamente con los datos mediante los informes. De ese conjunto de datos podremos ir eliminando componentes mediante filtrados (materiales que no son relevantes, clientes que no consideramos en el análisis, lineas de producto o zonas geograficas fuera del ambito, periodos de tiempo fuera de campaña, etc). Podremos igualmente ir navegando en los datos para observar comportamientos, variaciones, peculiaridades, patrones. Podremos crear nuevos indicadores que nos faciliten este analisis utilizando las funciones analiticas de Microstrategy (por ejemplo, funciones estadisticas, de ranking, de orden, etc). Todo este analisis previo nos permitira ir haciendo la depuración de datos y concretando los aspectos del análisis. Igualmente, podremos ir preparando para que solo se seleccione un conjunto determinado de los datos (un muestreo), utilizando igualmente funciones de las que disponemos en Microstrategy.

Una vez tenemos disponible el conjunto de datos, podremos seguir explorandolo para descubrir patrones o definir transformaciones que habra que realizar sobre ellos, con el objetivo final de identificar las variables con las que construiremos el modelo de análisis.

Pasos en un analisis de Datamining con Microstrategy

Con esas variables identificadas, construiremos el modelo previsible a traves de lo que en Microstrategy se llaman indicadores de formación. El indicador de formación es un tipo de indicador especial que va a contener información sobre el tipo de analisis que queremos realizar, que variables intervienen en el análisis y parametros concretos que determinaran la forma de realizar el analisis (que dependen del tipo de modelo a utilizar). Microstrategy dispone de un asistente de creación de indicadores de formación. En el caso de que vayamos a desarrollar un modelo que incluya el analisis de atributos (como por ejemplo número de pedido, material o datos de clientes), habrá que crear indicadores para estos atributos, pues en el indicador de formación solo se pueden utilizar indicadores. Los indicadores que se utilizan en la creación del indicador de formación se llaman indicadores de entrada previsibles.

Al crear el indicador de formación, seleccionamos en primer lugar el tipo de analisis, de los posibles en Microstrategy, que son, como ya vimos: Regresión lineal , Regresión Exponencial, Regresión Logistica, Agrupación (Clustering), Arbol de Decisiones, Series Temporales y Asociacion.

A continuación, el asistente nos pedira las variables implicadas en el análisis, según el tipo de este. Por ejemplo, para una analisis de asociación, las variables serán el indicador de transacción (el número de pedido, por ejemplo, que es el elemento para agrupar los elementos) y el indicador de elemento (los elementos que se van a analizar, en este caso, el material o producto). Ademas se nos pediran diferentes valores según el tipo de analisis a construir, valores que concretaran la forma en realizar en analisis.

Microstrategy - Definición de indicador de formación

El indicador de formación tiene el objetivo de construir los indicadores previsibles y de realizar al generación del modelo de análisis. Una vez definido el indicador de formación, crearemos un informe de Microstrategy donde tendremos las variables (atributos o indicadores) necesarias para el tipo de analisis y donde ademas incluiremos el indicador de formación. Al incluir este, cuando ejecutemos el informe, se crearan los indicadores previsibles. Los indicadores previsibles guardan los resultados del análisis y pueden ser analizados mediante el visor que proporciona Microstrategy.

El visor de modelos previsibles (según vemos en la imagen siguiente), tiene un aspecto diferente según el tipo de analisis que estemos realizando. Basicamente, nos proporciona información sobre el modelo ( incluyendo información grafica en algunos casos y los datos para exportar el modelo en el estandar PMML), las variables que intervienen en el, una pestaña de simulación donde podemos analizar como cambia el modelo si cambiamos el valor de las variables de entrada y la herramienta de verificación del modelo (una lista de registros de verificación del modelo con su puntuación).

Microstrategy - Visor Modelos Previsibles en Analisis Serie Temporal

Podriamos ir modificando la muestra de datos sobre la que aplicamos el indicador de formación, y con los indicadores previsibles generados y el visor, ir validando y ajustando el modelo de análisis o ir realizando cambio en las variables, parametros del indicador de formación o en el conjunto de datos. Estos pasos los repetiremos hasta obtener los resultados deseados y concretar y validar el modelo de análisis.

Los indicadores previsibles se pueden, ademas de visualizar, utilizar como resultado en cualquier informe de Microstrategy. Esto puede ser util para validar los resultados, para analizar tendencias o para presentar los resultados del analisis.

Una vez concluido el análisis, podremos seguir utilizandolo para validar resultados a futuro o exportarlo en formato PMML para utilizarlo  en otras herramientas de Data Mining que incluyan el trabajo con dichol estandar.

Para ver mas en detalle todos estos pasos seguidos, vamos a realizar un ejemplo práctico de analisis de Reglas de Asociación.

Ejemplo 1. Analisis de cesta de la compra (Asociacion).

Vamos a ver los pasos seguidos para la construcción de un modelo de analisis de la cesta de la compra, utilizando reglas de Asociación. Utilizamos para ello el proyecto Tutorial que se incluye en la instalación de Microstrategy (que muestra ejemplos de todas las funcionalidades incluidas en la suite, incluyendo el Data Mining).

Vamos a analizar una tabla que incluye los datos de ventas de peliculas de DVD. En primer lugar, construimos un informe para realizar un primer vistazo a los datos. En este informe podremos ir incluyendo restricciones sobre los datos, como excluir determinados materiales (o solo incluir una familia de producto determinada, como en este caso, las peliculas de DVD), seleccionar un periodo de tiempo o una zona geográfica concreta o realizar un muestreo aleatorio de datos utilizando indicadores de orden, para reducir el tamaño del conjunto de datos..

Como el tipo de analisis a realizar es el de asociación, que trata de ver como estan relacionadas las ventas de productos diferentes entre si en las mismas transacciones, nos vamos a centrar en los atributos Pedido y Articulo.

Informe inicial en analisis de asociacion

Una vez delimitado y acotado el conjunto de datos sobre el que realizaremos el analisis, realizamos la definición de los indicadores para los atributos Pedido y Articulo (aunque son indicadores normales, los llamamos Indicadores de Entrada Previsibles). Ellos nos van a permitir construir el indicador de formación, base del analisis. Veamos como definimos los indicadores para los atributos:

:

Definicion de indicador de entrada previsible para atributo

A continuación, realizamos la creación del indicador de formación, seleccionando el tipo de analisis Asociación. Al crear un indicador de formación de este tipo, las especificaciones del modelo son las siguientes:

  • Numero maximo de elementos por conjunto: este parametro determina el número máximo de artículos que pueden aparecer en el conjunto de elementos anterior o posterior. Por ejemplo, si se establece en tres, los articulos se agruparán en conjuntos de elementos que  contendrán uno, dos o tres artículos. En nuestro ejemplo, indicamos 3.
  • Confianza minima: probabilidad mínima que deben tener las reglas de calificación. Por ejemplo, si se establece en 10%, una regla de asociación debe tener una confianza del 10% o superior para que se incluya en el modelo. El valor por defecto es 10% y aumentar su valor puede llevar a generar menos reglas. En nuestro ejemplo indicamos un 0,1%.
  • Soporte minimo: el número mínimo de transacciones en las que se debe producir un conjunto de elementos para que una regla de asociación lo tenga en cuenta. Por ejemplo, si se establece en 1%, los conjuntos de elementos deben aparecer, en promedio, en una transacción cada 100. En nuestro ejemplo indicamos un 0,1%.

A continuación indicamos las variables que intervienen en el análisis, por una lado el indicador de transacción (el indicador para los numeros de pedido que hemos definido) y el indicador de elemento (el indicador para el material). Finalmente, indicamos las opciones de los diferentes indicadores previsibles que se generaran cuando ejecutemos el indicador de formación dentro de un informe. En este caso, indicaremos que reglas de asociación se van a devolver en los indicadores previsibles que se creen. En nuestro ejemplo, devolveremos dos indicadores, la regla de asociación (la tupla grupo peliculas anterior –> grupo peliculas posterior) y la recomendación (grupo peliculas posterior). Y cada indicador lo devolveremos 3 veces, por cada una de las 3 reglas que mas porcentaje de confianza tenga:

Opciones de indicadores previsibles a generar

El modelo ya esta preparado para empezar a trabajar con el. A continuación, incluimos el indicador de formación en un informe, junto con los atributos necesarios para el analisis (cada fila será un pedido, material y el indicador). El informe sería algo asi:

Asociacion - Informe Creacion Indicadores Previsibles

Podeis observar como hemos incluido en las filas los atributos pedido y articulo (al fin y al cabo, los indicadores se construyen sobre dichos atributos) y en las columnas el indicador de formación creado anteriormente. Cuando ejecutamos el informe, se realiza el proceso de analisis y se crean en el lugar indicado los indicadores previsibles (uno o varios según como hayamos definido el indicador de formación). En cada  indicador previsible de los creados podremos visualizar el modelo que se ha creado con el visor de modelos previsibles (aunque hay varios indicadores previsibles, hay un unico modelo). El hecho de que haya varios indicadores previsibles es para tener información diferente que luego poder utilizar en un informe para presentar los resultados del análisis. Podremos ir realizando ajustes al modelo, cambiando el volumen del muestreo o las condiciones indicadas para la obtención de datos, o modificando los porcentajes de confianza y soporte del indicador de formación y generando diferentes indicadores previsibles que analizaremos con el visor correspondiente (tal y como vemos a continuación). También podremos validar el modelo aplicandolo sobre un conjunto de datos o muestreo diferente para confirmar los resultados que hemos obtenido en las diferentes tandas.

Visor de indicadores previsibles

En la imagen, podeis ver el visor de indicadores previsibles, donde tenemos la información del análisis realizado. Podemos ver la tabla de resultados (en otro tipo de analisis, la información que aparecerá será diferente). Podemos ver que Microstrategy ha construido la tabla de conjuntos, estando en las filas las reglas que representan a los grupos anteriores y en las columnas los grupos posteriores. El valor que aparece en cada casilla varia según el tipo de elemento elegido para visualizar ( casilla selección en la parte inferior izquierda):

  • Confidence (confianza o fiabilidad): un estimacion de la probabilidad de que una transacción tenga el elemento posterior en el caso de que contenga el antecesor. La formula sería la siguiente:
    • Confianza = Soporte (Anterior + Posterior en la misma transac ) / Soporte (Anterior)
  • Support (soporte): frecuencia relativa de que una transaccion contenga el anterior y el posterior.
  • Lift (aumento): Una relación que describe si la regla es más o menos significativa que el azar. Valores lift superiores a 1,0 indican que las transacciones con el anterior tienden a contener el posterior más a menudo que las transacciones que no contienen el antecedente.

La leyenda en la parte inferior de la tabla muestra el minimo y el maximo valor de la estadistica seleccionada para visualizar (con la correspondiente graduación de colores según los valores).

Despues de ajustar el modelo, realizar la verificación y las reejecuciones que se estime necesario, podemos comprobar los resultados incluyendo los indicadores previsibles en un informe estandar de Microstrategy. Para nuestro ejemplo, el informe final con los resultados podría ser algo así:

Modelo asociacion - Informe resultados con Indicadores Previsibles

A partir de los resultados, se podrían completar otro tipo de analisis que nos llevasen a establecer determinadas promociones con las peliculas, como colocarlas conjuntamente en los lugares de venta o en las zonas de paso, realizar packs que incluyan las dos, promociones de segunda unidad a un menor precio, etc. Las posibles acciones a realizar se podrian verificar a posteriori utilizando los grupos personalizados, de forma que podamos ver el historico de ventas anteriores de los materiales por separado y como han evolucionado las ventas despues de realizar las correspondientes acciones y venderlos conjuntamente. Incluso podriamos utilizar el indicador de formación que utilizamos en el estudio para verificar que los porcentajes de confianza han aumentado.

Si quereis ampliar información sobre el datamining con Microstrategy, os recomiendo la lectura del white paper elaborado por ellos.

En la siguiente entrada del blog realizaremos el diseño completo de 2 ejemplos mas de Data Mining con Microstrategy 9.

Posted in Business Intelligence, Data Mining, Microstrategy | Leave a Comment »

14.8.2. Dashboard y Cuadros de Mando en Microstrategy 9. Utilizando documentos de Report Services (II).

Posted by Roberto Espinosa en 23 febrero 2010


Ejemplo de Tablero. Analisis de Agentes Comerciales, Productos y Regiones.

En nuestro primer ejemplo de documento del tipo tablero, vamos a intentar construir un cuadro de mando donde se resuma la evolución de un año en concreto viendo la información desde diferentes ambitos, en concreto, a nivel de Agente Comercial por un lado, a nivel de Producto y a nivel Geografico finalmente. Para cada uno de estos ambitos, tendremos una pestaña (y un conjunto de informes y graficos en cada una de ellas).

Para poder hacer esto, hemos preparado un lote de informes que, anexados al documento como conjuntos de datos, nos permitiran mostrar la información de la forma deseada.

Pestaña Agentes

En esta sección tendremos 5 componentes, de los diferentes tipos que podemos utilizar en los documentos, que son:

  • Selector (del tipo cuadro de lista): este control estará asociado a los valores del atributo Agente Comercial. En el control se mostrara la lista de todos los agentes que tienen ventas en el periodo y un atributo Total (para el total de todos ellos). Este valor aparecerá marcado por defecto. Los controles Evolución Mensual Ventas por Agente y Ventas Anuales por Región estarán vinculados al selector, de forma que al cambiar el valor seleccionado, la información de los otros controles variara dinamicamente.

Selector de Agente

  • Gráfico Evolucion Mensual Ventas por Agente: grafico de tipo Linea Vertical donde veremos la evolución mensual de importe de ventas, unidades y margen para el agente seleccionado.
  • Tabla Ventas Anuales por Región: tabla donde veremos, para el agente seleccionado, los volumenes de ventas, unidades y margen detallados por región.

Ademas, tendremos dos componentes mas que no van a depender del agente seleccionado:

  • Tabla Ventas Anuales por Agente: incluye las ventas de todos los agentes, con el porcentaje sobre el total de ventas, el ranking. el porcentaje de margen y un indicador de umbrales para detectar rentabilidades bajas o negativas.
  • Grafico Evolución Anual por Agente y Linea Producto: grafico de tipo Area Vertical para analizar comparativamente todos los agentes y el peso de las diferentes lineas de producto en sus ventas.

Los cinco controles descritos estan todos vinculados a dos conjuntos u origenes de datos (informe Comercial – Mes los cuatro primeros y para el ultimo  gráfico el informe Comercial – Linea Producto).

El resultado final del diseño, incluyendo todos los elementos mencionados será el siguiente (podemos ver la ejecución en modo interactivo).

Ejemplo de Tablero - Información de Agentes Comerciales

Podeis observar que en el cuadro selector de agentes aparece marcado el valor Total. Al ir cambiando el valor seleccionado, se ira actualizando la evolución mensual por agente y la tabla de ventas por región, permaneciendo los otros dos controles fijos (pues muestran información global).

Pestaña Producto

En esta pestaña dispondremos de 4 componentes, con el objetivo de ver de forma rapida la evolución anual de ventas por atributos de la dimension Producto.

  • Grafico/Tabla Evolución Ventas Mensual por Linea Producto: grafico de tipo Area Vertical para analizar la evolución mensual de las ventas por Linea de Producto. También se incluye la visualización de la tabla de datos para darle contexto al gráfico.
  • Tabla Ingresos por Varietal: ingresos anuales por variedad de uva.
  • Grafico/Tabla Ingresos por Target: ingresos anuales por Target de Mercado del producto. El grafico será del tipo Circular (tarta) para ver el peso de cada elemento dentro del total. Ademas se visualiza la información del gráfico en forma de tabla para darle contexto al gráfico.

La visualización de la pestaña al ejecutar es la siguiente:

Ejemplo de Tablero - Información de Productos

Todos los componentes de esta pestaña estan asociados al conjunto de datos Producto – Mes (es un informe que obtiene la información de ventas con los atributos linea de producto, mes, target y varietal). De esta forma, con un unico informe estamos viendo 3 visiones diferentes de la información en el tablero.

Pestaña Region

En esta sección del informe pretendemos analizar la información anual de ventas desde un punto de vista geográfico. Para ello, incluimos los siguientes componentes:

  • Tablas ventas anuales por región: tabla donde visualizaremos los importes de ventas, unidades y margen detallados por región. Ademas, incluiremos el peso de cada región en cada indicador (porcentaje sobre el total). Como elemento nuevo, haremos que el valor del atributo región sea un selector, de forma que algunos de los componentes de la pestaña se actualicen según la región seleccionada.
  • Tabla ventas anuales región – material: en esta tabla apareceran los 10 productos con mas ventas de la región seleccionada.
  • Tabla ventas anuales por provincia: en tabla aparecera, para la región seleccionada, el detalle de ventas de cada provincia, incluyendo el porcentaje de ventas sobre el total general.
  • Grafico ventas anuales por provincia: igual que el componente anterior, pero en forma de grafico circular (para ver los pesos de cada provincia), veremos los importes de ventas y unidades.
  • Tabla ventas anuales región – cliente: en esta tabla apareceran los 10 clientes con mas ventas de la región seleccionada.
  • Tabla resumen anual por Zonas Geográficas: en esta tabla apareceran los volumenes de ventas anuales con la clasificación de las regiones por Zonas (utilizando para ellos los elementos derivados).

La visualización de la pestaña Región al ejecutar es la siguiente:

Ejemplo de Tablero - Información de Regiones

Para la construcción de los controles de la pestaña hemos utilizado 3 informes (ventas por Región – Cliente para el top 10 de clientes, ventas por Región – Material para el top 10 de materiales y el resto con el de ventas por Región – Provincia). Conforme vayamos cambiando la selección de la región en el control principal, se iran modificando la información detallada por provincia y los top 10 de clientes y materiales de esa región.

Ejemplo de Tablero. Evolución de Ventas por Linea de Producto.

El siguiente ejemplo es un tablero de analisis de evolución de ventas, pero centrandonos en el analisis del atributo Linea de Producto dentro de la dimensión Producto. Ademas, en este tablero vamos a utilizar widgets Flash, que de paso nos servirá para ver algunos inconvenientes de la posibilidad de ver los documentos en varios formatos (problema en el uso de componentes y visualización de los formatos diferente). El periodo de analisis es un rango de fechas, que indicaremos al ejecutar el documento (en lugar de un periodo anual como en el informe anterior).

El tablero se gobierna por un control selector del tipo Barra de Botones, asociado a los valores del atributo Linea de Producto (lo podeis ver en la parte superior del tablero, debajo del título). Este control va a determinar la información que se visualiza en todos los demas controles del tablero, que son:

  • Grafico Evolución mensual de ventas por Linea de Producto: para la linea de producto seleccionada, veremos la evolución de ventas por mes, tanto a nivel de ingresos como unidades vendidas, en un grafico de lineas vertical. Incluimos en el gráfico los valores de indicadores en cada punto de la linea.
  • Grafico barra de desplazamiento de serie temporal: es un widget flash que nos permite desplazarnos por una serie temporal e ir viendo de forma gráfica los resultados. En nuestro caso, la serie temporal la determinara el atributo día, y para cada dia, veremos la evolución de importes y unidades vendidas. La información visualizada correspondera a la linea de producto seleccionada. Nos podremos ir moviendo por la serie temporal en el gráfico guia superior, de la misma manera que podremos ir haciendo mas grande o pequeño el periodo de analisis que se visualizara en el gráfico inferior).
  • Conjunto de marcadores para analisis de target: utilizando widget flash del tipo indicador, vamos a contruir un conjunto de ellos para ver la evolución de ventas por Target de Mercado por un lado y por otro lado, la comparativa entre las ventas reales y las presupuestadas en el periodo (en los marcadores de la derecha). De la misma manera que en los controles anteriores, solo vemos la información de la linea de producto seleccionada.
  • Tabla analisis de rentabilidad mensual: para la linea de producto seleccionada, veremos un analisis detallado de varios conceptos por mes. En concreto, veremos las ventas y su peso sobre el total global; el precio medio de venta, el margen absoluto, el porcentual y su peso sobre el total global y finalmente el numero de pedidos y el importe medio de cada pedido.

La ejecución en modo flash del documento sería la siguiente (es necesario para visualizar correctamente los widgets flash).

Ejemplo de Tablero - Analisis de Linea de Producto

En este caso, hemos utilizado tres origenes de información (Linea de Producto – Mes para la evolución de ventas mensual y el analisis de rentabilidad, Linea de Producto – Fecha para la serie temporal por día y Linea de Producto – Target para el conjunto de marcadores).

Podeis descargaros la exportación en Flash del tablero aqui. Podreis ver como funciona de forma dinamica el informe (como si lo estuvierais ejecutando, aunque con un conjunto de datos concreto). Es necesario descargar el fichero a disco y entonces abrirlo con el Internet Explorer (permitiendo la ejecución de los controles ActiveX que lleva incluidos el Flash).

Algunas consideraciones sobre el uso de documentos.

En nuestro caso, hemos utilizado la herramienta Desktop para el diseño inicial de los documentos. En este entorno de trabajo, construimos los documentos y realizamos una previsualización en modo PDF o en modo Flash para ir viendo como queda la presentación (con limitaciones respecto a los ajustes de formateo o de propiedades de los controles widgets, por ejemplo).

Cuando incluimos los objetos en el informe, siempre tenemos el menú contextual sobre ellos con el que podemos modificar las propiedades generales (tamaño, colores, relación con otros objetos, efectos, titulos, filtro sobre el elemento (solo a nivel de atributos), conjuntos de datos al que esta asociado el elemento, etc.). El menú contextual va variando según el elemento que tenemos seleccionado, mostrando opciones diferentes según el tipo de componente. Al incluir gráficos, tablas o controles widget, al hacer doble click en el elemento (o selecciónando la opción modificar en el menú contextual), entramos en modo edición sobre el y podremos cambiar aspectos particulares (por ejemplo, en una tabla podremos los atributos e indicadores incluimos en el, estilo de la tabla, indicadores calculados, subtotales, umbrales, formato de visualización (tamaño de fuente, colores, tipo de letra), elementos derivados, ordenación, tamaño de filas y columnas en la visualización, etc. En un gráfico en el modo de edición podremos seleccionar el tipo de gráfico, titulos y todos los atributos especificos del gráfico, según el tipo de este, etc).  Cuando estamos en el modo edición de un objeto, en el menú general aparecen las opciones correspondientes al objeto (por ejemplo, para una cuadricula aparecen las opciones Insertar, Formato, Datos, Cuadricula, Mover, etc.).

Modo diseño en Entorno Web

Siempre que utilicemos un gráfico dentro de un documento (igual que cuando realizabamos informes) o al incluir un widget, nos pasaremos al modo tabla del objeto para añadir los atributos e indicadores necesarios (recordar que cada tipo de gráfico o widget tiene unos requerimientos de atributos  e indicadores en filas y columnas para poder funcionar). Una vez ajustados estos elementos, volveremos a pasar la visualización al modo gráfico para ver como quedara el objeto en las previsualizaciones. Esto no será necesario para algunos widget que no estan asociados a datos (como, por ejemplo, el lector rss o el editor de seleccion de fechas).

Cuando tenemos los documentos bastante elaborados, es el momento de realizar los ajustes en el formato, y para ello es recomendable hacerlo desde el entorno Web. En este entorno, como ya vimos, tenemos varios tipos de visualización. Los tipos de visualización son los siguientes (ademas del modo diseño):

  • Modo Editable: es similar al de diseño, pero los controles se muestran con información, de forma que nos podemos hacer una idea de como quedara el formato de los resultados. En este modo se pueden realizar todos los ajustes del modo diseño vistos. Los widgets flash no funcionan y no se pueden cambiar los  atributos de visualización de este tipo de objeto. Por ejemplo, este modo es ideal para realizar ajustes en los tamaños de filas y columnas, pues estamos viendo los controles con información real (este ajuste también se hace en el modo diseño, pero a ciegas, pues no vemos el resultado con datos).

Modo Editable - Cambio tamaño filas y columnas

Tanto el modo diseño como el modo editable son modos orientados al diseñador de los documentos. Los modos siguientes son modos de ejecución:

  • Modo Vista: es un modo estático, como si estuvieramos viendo el resultado de ejecución del informe en un Pdf. No se puede realizar ningún ajuste y los widgets flash no funcionan.
  • Modo Interactivo: es un modo de ejecución y en el no podremos cambiar ningun aspecto del diseño del documento. Solo podremos cambiar aspectos relacionados con los componentes que forman el documento, de los modificables en tiempo de ejecución. Por ejemplo, en una tabla, tal y como vemos en la imagen, podremos navegar por los atributos en el caso de que lo hayamos permitido, realizar ordenación, totalización, ajustar los filtros de visualización, mover los elementos o quitarlos, formatear los campos, cambiar el nombre de representación, crear elementos derivados o cambiar tamaño de filas y columnas (sería similar a cuando ejecutabamos un informe en el módulo de reporting, pues tenemos casi las mismas opciones de ajuste de los resultados de un informe). Y ademas nos permite el uso de Elementos derivados, que en la parte de reporting era exclusivo de los informes sobre cubos inteligentes.

Modo Interactivo - Opciones disponibles en tabla

  • Modo Flash: es igualmente un modo de ejecución. Las opciones de ajuste de los componentes estan muy limitadas (casi inexistentes). Como mucho se pueden ordenar o mover columnas a izquierda y derecha.En este modo si funcionan todos los widgets y se pueden configurar las propiedades de ellos. En el modo Flash no funciona la navegación dimensional ni se puede realizar actividad alguna sobre los datos (creación indicadores, creación elementos derivados, formato, totalización, etc). Pero si podremos darle interactividad a los informes, pues los Selectores si funcionan. Cuando exportamos un documento en modo flash, con el archivo generado se integran todos los datos presentes en la ejecución del documento (habra que tenerlo en cuenta, pues puede que veamos una pequeña parte de los datos en los controles, pero en los conjuntos de datos haya mucha información, que hara que el fichero flash sea muy grande). En la imagen, configuración de la barra de desplazamiento de serie temporal.

Modo Flash - Propiedades Widget Serie Temporal

El modo por defecto en el que se ejecuta un documento, así como los modos disponibles son propiedades que se indican a nivel de documento, tal y como vemos en la imagen siguiente. Por tanto, nosotros determinaremos que modo de visualización va a estar disponible. Si, por ejemplo, usamos controles widgets, lo lógico sería verlos en el modo Flash. De la misma forma, si utilizamos gráficos que no se van a visulizar en modo Flash, lo lógico sería utilizarlos en modo Interactivo.

Propiedades de documento - Modos de Visualizacion

En los ejemplos no hemos incluido navegación dentro de los informes o los gráficos, ni tampoco la llamada a otros informes a través de la vinculación de atributos. Pero la funcionalidad esta disponible y se podría haber sacado partido de ella para profundizar mas en los datos (sobre todo para analizar determinados aspectos que nos llamen la atención, como tendencias, valores negativos o por debajo de lo esperado, etc.).

Conclusiones

Durante la elaboración de los ejemplos, partiendo de nuestro proyecto Enobi (que recuerdo es una empresa ficitica y por tanto, inexistente), he constatado lo importante que es tener bien claro que se quiere analizar, definir bien el ambito de este análisis  y los indicadores clave que queremos estudiar. Los ejemplos descritos son sencillos y no entran en profundidad en los requerimientos de análisis del area de ventas de cualquier empresa, pero intentan que veamos las posibilidades de lo que podemos construir utilizando la herramienta de Microstrategy,combinando los diferentes elementos, dandole  dinamismo a los informes y reutilizando todas las funcionalidades de reporting y navegación Olap que ya vimos en entradas anteriores del Blog.

Despues de estar trabajando durante una semana la eleboración de documentos utilizando tableros puedo afirmar que no es el producto de la suite de Microstrategy mas logrado. Resulta complicado realizar los documentos de tablero, darles el formato deseado y entender de una forma sencilla el funcionamiento global de los documentos. Ademas la documentación no es muy clara y aunque hay ejemplos de diseño en el repositorio de ejemplo, no se pueden ejecutar.

Los principales inconvenientes detectados son los siguientes:

  • Diferentes modos de ejecución del documento. En cada sitio se puede modificar una cosa y no todos los controles funcionan en todos los modos (los widgets no funcionan en el modo interactivo y no todos los graficos funcionan en el modo flash). Esto nos limita las posibilidades de diseño y ademas complica este proceso, pues habrá que estar teniendolo en cuenta todo el rato según el tipo de componente a utilizar y en que tipo de visualización se vaya a ejecutar el documento.
  • Ajustes de formateo: Lo que se formatea bien en un modo no aparece igual en otro modo. Por ejemplo,  a nivel de tipos de letra, gráficos, tablas, etc. Igualmente, al realizar la exportación de los documentos (por ejemplo a Excel), no siempre se consiguen resultados aceptables.
  • Interfaz Web lenta en el modo diseño y editable. Es tedioso el posicionamiento de los componentes dentro de la cuadricula y el uso de los menus desplegables.
  • No se pueden poner limites en indicadores a nivel de cuadricula o grafico (habrá que ponerlos en el informe original). Esto nos puede obligar en ocasiones a construir varios informes para sacar subconjuntos de datos.

En lo referente a ventajas, podríamos indicar:

  • Conjuntos de datos: a partir de un unico conjunto de datos (incluido en el documento a través de un informe predefinido), podemos construir multiples visualizaciones de los datos, tal y como hemos visto en los ejemplos.
  • Multiples elementos disponibles para utilizar en los diseños. Con ellos se pueden construir informes atractivos y visuales (incluso muy bonitos en el modo Flash, aunque con las limitaciones indicadas).
  • Se saca partido a toda la funcionalidad de los informes y la navegación Olap, lo que nos permite ejecutar de forma conjunta varios informes y tambien reutilizar elementos predefinidos.
  • Los documentos se pueden ejecutar desde el entorno Office, embebidos dentro de la suite de Microsoft. La exportación de los documentos vía Pdf, Excel, Html o Flash puede ser una forma de generar contenido estatíco para enviar o para una intranet (con las limitaciones de formato indicadas). Como ejemplo de esto, el flash generado en nuestro ejemplo de tablero. El documento Flash obtenido es de gran calidad y da muchas posibilidades de hacer cosas interesantes.

Como curiosidad final, durante la construcción de los documentos de Report Services, venció la licencia de evaluación de Microstrategy 9 de 30 días que me habia proporcionado Microstrategy. Volví a instalar la licencia de Microstrategy Reporting Suite y me lleve la agradable sorpresa de que siguen activas las funcionalidades vistas hasta ahora. Solo bajo el numero de licencias disponibles a 2 (excepto en los usuarios de reporting Web e Intelligence Server, que son 25), limitando el uso a 1 cpu (de las 4 que tiene mi servidor). Ademas, tuve que desinstalar los productos Command Manager, Enterprise Manager, Object Manager, SDK y Web MMT para poder completar el registro. Por lo evaluado del producto (todo incluido en la Reporting Suite), puede ser una opción muy interesante para las empresas que empiezan en el mundo BI.

Si quereís ver ejemplos de las diferentes formas de construcción de dashboards y tableros, podeís acceder a las demos Online en la web de Microstrategy.

Posted in Business Intelligence, Microstrategy | Leave a Comment »

14.8.1. Dashboard y Cuadros de Mando en Microstrategy 9. Utilizando documentos de Report Services (I).

Posted by Roberto Espinosa en 19 febrero 2010


Como una componente avanzada para reporting y para la creación de cuadros de mando, tableros de control y tarjetas de puntuación, Microstrategy nos proporciona el producto Report Services.

Este producto también esta incluido en la Microstrategy Reporting Suite, aunque limitado el número de licencias a 2 usuarios. En el se trabaja con el concepto de Documento. Los documentos los utilizaremos para formatear la información proveniente de uno o varios informes en una interfaz simple con presentación de calidad. En un documento podremos incluir multiples elementos ademas de los que vimos al analizar el reporting (layout, imagenes, bordes, controles, pestañas, widgets). En un mismo documento podremos tener diferentes componentes relacionados entre si o no, a los que ademas podremos dar dinamismo con el uso de controles, listas de selección, botones, pestañas o permitiendo la navegación y el uso de las funcionalidades de reporting.

Los documentos introducen el concepto de conjunto de datos. Un documento podrá tener varios conjuntos de datos. El conjunto de datos lo define un informe estandar, que se asociara al documento y determinara el conjunto de información que recuperara el Intelligence Server y que podrá ser utilizada en el documento de diferentes maneras. Ademas de los conjuntos de datos, habrá otra mucha información referente al diseño del documento que quedara guardada en la definicion de este.

Para trabajar con los documentos es necesario conocer los informes de Microstrategy y todas las funcionalidades que vimos en las correspondientes entradas del blog ( Reporting en Microstrategy I, Reporting en Microstrategy II y Cubos Olap). El conocimiento avanzado del reporting nos permitira sacar más partido a los documentos.

Diseño de Documentos.

El diseño de documentos lo podemos realizar bien desde la interfaz Web, o desde el entorno Windows con la aplicación Desktop. En nuestro caso, vamos a trabajar con la aplicación Desktop para el diseño y los resultados los mostraremos en la interfaz Web.

Basicamente, podemos trabajar con dos tipos de documentos, los que se llaman General y los Tableros. Los documentos del tipo General esta orientados a la generación de formularios o documentos estáticos del tipo PDF, como por ejemplo, para generar facturas o informes, donde queramos tener una serie de secciones, con marcadores, titulo,encabezado, pie de pagina. Aunque se podrán utilizar para generar también documentos dinamicos, estan orientados a la impresión o a la exportación en otros formatos.En la imagen podeis ver el editor de Documentos, con un documento de este tipo. Mas adelante entremos un poco mas a fondo en este tipo de documentos.

Editor de Documentos - Tipo de Documento General

Por otro lado, tenemos los documentos del tipo Tablero, orientados a la creación de tableros, tarjetas de puntuación y cuadros de mando. Documentos que tratan de concentrar en un unico pantallazo (aunque pueda tener varias secciones o pestañas), toda la información. Con una presentación de calidad, gráfica e intuitiva para permitir el analisis de la información de una forma fácil. En la imagen posterior, podeis ver el diseño de un cuadro de mando para analizar la información por comercial. Es un informe dinámico, donde al seleccionar el agente comercial que queremos analizar, se actualizaran los otros 3 controles del tablero, uno donde se analizan las ventas por linea de producto, otro por region y en el gráfico la evolución mensual de ventas.

Editor Documentos - Tablero

Los documentos, una vez construidos y ejecutados, se pueden visualizar de varias maneras y exportar en varios formatos, y por eso habrá características de los documentos que serán especificas para cada uno de los formatos. Por ejemplo, podemos trabajar en modo PDF, en modo editable, en modo Html o en modo Flash. El formato PDF incluira propiedas para paginación, creación de secciones o marcadores, etc. Para el caso de la visualización Flash, tendremos controles o widgets que solo funcionaran en este modo. Es importante conocer esto para decidir que tipo de presentación utilizar para cada documento y realizar el diseño de forma adecuada.

Vamos a ver un poco mas en detalle la interfaz de usuario del editor de documentos antes de profundizar en los elementos de cada tipo de documento y construir finalmente varios ejemplos de Dashboard.

Editor de Documentos.

El editor de Documentos es el elemento central desde el cual vamos a realizar el diseño nuestro documentos y tableros. Como ya hemos indicado, podríamos realizar el diseño de los documentos desde el entorno Web, pero en nuestro caso nos vamos a centrar en el Desktop. Via Web la funcionalidad es muy similar y hay pequeñas diferencias.

Los componentes del editor de documentos son los siguientes:

  • Menú: en la parte superior de la pantalla, nos ofrece las diferentes acciones y elementos con los que podemos trabajar al diseñar los documentos. Es un menú contextual, de forma que cambian las opciones según el elemento que tengamos seleccionado en el area de diseño. Por ejemplo, si en el area de diseño hemos incluido una cuadricula, cuando esta este seleccionada y estemos en modo edición dentro de ella, en el menú nos aparecerán las opciones tal y como si estuvieramos trabajando en el editor de informes (pues una cuadrícula no es, al fin y al cabo, mas que un informe embebido en el documento). Por ejemplo, en ese caso nos aparecerán las opciones para definir umbrales sobre los indicadores, formatear los valores o encabezados de filas y columnas, cambiar el estilo de la cuadricula, etc, etc. Esto nos recuerda, como ya hemos indicado, lo importante que es conocer al fondo todas las caracteristicas del reporting, pues al fin y al cabo seguimos utilizando por debajo los mismos elementos que ya vimos.
  • Barras: tenemos varias barras de herramientas con las que podemos trabajar con los diferentes elementos de una forma rapida. Las barras son las siguientes:  General (botones para guardar y guardar como), Modificar (botones para copiar, pegar, eliminar, deshacer y hacer zoom en el diseño), Ver (botones para cambiar el modo de visualización del documento y para seleccionar si vemos o no las diferenets secciones de la pantalla, Controles (botones para la inserción rapida de controles en el documento) y Formato (botones para el formateo de los elementos, como tipo de letra, estilo del documento, formato de numeros, etc).

Editor Documentos

  • Area de Diseño: es la zona del editor donde realizamos la definición de como sera nuestro documento. Tenemos una cuadrícula donde iremos incluyendo los diferentes elementos. El Area de Diseño tiene varias secciones predefinidas que podemos visualizar o no (aparte de las secciones que podremos añadir nosotros). En la imagen, podemos ver el area de diseño en la parte inferior-central derecha.
  • Conjutos de datos: los documentos no tienen sentido sin conjuntos de datos vinculados que podamos mostrar utilizando los diferentes componentes de los documentos. Como hemos indicado antes, un documento puede tener uno o varios conjuntos de datos. Los conjuntos de datos se asocian al documento a través de los informes que tendremos construidos en nuestro sistema y que añadiremos al documento. Al incluir un informe, aparecen todos sus atributos e indicadores en la sección Conjuntos de datos, tal y como vemos en la imagen, en la parte izquierda del editor de documentos. Todos los elementos definidos en el informe los podremos utilizar para crear, por ejemplo, cuadriculas, graficos, listas de elementos o para incluirlos en alguno de los widgets que nos proporciona Microstrategy.
  • Listas de propiedades: podemos modificar las propiedades de cualquier elemento con el menú contextual del boton derecho, o seleccionado el elemento y visualizando la sección Lista de propiedades. La lista de propiedades es dinámica, pues cada objeto tiene unas propiedades diferentes y por tanto, diferentes características que se podran definir para cada uno de ellos.

Antes de empezar a trabajar con los diferentes tipos de documentos, vamos a ver los diferentes modos de trabajo y visualización que podemos utilizar con los documentos. Vamos a diferenciar cuando trabajamos con el Desktop y cuando trabajamos desde el portal Web (para ver que el portal Web es mas completo en este aspecto):

  • Desktop:
    • Vista Diseño: es el modo que utilizamos para realizar el diseño de los documentos. En este modo podremos insertar conjuntos de datos, controles como cuadriculas/graficos, campos de texto, lineas, formas y paneles. No podremos en este modo trabajar con los widgets de Flash.
    • Vista PDF: se visualiza el documento como si fuera un pdf estatico. No podremos modificar o crear documentos, ni modificar las propiedades del que estemos visualizando.
    • Visualización Html: visualización preeliminar de un documento en modo HTML. No se puede cambiar nada de el.
    • Visualización Flash: visualización preeliminar de un documento en modo Flash. No se puede cambiar nada de el.
    • Exportación:  formato PDF, Excel, Html o Flash.
  • Web:
    • Modo Diseño: es el modo que utilizamos para realizar el diseño de los documentos. En este modo podremos insertar conjuntos de datos, controles como cuadriculas/graficos, campos de texto, lineas, formas y paneles. No podemos cambiar algunos aspectos de las cuadriculas/gráficos (como valores de indicador y encabezados de atributos), ni el formato a los widgets flash o paginacion para agrupar datos u ordenar informes de cuadricula.
    • Modo Editable: es similar al modo anterior, pero incluyendo la visualización de datos reales. Permite todas las operaciones sobre los controles, excepto aplicar formato a propiedades flash de los widgets. Al incluir datos, el rendimiento es peor.
    • Modo Interactivo: modo interactivo, de ejecución de los informes. No permite crear documentos nuevos, pero si editar el formato de cuadriculas/graficos, ordenar los informes y mover los objetos de estos, agregar totales, cambiar tamaño de filas y columnas o crear indicadores calculados. No se puede aplicar formato al diseño ni a los controles widgets.
    • Modo Flash: similar al interactivo, pero ademas permite  interactuar con los widgets de Flash, y modificar su formato.
    • Modo Vista: se visualiza el documento como si fuera un pdf estatico. El documento no es interactivo. No podremos modificar o crear documentos, ni modificar las propiedades del que estemos visualizando (similar a la vista PDF del Desktop).
    • Exportación:  formato PDF, Excel, Html o Flash.

Propiedades básicas de los documentos

Los documentos tienen un conjunto de propiedades básicas, que estan agrupadas por secciones, en las que podemos indicar:

  • Configurar página: se define el tamaño del papel, orientación, escalas, margenes, etc.
  • Propiedades de Diseño: colores y bordes del documento, secciones que forman el documento, etc.
  • Propiedades del documento: estilo por defecto para las cuadriculas que se incluyan en el, modos de visualización disponibles (podremos hacer que un documento solo se pueda ver, por ejemplo, en modo Flash), formatos de exportación permitidos, modo de ejecución por defecto del documento, propiedades de exportación (por ejemplo, si al exportar a PDF se incluiran marcadores o se mejorara la resolución de gráficos).

Propiedades de un documento

Los objetos mas importantes que podemos utilizar en los documentos son:

  • Texto: casillas con texto que podremos formatear de la forma deseada.
  • Imagen: imagenes en los formatos bmp, jpg o gif.
  • Lineas: lineas graficas para mejorar nuestro diseños.
  • Formas: rectangulos o rectangulos redondeados que podremos formatear.
  • Informe: incluir un informe dentro del documento (al incluirlo, se añade en el conjunto de datos los atributos e indicadores que forman este informe).
  • Cuadricula: incluimos una cuadricula similar a la que utilizamos al crear un informe. Una vez creada la cuadricula, se le incorporan los atributos e indicadores deseados de los disponibles en el conjunto de datos.

Objeto del tipo cuadricula

  • Grafico: gráficos de todos los tipos disponibles en los informes.
  • Pila de paneles: paneles para crear areas de objetos diferenciadas dentro del documento.
  • Contenedor HTML: objeto que contendra código HTML personalizado.
  • Selector: objetos que nos permiten establecer criterios de seleccion dinámicos dentro de los documentos ( listas desplegables, casillas de verificacion, botones de opcion, cuadros de lista de valores, selección de fecha, barra de vinculos).

Selector del tipo Cuadro de lista de valores

  • Texto automatico: campos de texto automatico (numero de pagina, identificador de usuario, fecha/hora actual, nombre del documento, valores de las selecciones dinamicas utilizadas o de los filtros,  etc.).
  • Widgets Flash: solo se pueden añadir editando los documentos desde el portal Web. Incluye elementos como los siguientes: Cuadricula de burbujas, cilindro, nube de datos, selector de fechas, ojo de pez, embudo, indicador, matriz de graficos, mapa de calor, grafico de burbujas, grafico apilado interactivo, medio, micrograficos, lector de rss, termometro, barra de desplazamiento de serie temporal, cascada o visor de lista ponderada.

Widget Flash - Micrograficos

Asignación de conjuntos de datos a documento. Construcción de tablas y graficos a partir de informes o conjuntos de datos.

Cuando vinculamos un informe a un documento, todos los filtros y selecciones dinamicas de este se asocian tambien al documento,y en el caso de ser dinamicas, se ejecutaran cuando lanzemos el documento. Si vinculamos varios informes al documento y comparten el mismo filtro o selección dinámica, solo se ejecutará una vez. En el caso de que haya varias diferentes, podremos definir el orden en que seran ejecutadas.

Desde el panel de conjunto de datos podremos crear nuevos indicadores calculados utilizando los indicadores existentes en cada conjunto de datos (informe). Desde este mismo lugar podremos acceder a la modificación del informe original desde el cual se extraen los datos (puede ser util para agilizar el proceso de diseño).

Cuando en un documento añadamos cuadriculas o graficos, los podremos llenar arrastrando a filas y columnas los elementos que deseemos incluir en él (atributos, indicadores o indicadores calculados), formando un nuevo informe dentro del documento (que extrae su información del conjunto de datos ). De esta forma, utilizando el mismo origen de datos se pueden construir multiples cuadriculas/graficos con diferente información mostrada (que cogen la información del mismo sitio, del conjunto de datos que define el informe). En una cuadricula no se podrán combinar atributos o indicadores que provengan de conjuntos de datos diferentes.

Vinculación entre objetos.

Cuando en un documento disponemos de varios objetos del tipo tabla o grafico, podemos hacer que los datos que se visualizan dependan del valor de otro componente del documento (por ejemplo, una casilla de selección o una lista de valores). Esto se consigue a traves de la propiedad avanzada «Dirigido por». Por un lado, en el objeto destino indicaremos que atributo es el que modifica la información mostrada en el (tal y como vemos en la imagen).

Atributo de dirige un control

Además, en el objeto Selector del tipo lista de valores (en que determinara el comportamiento de los otros objetos), indicaremos los destinos seleccionados. Son los objetos cuyo contenido se modifica al seleccionar un determinado valor de atributo en el selector (y por tanto, varia la información que se muestra en ellos).

Destinos que controla un objeto del tipo selector

Por ejemplo, imaginar una lista de valores con las diferentes regiones de un pais. Al seleccionar una región, podremos hacer que las cuadriculas o gráficos del documento solo muestren los valores de ella. O al seleccionar el valor Total, se muestren los importes de todas las regiones.

Una vez realizada la introducción de los componentes de un documento y despues de ver de forma general la forma de vincular los objetos que hay en él, vamos a diseñar un lote de ejemplos para hacernos una idea de las posibilidades de la herramienta Microstrategy.

Ejemplo de Documento General. Informes de ventas enviado a las delegaciones en PDF.

Para ver un ejemplo de un documento del tipo general, vamos a construir un informe de Evolución de Ventas por Region y Provincia trimestral. Será un informe estático que sera enviado por correo a las delegaciones en formato PDF. Se trata de darle una presentación atractiva pues será un documento corporativo.

Al crear el documento, seleccionamos que sea del tipo General. En ese momento, nos aparece la cuadrícula de diseño, donde podemos ver las diferentes secciones del documento ( Encabezado de página, encabezado de documento, detalle, pie de detalles, pie de documento y pie de página). Se puede controlar facilmente que secciones se visualizan y cuales no, desde las propiedades del documento, tal y como vemos en la imagen:

Secciones de un documento

En cada sección podremos ir incluyendo los diferentes objetos de diseño de los vistos anteriormente, asi como ir cambiando las propiedades de cada sección (tamaño, color, formato). En nuestro caso, insertarmos en encabezado de documento una portada para nuestro documento, con un texto y una imagen. En encabezado de página pondremos un titulo que se mostrará en todas las páginas del documento, de la misma manera que en pie de página mostraremos el número de página actual del documento.

Como queremos ir sacando la información de cada región detallada, vamos a asociar el documento a un informe que ya teniamos realizado, llamado ventas por Región, Provincia y Trimestre. Asociamos el informe con la opción Datos –> Agregar conjunto de datos, seleccionando el informe del repertorio definido en nuestro sistema. Podemos ver en la imagen siguiente como aparece, en la parte izquierda del documento, el nombre del informe y los indicadores y atributos de este en la sección Conjuntos de Datos.

Llevamos el atributo Región a la zona de paginación del documento (zona superior del documento, justo encima de la barra de cuadricula ). Al añadirla, aparecen en el documento dos nuevas secciones, llamadas Encabezado de Región y Pie de Región. Esto significa que vamos a realizar paginación sobre el valor de este atributo (aunque podremos configurar el comportamiento de la sección, para decir por ejemplo, si queremos que se cree una pagina nueva o no u otros aspectos). Incluimos en la primera de ellas el texto Región y un campo variable a continuación para que se muestre el nombre de cada región.

Ejemplo documento general

A continuación, construimos, en la sección Encabezado detalles una cuadricula y un gráfico. Para ello, insertamos primero el control y a continuación le añadimos los atributos e indicadores deseados arrastrandolos y dejandolos caer sobre el control. Cuando se hace doble click en el control del tipo cuadricula, se puede editar ademas la disposición de filas y columnas, así como realizar ajustes en el formato, añadir umbrales, totalización o crear indicadores calculados. En la cuadricula veremos una evolución de las ventas por provincias y trimestre del año, añadiendo un porcentaje de ventas sobre el total (solo se veran las ventas de las provincias de cada región). En el gráfico, veremos solo el total de ventas de cada región, desglosado por trimestre para ver de una forma gráfica la evolución.

En la sección Pie de página insertaremos textos del tipo automatico para sacar la paginación de las diferentes páginas que se generen al construir el documento:

Finalmente, para cerrar el documento, insertamos en la sección Pie de documento otra cuadricula que será un resumen general incluyendo los datos de todas las regiones por trimestre, incluyendo igualmente el porcentaje sobre el total para ir viendo el peso de las diferentes regiones a nivel trimestral y a nivel total. El documento, una vez ejecutado y generado el correspondiente PDF, quedará de la siguiente manera:

En el documento PDF se han generado los marcadores para cada región, lo que nos permite de una forma ágil ir directamente al contenido deseado seleccionando la región en el panel. Los paneles se pueden obviar cuando se diseña el documento (indicando que cuando el documento se exporte a PDF no se generen estos).

Marcadores en el documento PDF generado

Podemos ver en el ejemplo que con un unico conjunto de datos (informe vinculado al documento), hemos podido mostrar la información en varios sitios y con diferentes estructuras y niveles de detalle. Por tanto, siempre tendremos que tener definidos de antemano el conjunto de informes consistentes que nos permitan construir los documentos con la información que queremos.

En la siguiente entrada del Blog realizaremos varios ejemplos de Documentos del tipo Tablero, para entrar de forma profunda en esta funcionalidad y poder analizar sus ventajas e inconvenientes.

Posted in Business Intelligence, Microstrategy | Leave a Comment »

14.7. Navegación Dimensional y cubos OLAP en Microstrategy 9.

Posted by Roberto Espinosa en 11 febrero 2010


En la correspondiente entrada del Blog ( 2.2. Cubos OLAP (On-Line  Analytic Processing)), vimos las características que deberían de tener las herramientas OLAP, diferenciando por un lado la plataforma OLAP y por otro lado los visores OLAP.

El termino OLAP fue introducido en 1993 por el Dr. E.F. Codd. OLAP son las siglas de On-line Analytical Processing. Es un software que nos permite la manipulación multidimensional de la información provenidente de varios origenes de datos y que ha sido almacenada en un data warehouse. El software nos permite crear varias vistas o representaciones de los datos, ademas de un acceso rapido, consistente e interactivo sobre los datos multidimensionales.

Os recomiendo revisar la entrada del Blog antes de continuar viendo como implementa Microstrategy los conceptos OLAP.

Plataforma OLAP de Microstrategy

La plataforma de Microstrategy es una plataforma ROLAP (Relational OLAP), que utiliza una base de datos relacional como soporte de datos. El Intelligence Server traduce nuestros análisis dimensionales a consultas SQL sobre esta base de datos, y construye unos cubos ROLAP virtuales que sera de donde se extraera la información con las consideraciones de Dimensiones e Indicadores seleccionados en las consultas de información. Estamos trabajando con una especie de cubos ROLAP virtuales. Ademas, el Intelligence server puede ser capaz de encontrar los cubos que se utilizan con mas frecuencia y guardarlos en memoria para la próxima vez, con lo que se mejora el rendimiento del sistema.

En la versión 9 esta presente la tecnología de Cubos Inteligentes. Estos cubos tienen una caracteristica MOLAP y funcionan de la siguiente manera. Se definen como si fuera un informe. En esta definición seleccionamos los atributos e indicadores que formaran nuestro cubo (esto será la definición del cubo, lo que determinara las dimensiones por las que podremos luego analizar la información).

Una vez el cubo esta definido, se ha de ejecutar  (en ese momento se llena con información de la base de datos). La información almacenada en el cubo esta preagregada conforme a los atributos que hayamos seleccionado y por tanto preparada y preelaborada para el análisis. Y a partir de ese momento el cubo se publica y ya esta disponible para poder ser utilizado creando informes sobre él. El cubo se podrá ir actualizando automaticamente de forma planificada, por lo que nos olvidaremos de su mantenimiento o de si los datos estan actualizados o no (lo gestionará todo la plataforma).

Funcionamiento de los cubos inteligentes

Los informes que creemos sobre el cubo intelligente solo podrán utilizar los elementos que definamos cuando construyamos el cubo. La información de los cubos esta guardada en el sistema en un sitio aparte y al ejecutar los informes, no se volvera a acceder al Data Warehouse, sino solo a la información almacenada en los cubos inteligentes (veremos mas adelante un ejemplo de construcción, planificación y explotación de un cubo inteligente). Cualquier cambio que vayamos realizando en el informe no necesita volver a acceder a la base de datos, siempre trabajara con los datos del cubo ( a no ser que nos vayamos fuera de las dimensiones establecidas, aspecto que se puede configurar para permitirlo o no). Los cubos se pueden compartir entre diferentes usuarios e informes.

Cliente OLAP de Microstrategy

A nivel de usuario, Microstrategy ofrece las características OLAP mas habituales. La mayoría de ellas ya las hemos visto al detallar los elementos de reporting de Microstrategy (en las dos entradas anteriores del Blog). En Microstrategy, los aspectos de reporting y olap estan mezclados y en un poco dificil saber cuando estamos utilizando características de reporting puro y duro y cuando características Olap. En teoría, cuando trabajamos con Desktop, en la parte inferior derecha nos aparecera el rótulo Estandar u Olap según si utilizamos o no las características Olap de Microstrategy. Realmente estariamos hablando de una distinción entre características Olap estandar y lo que llaman Olap Services.

En lo referente a la navegación multidimensional por los datos, Microstrategy incluye como hemos visto en los ejemplos las funcionalidades habituales:

  • Rotar (Swap): alterar las filas por columnas (permutar dos dimensiones de análisis)
  • Bajar (Down): bajar el nivel de visualización en las filas a una jerarquía inferior.
  • Detallar (Drilldown): informar para una fila en concreto, de datos a un nivel inferior.
  • Expandir (Expand): id. anterior sin perder la información a nivel superior para éste y el resto de los valores.
  • Colapsar (Collapse): operación inversa de la anterior.
  • Pivotación (Pivoting): movimiento de objetos de filas a columnas y de columnas a filas, asi como cambio del orden de los objetos tanto en filas como en columnas.

Cuando navegamos por los datos (y no estamos en los cubos inteligentes), las consultas se recalculan contra la base de datos. Solo puede haber algunos casos en los que se trabaja con el cubo que tenemos en memoría y no se haria un recalculo (por ejemplo, cuando quitamos un atributo del informe y nos quedamos en otro nivel de los que ya estan incluidos).

Navegacion - menu contextual

La gente de Microstrategy habla de las capacidades de Navegación llamandolas Drill-Anywhere. Se entiende que se permite la navegación en cualquier lugar y hacia cualquier dimensión del modelo de análisis (siempre que no lo hayamos limitado quitando la navegación en un informe o restringiendola a unos determinados atributos o dimensiones con los Mapas de Navegación personalizados).

Ademas de la navegación, podemos mencionar otras características, algunas de las cuales ya vimos (y que podeis revisar pulsando el correspondiente link de cada elemento):

  • Grupos de datos: cuando queremos mostrar la información en una estructura de atributos que no esta definida dentro de nuestro modelo de negocio, Microstrategy nos proporciona los Grupos Personalizados y Consolidaciones.
  • Paginación: como ya vimos, con esta funcionalidad podemos sacar un atributo de la cuadricula y crear paginas de datos para cada uno de los valores de dicho atributo (como veis en la imagen anterior, donde en la sección de paginación tenemos el atributo año).
  • Subtotales: también pasamos por ellos cuando vimos las funcionalidades de reporting de Microstrategy. Es la funcionalidad que nos permite incluir totales de diferentes tipos en los niveles seleccionados de los informes.
  • Aliasing: posibilidad de definir nombres de alias para cualquier elementro dentro los informes ( para los indicadores, atributos, grupos personalizados o consolidaciones).
  • Banding: metodo para definir el aspecto de segmentos del informe aplicandos bandas de colores. Podemos aplicar las bandas de colores a filas y columnas según el numero de ellas.
  • Ordenación avanzada: nos permite establecer criterios de ordenación compleja sobre los datos, con el correspondiente editor, indicando por niveles que tipo de ordenación deseamos, considerando tantos los valores de atributos como de indicadores.
  • Visualización jerárquica: aunque en un informe tengamos varios niveles de detalle con la visualización jerarquica o resultados indentados, podemos con un simple click selección el nivel al que queremos ver la información.
  • Umbrales: formatos personalizados sobre los valores de los indicadores para remarcar aquellos que cumplan unas determinadas condiciones (también se pueden sustituir los valores por simbolos, imagenes o texto).

A partir de los elementos siguientes es cuando Microstrategy considera que estamos utilizando funcionalidades Olap Services:

  • Filtros de visualizacion: restricciones de visualización que se aplican al informe calculado y que nos van modificando los resultados en pantalla sin volver a reejecutar la consulta sobre la base de datos (trabaja con el cubo en memoria).
  • Filtros de indicadores: filtrados sobre los valores de los indicadores que indicamos en los resultados del informe. Las condiciones podian ser sobre los valores del indicador o sobre valores de ranking. Igualmente, no se reejecuta la consulta sobre la base de datos al aplicar los filtrados.
  • Columnas calculadas: vimos que en los resultados de ejecución del informe podiamos añadir nuestras propias columnas de indicadores que incluyesen diferentes tipos de calculos (con el editor de expresiones), o bien porcentajes sobre Total, campos de Ordenación (Ranking) y Transformaciones. De la misma forma, los calculos se realizan en memoria.
  • Agregación dinámica: es la funcionalidad que nos permite cambiar de nivel de agregación en los resultados de un informe sin necesidad de volver a recalcular la consulta sobre la base de datos. La funcionalidad actua cuando estamos modificando un informe ejecutado ocultando atributos o indicadores, llevando atributos de la cuadricula a la sección de paginación, etc. Solo cuando los ocultamos, porque en el momento un objeto se borra del informe, entonces este siempre es recalculado.
  • Cubos Intelligentes.

Como funcionalidades avanzadas Olap, y que solo estan disponibles en los informes sobre cubos inteligentes y en los documentos de Report Services, tenemos las siguientes:

  • Definición de elementos derivados: es la definición de grupos de atributos creados al vuelo. Seria algo complementario a los grupos personalizados y las consolidaciones. El hecho de que se puedan construir sobre la marcha nos da posibilidades adicionales de formateo y de agrupación de la información para análisis. Se pueden definir de 3 maneras:
    • Grupos de elementos: lista de elementos, de los que tenemos en pantalla, que forman cada grupo.
    • Elementos que cumplan una condición de filtro: filtrado de los elementos de cada grupo por criterios de filtrado.
    • Operaciones sobre elementos: calculos para combinar los valores de varios atributos.

Trabajando con cubos inteligentes.

Como hemos visto, los cubos inteligentes son un conjunto de datos, generados a partir de la información existente en nuestro DW, y que podremos analizar o explotar a traves de los informes. Los cubos solo almacenan información de los datos, y la gestión de su visualización y formateo quedaran en manos de los informes que construyamos sobre ellos.

Hay algunos elementos que no se pueden incluir en el informe de definición de los cubos inteligentes, que son:

  • Grupos Personalizados y consolidaciones.
  • Elementos olap (filtros de visualización, columnas calculadas y elementos derivados).
  • Selecciones dinámicas o filtros que tengan asociados selecciones dinámicas.

Vamos a trabajar con un ejemplo de Cubo Inteligente para ver todos los pasos de su creación y explotación.

Creación de cubos inteligentes.

Para crear un cubo, crearemos un nuevo objeto en el lugar deseado del tipo Cubo Inteligente. En ese momento se nos abrira el editor de cubos (que es practicamente igual al editor de informes) y añadiremos en el los elementos deseados, siempre teniendo en cuenta las restricciones de elementos que no podemos utilizar.

Editor Cubos Inteligentes

Observad como hemos incluido en el informe un filtro estatico seleccionando la información de los años 2007 y 2008. En la cuadricula hemos seleccionado varios atributos de diferentes dimensiones y los indicadores: importe neto, unidades, margen total e importe de descuentos.

Una vez el cubo es correcto, lo guardamos y tendriamos creada su definición. Pero el cubo todavía no sería accesible, pues no esta ni calculado ni publicados sus resultados.

Publicación.

La publicación de un cubo es tan sencilla como realizar la ejecución de su definición. Cuando se realiza la ejecución, esta no tiene como resultado ningún resultado visible (no se ve una cuadricula como en el caso de los informes). Simplemente, nos aparecerá un log indicandonos que la ejecución ha sido completada.

Podemos ver las características del cubo con la opción del menú contextual Mostar información del cubo. Nos aparecera una pantalla con información general de este:

Propiedades del cubo creado

Ahí podremos ver cuando se creo el cubo, cuando se realizo la ultima actualización de sus datos, el numero de registros obtenidos de la base de datos para llenarlo. Incluso podriamos visualizar la sentencia SQL utilizada para su creación.

select    a14.ano_id  ano_id, a14.mes_id  mes_id, max(a14.mes_desc)  mes_desc, a11.fecha_id  fecha_id,
 max(a14.fecha_desc)  fecha_desc, a13.region_id  region_id, a13.provincia_id  provincia_id, a12.linprod_id  linprod_id,
 max(a12.linprod_desc)  linprod_desc, a12.denom_id  denom_id, sum(a11.importe_neto)  WJXBFS1, sum(a11.unidades)  WJXBFS2,
 sum(a11.margen_total)  WJXBFS3, (sum(a11.Importe_dtos) + sum(a11.importe_promos))  WJXBFS4
from    dwh_ventas    a11
 join    dwd_producto    a12
 on     (a11.material_id = a12.material_id)
 join    dwd_cliente    a13
 on     (a11.cliente_id = a13.cliente_id)
 join    dwd_tiempo    a14
 on     (a11.fecha_id = a14.fecha_id)
where    a14.ano_id in (2007, 2008)
group by    a14.ano_id, a14.mes_id, a11.fecha_id, a13.region_id, a13.provincia_id, a12.linprod_id, a12.denom_id

El cubo esta calculado y ya podriamos crear informes sobre el. Tener en cuenta que sino planificamos o reejecutamos manualmente la actualización del cubo, este quedara como una foto de los datos en un momento puntual, totalmente desvinculada de las actualizaciones que se vayan realizando sobre el Data Warehouse.

Igualmente, tenemos la posibilidad de crear cubos inteligentes a partir de la definición de un informe. Es tan sencillo como, en la edición del informe, seleccionar la opción Datos –> Opciones de cubo inteligente –> Convertir a cubo inteligente. Siempre habrá que tener en mente las restricciones de los tipos de objetos que no podemos utilizar.

Creación de informes sobre cubos inteligentes.

Para crear un informe sobre un cubo inteligente, seleccionaremos el cubo sobre el que queremos trabajar,  y desde el menú contextual, seleccionaremos la opción Crear Informe. Nos aparecerá el editor de informes, tal y como habiamos visto anteriormente, aunque con muchas opciones restringidas. No podremos seleccionar objetos de los definidos en nuestro proyecto (ni objetos del esquema, ni objetos publicos, ni atributos o indicadores). Solo podremos utilizar elementos de los definidos en la construcción del cubo (es decir, atributos e indicadores y calculos sobre ellos).

Por ejemplo, a nivel de atributos, solo podremos seleccionar por Año, Mes, Dia, Provincia, Región, Linea de Producto o Denominación de Origen. A nivel de indicadores, podemos utilizar los indicados o bien campos calculados sobre ellos (del tipo formula, porcentaje sobre el total u orden). En este caso no nos deja utilizar las transformaciones (lo cual es lógico, pues seguramente el ambito temporal de esta podría estar fuera de los datos del cubo).

Tampoco podremos añadir filtros de la forma usual ni selecciones dinámicas para filtrar la información (aunque si selecciones dinámicas del tipo objeto para permitir que se puedan seleccionar en tiempo de ejecución que atributos o indicadores se muestran en el informe). Tampoco podremos utilizar consolidaciones ni grupos personalizados en los informes que conectan con cubos inteligentes. Solo podremos establecer restricciones con el uso de los filtros de visualización. Otra forma de establecer restricciones será a traves de los filtros de seguridad. Podemos establecer limitaciones en los valores de atributos con los que puede trabajar un usuario con este tipo de filtros, que van asociados a la definición de usuario o grupo(pensar el tipico ejemplo de responsables de delegación que solo tienen que tener acceso a visualizar los datos de su ambito geográfico). Son filtros ocultos.

Creacion de informe sobre el cubo inteligente

Podeis ver en la imagen que en los objetos del informe estan todos los utilizados en la definición del cubo. También podeís ver que hemos añadido una columna calculada del tipo % sobre el total. Igualmente hemos añadido un filtro de visualización para restringir los datos a los del año 2007 (podiamos haber restringido por cualquier otro atributo o indicador). El informe esta listo para ejecutar.

Ejecucion de informes sobre cubos inteligentes.

La ejecución de los informes se realiza de la forma habitual. En este caso, no tenemos ningun filtro ni selección dinámica asociada en la ejecución (solo la selecciones dinámicas de objetos, como ya indicamos). Ejecutamos el informe y tenemos el siguiente resultado:

Ejecucion informe sobre el cubo

La ejecución del informe ha leido la información existente en el cubo sin realizar ninguna acción sobre la base de datos y los resultados se han mostrado de forma inmediata. En los resultados del informe podremos trabajar con los elementos habituales, tales como totales, umbrales, ordenación avanzada, insertar campos calculados, formato, aplicar filtros sobre indicadores, filtros de visualización, paginación, etc.

A nivel de la navegación, en principio podremos navegar solamente por los atributos que incluimos en el cubo. Existe la posiblidad de permitir la navegación fuera del cubo (es un parametro que se configura a nivel de proyecto y que también se puede establecer a nivel de cubo). En este caso, al realizar la navegación puede darse el caso que nos «salgamos» del cubo y haya que realizar un recalculo fuera de el, accediendo a datos del DW.

Una vez definido el informe, se podrá cambiar a posteriori el cubo al que esta asociado, aunque con restricciones (el nuevo cubo tendrá que tener todos los elementos necesarios para que el informe se pueda asociar a el).

Actualización de cubos inteligentes. Programacion de actualizaciones.

La actualización de un cubo es tan sencilla como volver a realizar la ejecución de este. En este momento, conforme a la definición del cubo, se vuelve a leer la información de la base de datos y se refresca su contenido. Lo habitual sería que la actualización de los cubos estuviese automatizada para no depender de ningún usuario. Para ello, hemos de tener configuradas las planificaciones, de forma que podamos asignar a una de ellas la actualización del cubo.

Asistente de planificacion

En nuestro ejemplo, hemos creado una planificación que se ejecuta una vez al dia, a las 10 de la mañana. Y la repetición de la ejecución es recursiva. El siguiente paso será cargar la actualización del cubo en la planificación. Para ello, con el menu contextual sobre el cubo, en la opción Planificar entrega a –> Actualizar Cubo.

Subscripcion a la actualizacion del cubo

En la subscripción al cubo podemos indicar una fecha de caducidad, a partir de la cual el cubo ya no se volvera a actualizar. Igualmente, seleccionamos a que planificación asociamos el proceso. Esto determinara la frecuencia de ejecución del proceso. También podremos hacer que se realice inmediante dicha actualización, a parte de la planificación establecida.

Trabajando con elementos derivados en cubos inteligentes.

Los elementos derivados son una funcionalidad exclusiva de los informes construidos sobre cubos intelligentes y de los documentos del report services. Son grupos de elementos que definimos al vuelo interactuando con los resultados de un informe. Para entender mejor los conceptos, vamos a ver un ejemplo.

Informe sencillo sobre cubo

El informe nos nuestra el total de ventas por región. Interactuando sobre los datos del informe, podremos crear los elementos derivados al vuelo. En los informes que trabajan sobre los cubos inteligentes, aparecen varias opciones de menú contextual nuevas, que son Elementos derivados, Crear grupo y Crear calculo.Vamos a ver un ejemplo de cada uno de los tipos.

  • Grupos de elementos: lista de elementos, de los que tenemos en pantalla, que forman cada grupo. Podemos seleccionar en pantalla los atributos que queremos que formen un grupo y con la opción Crear Grupo creamos un grupo para ellos. Le asignamos un nombre, tal y como vemos en la imagen, y el grupo esta creado.

Creacion de grupo de elementos derivados

Repetimos el proceso para crear grupos para las diferentes Zonas Geográficas de España. Vamos seleccionando los diferentes valores de los grupos que queremos crear y hacemos la misma operativa. Tras crear todos los grupos, el informe quedará asi:

Informe con elementos derivado - grupo

Han ido despareciendo los valores individuales y se han sustituido por los nombres de los grupos. Todo de forma dinámica y sin recalcular nada, siempre trabajando en memoria. Podremos ver como ha quedado configurado el elemento derivado desde el editor, al que se accede desde el menú contextual.

Editor elementos derivados

Podemos observar como aparecen los diferentes grupos que hemos ido creando y la lista de valores de cada atributo que hemos incluido en cada uno de los grupos. Aparece un grupo predefinido, llamado Todo lo demas, que siempre aparecerá y sobre el que no podemos realizar ninguna acción (siempre tiene que existir). Si quisieramos realizar algun cambio en los grupos, modificar el orden, la forma de visualizar o como afectan a los subtotales, lo hariamos desde este lugar.

  • Elementos que cumplan una condición de filtro: filtrado de los elementos de cada grupo por criterios de filtrado. Sería similar al anterior. La definición de los grupos se realizaria desde el editor de Elementos derivados. Creariamos los grupos del tipo Filtro, y para cada grupo, estableceriamos las condiciones de filtrado que van a determinar los elementos que van a formar cada grupo.
  • Operaciones sobre elementos: calculos para combinar los valores de un atributo. Un calculo es una operación sobre varios elementos de atributo o sobre los grupos creados anteriormente. En nuestro ejemplo, ademas de los grupos definidos, vamos a crear dos nuevos grupos, del tipo cálculo, que restan, a los importes de un grupo, los valores de una región (en el grupo ZONA LEVANTE restamos los valores de la región VALENCIA y en los de la ZONA CENTRO restamos los valores de MADRID). El editor de elementos tendrá el siguiente aspecto:

Elementos derivados - calculo

En este tipo de elemento derivado, se nos abre el editor de expresiones. Nos aparecen los diferentes valores de atributo del nivel seleccionado que tengamos en el informe y los grupos que hayamos definido. Y podemos hacer operaciones sobre ellos (suma, resta o funciones). Luego, en el informe, se realizara el mismo cálculo a nivel de los indicadores en cada fila del informe. Los dos nuevos grupos que hemos añadido, los hemos configurado en la pestaña propiedad para que no se tengan en cuenta en los subtotales. Podeis observar como al grupo ZONA LEVANTE le hemos restado los valores de una región en concreto. El informe resultante despues de aplicar los elementos derivados de grupo y de calculo sería el siguiente:

Informe con elementos derivado - calculo

Podemos ver los dos nuevos grupos que aparecen, y como no son tenidos en cuenta en el total general. Para ver como se estan haciendo los cálculos, desglosamos el informe a nivel de provincia, y el informe resultante es el siguiente:

Informe con elementos derivado - calculo y desglose

Al desglosar la información, se mantiene en el nivel superior los grupos de elementos derivados. En el grupo donde a la zona de Levante restamos los datos de la region de Valencia, los valores de las provincias de dicha región presentan importes cero. Y el valor del elemento derivado de cálculo es la suma del resto de las provincias de las otras regiones.

Los elementos derivados se definen sobre cada atributo del informe y no se pueden combinar elementos de atributos diferentes (no puedo meter en los grupos de regiones operaciones o valores del atributo provincia, por ejemplo).

Conexión con otras bases de datos via MDX.

Microstrategy permite trabajar con cubos de otros sistemas que admitan MDX source tales como SAP BI, Hyperion Essbase y Microsoft Analysis Services. Por un lado, podemos realizar la integración de los cubos MDX en Microstrategy (importando los cubos, mapeandolos y realizando la creación de metricas a traves de los datos de el). Ademas, también podremos realizar reporting sobre ellos. No vamos a entrar en el análisis de esta funcionalidad.

Dynamic Sourcing

Como elemento destacable, el Dynamic Sourcing es una característica avanzada de la plataforma de Microstrategy que permite que los informes estandar accedan a los cubos inteligentes que puedan cubrir sus requerimientos de información (en lugar de hacerlo con la base de datos del DW). Con esta característica, se puede mejorar el rendimiento del sistema.

El Dynamic Sourcing esta deshabilitado por defecto y para habilitarlo se requiere configuración a nivel proyecto, cubos inteligentes, atributos, métricas e informes.

Conclusiones

Microstrategy cumple de sobra los requisitos de navegación dimensional y tipos de operaciones y elementos que podemos utilizar en el análisis dimensional. Muchos de los elementos OLAP han sido utilizados en las herramientas de reporting sin percatarnos de ello y viendolo como una funcionalidad mas de este. La funcionalidad de los cubos inteligentes es muy avanzada y presenta muchas ventajas, sobre todo en la rapidez de elaboración de los informes y en la facilidad para la creación y actualización de los cubos (aunque tiene algunas limitaciones respecto a los elementos que se pueden utilizar en ellos). El uso de la característica Dynamic Sourcing puede ser interesante para aumentar el rendimiento del sistema, aunque puede ser complicada su configuración y mantenimiento.

Finalmente, aunque esta funcionalidad no la hemos utilizado, puede ser interesante utilizar Microstrategy para atacar otras bases de datos a través de MDX.

Posted in Business Intelligence, Microstrategy | 2 Comments »

14.6.2. Reporting en Microstrategy 9 (II).

Posted by Roberto Espinosa en 7 febrero 2010


Inserción de calculos. Porcentajes sobre Total y Transformaciones.

Microstrategy nos permite incluir en el informe cálculos que se realizan sobre los valores de las columnas devueltas al ejecutar el análisis. Es decir, se realizan después de la consulta sobre la base de datos, en el momento en el que el motor análitico va a visualizar los resultados. Esto nos puede ser util para incluir nuestros propios calculos que no tienen porque tener un indicador asociado y definido en el metadata.

Veamos un ejemplo:

Partiendo del informe de ventas por Año, Trimestre y Target (segmento destino del producto), en el cual se visualizan el importe neto de ventas, las unidades, el margen y el numero de pedidos contabilizados en el sistema, queremos obtener el numero de unidades medidas por pedido y el importe medio de cada pedido. El informe original es el siguiente:

Ventas por Año, Trimestre y Target de Producto

Para añadir una columna calculada, seleccionaremos la opción Insertar –> Calculo. Nos aparecera el editor de indicadores donde podremos definir la formula de calculo de la nueva columna. En el editor nos aparecen unica y exclusivamente los indicadores del informe y los atributos (también los podremos utilizar en el calculo, por ejemplo, para obtener un recuento de sus valores).

Editor columnas calculadas

En nuestro ejemplo, añadimos tres nuevas columnas. Una de ellas, la Media de Unidades por Pedido fruto de la división del total de unidades y el numero de pedidos. La otra, la Media de Ingresos por Pedido, que se calcula dividiendo el Importe Neto por el número de pedidos. Finalmente, añadimos el calculo del Margen Porcentual, con el objetivo de ver como se comportan los totalizadores de las columnas calculadas (el indicador Margen% ya lo tenemos definido en nuestro catalogo de indicadores). El informe con los nuevos calculos sería el siguiente:

Ventas por Año, Trimestre y Target con columnas calculadas

Podemos ver como aparecen las nuevas columnas en el informe. A diferencia de los indicadores, los campos de totalización para estas columnas son calculados también en la sección de totales y subtotales. Por ejemplo, para la columna %MargenB, se va calculado su resultado en cada fila. A nivel de subtotal, no se suman las diferentes cantidades de cada linea, sino que se recalcula con los importes de los subtotales y totales de los campos implicados en el cálculo. Esto nos puede ser útil en determinados casos.

Ademas de los campos calculados, Microstrategy nos permite insertar otros campos con utilidad miscelanea, que pueden ser:

  • Porcentaje sobre total: para un indicador determinado, podemos añadir un nuevo indicador calculado donde aparezca el peso de su valor con respecto al total general o con respecto a los totales en un determinado nivel de desglose del informe. En nuestro ejemplo, podriamos haber incluido el Porcentaje sobre Total a nivel de Trimestre (en ese caso, para cada Target, nos dara el peso del Importe Neto sobre el total de cada Trimestre).
  • Transformaciones: podemos seleccionar cualquier indicador de los existentes en el informe y aplicarles una de las transformaciones que tengamos definidas, creando un nuevo indicador calculado. Por ejemplo, a la columna Importe Neto, le podriamos haber aplicado la transformación Año Anterior, y estamos creando un nuevo indicador que incluye los importes netos del año anterior al de analisis actual. Con esto, podemos realizar, como ya vimos, análisis de series temporales.
  • Orden: nos permite definir una columna donde aparece el número de orden de un valor respecto al total o respecto a los diferentes niveles de desglose del informe. El orden se puede referir a nivel ascendente (de menor o mayor) o descendente (de mayor a menor). En nuestro ejemplo, podriamos haber añadido una columna de Orden a nivel de Trimestre, para que nos indique el ranking de mayor a menor importe de ventas o de rentabilidad.

Como ejemplo, vamos a añadir algún campo calculado de este tipo a nuestro informe de ejemplo:

Informe con Indicadores % sobre Total y Orden

En nuestro informe ejemplo hemos añadido tres columnas mas:

  • Ranking Trim: el valor que aparece en esta columna nos indica el lugar que ocupa el importe de ventas de cada Target de Producto a nivel de cada Trimestre, con ordenación descendente.
  • %s/ Total: esta columna nos indica el porcentaje que representa el Importe Neto sobre el total general del informe.
  • %s/ Total Trim: esta columna nos indica el porcentaje que representa el Importe Neto sobre el total general de cada Trimestre.

Vemos que estos campos calculados nos pueden ser utiles para añadir información estadística y ordenaciones que hagan mas claros y faciles de analizar los resultados.

Formatos de exportación de Informes: PDF, Excel, HTML, Word, Access, Texto. Envio por Email.

Una vez tenemos calculado un informe, podremos exportar sus resultados en diferentes formatos. Esto nos va a permitir, por ejemplo, pasar la información a terceras personas y en el formato preciso según el tipo de acción que se tenga que realizar sobre los datos. Para realizar la exportación, desde el menú Datos –> Exportar A, y a continuación seleccionaremos el tipo de formato de exportación.

Por ejemplo, podremos crear un documento estático del tipo PDF o HTML que contenga los resultados. Tambien podremos sacar los datos a un fichero de texto o a documentos modificables en formato Excel, Word, Access. Se pueden configurar parametros de la exportación (como si se abrirá la aplicación correspondiente despues de la exportación, si queremos guardarlo en un determinado archivo y carpeta, si queremos ejecutar macros en el documento antes o despues de la exportación, etc).

Exportacion a Excel de los resultados de un informe

Microstrategy tiene una gran integración con la suite Office y las exportaciones estan bastante conseguidas. Por ejemplo, al exportar el mismo resultado de informe del ejemplo a Word, me aparece un texto con las características de ejecución del informe y a continuación una tabla de Word con los resultados del informe (el crosstab del informe replicado en la tabla). Observad en el ejemplo como se han pasado todos los atributos del informe a Excel, incluyendo los formatos y umbrales.

Igualmente, Microstrategy nos permite enviar los resultados de un informe por Correo Electrónico, utilizando uno de los formatos indicados anteriormente. Se genera un correo electrónico que llevará anexo el correspondiente documento en el formato seleccionado (se requiere tener instalado el programa Outlook para que funcione correctamente).

Ejecución de Informes desde aplicaciones Office.

Microstrategy 9 incluye el componente Office que instala un complemento dentro la suite Microsoft Office. Este complemento nos permite interactuar directamente desde Word, Excel, Powerpoint, Access o incluso Outlook.El complemento se conecta a nuestro proyecto y nos muestra los diferentes informes a los que tenemos acceso.

Ejecucion de Informes desde Excel

Una vez seleccionado el informe que queremos ejecutar, apareceran los correspondientes filtros o selecciones dinámicas que lleve asociado el informe y se nos mostraran los resultados, una vez ejecutado el informe, dentro de la aplicación Office desde la que estemos trabajando. Desde Excel, podremos repetir la ejecución del informe con los mismos criterios de selección o repetir la selección para obtener otros rangos de información, todo de una forma integrada y automática.

En nuestra prueba hemos ejecutado un informe de Ventas por Año, Trimestre y Target desde Excel, y todos los formatos, colores, Umbrales, etc. se han mantenido y se han pasado exactamente igual en la hoja de calculo que se nos ha creado automáticamente.

Navegación en los informes. Opciones de navegación. Configuracion.

Aunque la navegación es una característica de los cubos OLAP, vamos a verla por encima pues es una característica muy util en el reporting, que nos va a permitir ir profundizando en el análisis de los datos que se obtienen en la ejecución de un informe o cambiar el ambito de análisis en tiempo de ejecución (cambiando la dimensión por la que estemos analizando la información).

La navegación se puede configurar a nivel de informe, de forma que podemos tener informes que sean estáticos y donde no este permitida la navegación (nos puede interesar por el perfil de usuario que lo utilice) o informes en donde se puede navegar, pero solo a nivel descendente. En la imagen, vemos algunas de las opciones de navegación.

Opciones de navegación en un informe

También se pueden configurar otros aspectos, como el mantener en la cuadricula el atributo padre desde el que estamos navegando, si mantenemos los umbrales y subtotales, etc. La navegación se puede realizar sobre todos los elementos de un atributo o sobre valores seleccionados. Para entender esto, vamos a ver un ejemplo. Tenemos un informe sencillo, donde se analizan las ventas por Año y Trimestre (tal y como vemos en la imagen).

Analisis Ventas por Año y Trimestre

Podriamos profundizar mas en los datos de dos maneras:

  • Total: seleccionamos en la cabecera del atributo que queremos desglosar (por ejemplo, el Trimestre Año), y con el botón derecho, desde el menú contextual seleccionamos Navegación –> Abajo –> Mes Año. El informe se recalculara y se mostrara toda la información desglosada al nuevo nivel.
  • Según valores seleccionados: seleccionamos uno o varios trimestres (pulsando Control), y de la misma manera con el menú contextual, procederemos a la navegación. En este caso, solo estaremos desglosando al nivel inferior los trimestres seleccionados.

Analisis año-trimestre con navegacion

En la imagen podeis ver como hemos desglosado por mes el primer y segundo trimestre de 2007. Igualmente, podeis ver el aspecto del menú contextual que nos permite realizar la navegación. La opción Arriba y Abajo nos permite subir y bajar en la jerarquía actual. Con la opción Otras direcciones, podriamos cambiarnos de jerarquía y pasar a analizar los datos y a desglosarlos por otro atributo.

Movilidad en los componentes de un informe. Filas, columnas, indicadores.

La herramienta de reporting nos permite en tiempo de ejecución modificar el aspecto del informe, pudiendo intercambiar filas y columnas, cambiar el orden de los elementos en la visualización, ocultar un indicador (aunque sigue estando asociado al informe). Tambien podremos llevar una fila a columnas o viceversa o seleccionar un determinado atributo y llevarlo a la ventana de paginación (momento en el que pasara a formar parte del filtro de paginación). Veamos un ejemplo sencillo de un informe de analisis de ventas por Linea de Producto y Mes (en la filas estan las lineas de producto y en las columnas los meses):

Ventas por Linea de Producto y Mes

En este informe queremos transponer las filas con las columnas. Sera tan facil como seleccionar la opción Mover –> Intercambiar filas y columnas, y el aspecto del informe pasará a ser el siguiente:

Ventas por Mes y Linea de Producto

En el caso de haber tenido mas indicadores, podriamos haber cambiado su posición simplemente seleccionandolos y arrastrandolos a la nueva ubicación. De la misma manera, en el caso de tener varios atributos en el mismo eje (por ejemplo Trimestre, Linea Producto), podriamos haberlos arrastrado cambiando su orden, orden que determinara la forma en que se hace el desglose de la información.

Limites a nivel de informe. Filtros de visualización.

Ademas de los filtros que vimos anteriormente que se pueden establecer a nivel del informe mediante los filtros y selecciones dinámicas, y también mediante el filtrado de valores de un indicador (que también vimos), Microstrategy nos permite dos filtrados adicionales de la información:

  • Limites a nivel de informe: en las opciones de datos del informe, podemos indicar criterios adicionales de filtrado que produciran como resultado que no se visualicen los valores que no cumplan las condiciones. Por ejemplo, si en un informe de ventas indicamos la condición de la imagen (Importe Neto Mayor o Igual que 100), no se mostrara, cuando ejecutemos el informe, ninguna linea que no cumpla dicha condición. Pero una cosa importante, los valores filtrados si apareceran reflejados en totales y subtotales del informe. Es una forma útil de quitar información no relevante, aunque si siga considerandose para los analisis de importes totales.

  • Filtro de visualización: este filtro se define en la sección del informe correspondiente y nos permite ir estableciendo filtros de visualización en caliente sobre los datos mostrados en pantalla. Conforme se van cambiando los filtros y aplicandose, dinamicamente cambian los valores visualizados, y también los importes de totales y subtotales. Puede ser util para trabajar dinamicamente sobre los datos y para ir mostrando diferentes escenarios de datos según se omite o no determinada información.

Filtro visualizacion

Cache de Informes.

Es una característica avanzada de Microstrategy, que permite que los informes que se ejecutan con mas frecuencia y en los que no cambian los criterios de ejecución, sean guardados en cache y recuperados en el momento en el que alguien vuelva a realizar la misma consulta. En este tipo de ejecución, cuando lanzamos un informe no se accede a la base de datos, sino que leemos los resultados del informe que quedaron guardados en un area de trabajo especial. Con esto, optimizamos los recursos del sistema y mejoramos los tiempos de respuesta y el rendimiento general del sistema. Puede tener algún inconveniente, como que los datos que se nos muestren no esten actualizados con los datos mas recientes, aunque todo esto es configurable.

Para saber si un informe se ha ejecutado recuperando o no la cache, en la sección Detalles de Informe aparecera si se ha recurrido a ella o no. En cualquier momento se puede limpiar la cache de un informe antes de volverlo a ejecutar, y así asegurarnos que se realizará el recálculo completo.

Las opciones de cache se establecen a nivel de proyecto (a nivel general), tal y como vemos en la imagen.

Configuración de cache a nivel de proyecto

A nivel de informe, se pueden establecer opciones de cache personalizadas, que solo afectarán al informe en cuestion. Incluso se puede inhabilitar la cache para un informe en concreto y darle una caducidad.

Cache a nivel de informe

Las caches se pueden limpiar de forma global en cualquier momento para que todo se recalcule.

Creación de informes al vuelo.

Ademas de construir informes desde cero utilizando el editor de informes o el correspondiente asistente, tenemos otra forma de construir informes al vuelo. Partiendo de la ejecución de cualquier informe, nos podemos pasar al modo Diseño, y realizar los cambios que estimemos oportunos (añadir indicadores, modificar atributos, quitar o poner filas y columnas, cambios en  los formatos, umbrales, filtros, etc).

Una vez realizados todos los cambios, podremos guardar el informe con un nombre diferente y habremos creado de forma interactivo un nuevo informe. Esta característica nos permite reutilizar componentes ya definidos y personalizarlos según las diferentes necesidades que vayamos teniendo. Por eso, puede ser util cuando queramos construir un nuevo informe, buscar uno ya existente que tenga elementos en comun y sobre el realizar las modificaciones para dar lugar al nuevo informe.

Creación de grupos personalizados.

Los grupos personalizados son agrupaciones heterogeneas de atributos que nos permiten ver los resultados de los informes desde otro punto de vista. Es una característica avanzada de Microstrategy que yo no he visto en otras herramientas y que puede ser muy util para analizar la información por criterios que no estan registrados en el modelo de datos.

Antes de continuar, os recomiendo visualizar el video elaborado por Microstrategy que habla de la forma de crear los grupos personalizados (ver aquí ).

Para nuestro ejemplo, hemos creado un Grupo Personalizado que incluye varios grupos de atributos. El objetivo es realizar una clasificación de las regiones por Zonas. Por ejemplo, la zona Levante incluye la región de Valencia, Murcia y Cataluña. La region Sur incluye Andalucia, Extremadura, Ceuta y Melilla. Y así con el resto de las regiones. La definición del grupo personalizado sería la siguiente:

Creación de grupo personalizado Zonas Geográficas

Una vez definido un grupo personalizado, lo podemos utilizar en la creación de un informe como si fuera un atributo mas de una dimensión. En nuestro ejemplo, hemos definido un informe utilizando el Grupo personalizado en las filas y en las columnas los indicadores Importe Neto, Precio Neto y Unidades. El resultado de la ejecución del informe sería el siguiente:

Informe con grupo personalizado

Podemos ver como se ha realizado la clasificación de la información y como aparece desglosado todo según la jerarquía definida al crear el grupo personalizado. Cuando se define el grupo personalizado, se puede predefinir como queremos que se vea la representación jerarquica, los subtotales, si el elemento padre aparecera en la parte superior o inferior de los hijos, etc.

Ademas del grupo personalizado indicando valores de atributos, podemos crear grupos personalizados que califican sobre valores (por ejemplo los 10 primeros clientes por importe, los 20 primeros clientes por rentabilidad, los clientes que representan el 40% de las unidades vendidas). Para este caso, la definición del grupo personalizado sería la siguiente:

Grupo Personalizado calificando Indicadores

Observad como se pueden añadir tantos subgrupos dentro de un grupo personalizado como se deseen. En este caso, hemos añadido 3. Cada uno califica sobre un indicador diferente y con un criterio de agrupación diferente (Clasificación, Porcentaje). El grupo personalizado lo hemos incluido en un informe, y el resultado de la ejecución sería el siguiente:

Informe con grupo Personalizado sobre indicadores

Hemos podido ver con estos dos ejemplos las amplias posibilidades que nos proporciona esta funcionalidad de Microstrategy. Podremos crear nuestro propios grupos e incluirlos en el mismo informe, incluso aunque no esten relacionados de una forma homogenea.

Graficos. Combinación tabla cruzada-gráfico.

Ademas de los informes en forma de crosstab o tabla cruzada que hemos visto hasta ahora, Microstrategy también nos permite incluir gráficos para la visualización de los resultados. Disponemos de un amplio abanico de posibilidades en lo que respecta a los gráficos: desde gráficos de área, de barras, de lineas, circular o de tarta, dispersión, polar, radial, burbuja, marcadores, diagramas de gant, gráficos combinados o gráficos personalizados.

Tipos de grafico en Microstrategy

A la hora de utilizar los gráficos, tendremos que tener los datos apropiados en la tabla cruzada para que su visualización en un gráfico tenga sentido (si tenemos 5 indicadores y la información desglosada por muchos atributos, no valdrá de nada construir un gráfico).

Ejemplo grafico de barras

Ademas, Microstrategy nos permite combinar en un mismo informe la tabla cruzada y su correspondiente informe. Por ejemplo, para el ejemplo que hemos visto, podriamos tener las ventas por mes y región-provincia. Conforme vayamos cambiando en la paginación la región, los valores en la tabla cruzada se irían actualizando, asi como los valores reflejados en el gráfico.

Ejemplo Tabla Cruzada con gráfico

Con los gráficos podremos complementar nuestro informes y darles un significado gráficos. También seran utiles para esquematizar información en los cuadros de mando. Cada tipo de informe tiene unos requisitos de atributos e indicadores (en la documentación hay una tabla donde se enumera cada gráfico y los requisitos mínimos para darle sentido).

Informes con selección de atributos y ratios en tiempo de ejecución.

Para terminar con el detalle de los elementos que podemos utilizar en nuestro sistema de reporting, vamos a ver la combinación de selecciones dinámicos que nos permiten seleccionar los atributos o indicadores de un informe, incluidos dentro de un crosstab. De esta forma, al ejecutar el informe, se ejecutaran también las selecciones, y estaremos construyendo, en tiempo de ejecución, lo que queremos que incluya nuestro informe.

En primer lugar, realizaremos la definición de las selecciones dinámicas. Definiremos esta como del tipo «Selección Dinámica de Objeto«, y crearemos una para los atributos, y otra para los indicadores (tal y como vemos en la imagen).

Seleccion dinamica de indicadores

A continuación, construiremos un informe. La seleccion dinámica de atributos la pondremos en las filas en nuestro ejemplo (como si fuera un atributo), y la selección dinámica de indicadores en las columnas(como si fuera un indicador). Al ejecutar el informe, nos aparecerá algo asi:

Selecciones de atributos e indicadores al ejecutar

Vemos como el informe nos muestra la lista de atributos e indicadores que hemos preconfigurado, y podremos elegir entre ellos para llevarlos al informe al lugar correspondiente donde se incluyeron en el diseño. Con la selecciónes realizadas, mas el filtrado propio de cada informe, estaremos dejando al criterio del usuario que información quiere ver en cada momento. Esto nos puede ser util para reducir el número de informes disponible o para que el mismo informe se utilice para funciones diferentes según nuestras necesidades.

Otros elementos

  • Generación informes a partir de sentencias SQL personalizadas: podremos desde una sentecia SQL construida por nosotros, crear un informe. El el momento de crear un informe, seleccionamos el origen ODBC con el que vamos a trabajar. Utilizando el generador de consultas, podremos ir llevando las tablas que haya definidas en la base de datos seleccionada, al espacio de trabajo. De ahí, podremos ir seleccionando los campos, construyendo expresiones sobre ellos e indicando condiciones (como vemos en la imagen siguiente). Al grabar, volvemos al editor de informes con la información necesaria recuperada de la query. Con este procedimiento podremos construir informes sobre cualquier origen de datos y preparar consultas puntuales y no predefinidas sobre la información (podeis ver un video tutorial del proceso completo de creación de este tipo de informes aquí ).

Generador consultas SQL para construir informes

  • Mapas de navegación: nos permiten establecer los patrones de como será la navegación en los informes. Es decir, podremos indicadar que atributos estarán disponibles para la navegación hacia arriba, hacia abajo o hacia otra dimensión. Sino se crea ningún mapa de navegación, se utiliza el de proyecto que incluye todas las jerarquias de usuario. Si deseamos personalizarlo, podemos hacerlo a nivel de proyecto (general para todos elementos), o bien a nivel de atributos, jerarquias o consolidaciones. Cuando el objeto se utilice en un informe, se reemplazara el mapa de navegación general por el propio. También se pueden asociar mapas de navegación a un informe o una plantilla. En la imagen posterior, podeis ver un ejemplo de mapa de navegación, que asociariamos al atributo mes (en el estamos restringiendo la navegación hacia arriba a solo los atributos Año, Semestre y Trimestre, y a nivel inferior a Fecha, no permitiendo navegación transversal).

Editor de Mapas de navegacion

  • Creación de plantillas de informes: cualquiera de los informes que hemos creado, lo podremos encapsular en forma de plantilla. Esta plantilla se podrán reutilizar luego en el diseño de otros informes.
  • Consolidaciones: es un concepto similar al de los grupos personalizados. Las consolidaciones nos permiten crear atributos «ficticios», que pueden ser agrupaciones de estos y para los que luego realizaremos operaciones aritmeticas. Las consolidaciones son mas eficientes a nivel de SQL y los calculos se realizan a nivel del Motor análitico (en lugar de en la consulta al DW, como es el caso de los grupos personalizados). En el ejemplo podeis ver el editor de consolidaciones. En los tres primeros grupos, hemos indicado los valores de las lineas de producto que queremos incluir en ellos, solo de un determinado atributo. En el ultimo grupo, Cavas Rueda, hemos indicado dos condiciones sobre atributos diferentes, la linea de Producto CAVAS y la denominación de origen RUEDA (Cavas fabricados en la denominación de origen Rueda). Las consolidaciones se utilizan luego en el editor de informes como si fueran un atributo.

Editor de consolidaciones

  • Filtrado utilizando resultados de otro informe.
  • Vinculos entre informes y documentos: llamada desde un informe a otro en un lugar determinado con paso de parametros de contexto.
  • Creación de Datamarts: resultados de informes guardados en base de datos.
  • Etc, etc.

Conclusiones.

Hemos intentado pasar con bastante detalle por todas las funcionalidades de reporting que nos proporciona Microstregy. Partiendo de los objetos de esquema que habiamos preconfigurado (atributos, indicadores, filtros, selecciones dinámicas) y los elementos que podemos utilizar para reporting como las tablas cruzadas, gráficos, grupos personalizados y consolidaciones, columnas calculadas, formatos, umbrales, totales y subtotales, etc, podremos seguramente cubrir todas las necesidades de reporting de cualquier organización. También seguramente habra funcionalidades complejas que nunca utilizaremos, pero que estan ahí disponibles.

El feeling con la herramienta es bueno, aunque la primera impresión es que técnicamente puede ser compleja la comprensión y utilización de todos los elementos que ofrece (sobre todo el tema de los niveles de cálculo de los indicadores), y para hacer determinadas cosas seguramente no bastará con un usuario de tipo medio, sino mas bien avanzado.

Por otro lado, conociendo otras herramientas de reporting, creo que Microstrategy es bastante completo y nos deja muchas puertas abiertas para personalizar los informes y para hacer cosas que no son estandar (como por ejemplo, lo de los grupos personalizados y las consolidaciones, o los indicadores de nivel) o el tema de las transformaciones para la series temporales.

Tras la revisión de la herramienta de reporting, hemos profundizado en su conocimiento y ademas hemos construido un set de ejemplos de informes que incluyen la mayoria de elementos disponibles y que nos permitiran preparar todo el lote de informes para reporting dentro de nuestro proyecto. En los ejemplos explicados no lo hemos visto, pero los filtros y selecciones dinamicas tienen muchisimas funcionalidades que nos van a permitir definir todo tipo de filtrados de todas las formas que necesitemos, como podriamos hacer en cualquier lenguaje de programación, y ademas con funciones avanzadas, para, por ejemplo, el tratamiento de fechas (nos permite definir patrones para crear, a partir de la fecha actual, periodos predefinidos, como el mes anterior hasta la misma fecha, desde principio de año hasta la fecha actual, el primer lunes del año y todas las variantes que podamos imaginar).

En la proxima entrada del blog veremos las funcionalidades OLAP que proporciona Microstrategy y como nos permite trabajar con los cubos inteligentes y origenes de datos MDX.

Posted in Business Intelligence, Microstrategy | 1 Comment »