https://docs.google.com/document/d/1Fn9TizXlqs2kdS6sIgjwUZ3aKSTMwX8ELNDvHD5-6Wc/edit?usp=sharing

INSTITUTO TECNOLÓGICO DE CHILPANCINGO

INGENIERÍA EN INFORMÁTICA

INTELIGENCIA DE NEGOCIOS

ACTIVIDAD UNO

EQUIPO:

ABRAHAM MANRIQUE REYES

ANACECI GARCÍA TOLENTINO

Cuestionario primera parte

1. ¿Qué es la inteligencia de negocios?

R= Proceso de integración y tratamiento de los datos y convertirlos en toma de decisiones para la directiva.

2. ¿En que apoya a los estudiantes estudiar la asignatura de Inteligencia de Negocios?

R= Capacidad de entender desde la extracción de los datos de sistemas existentes hasta la explotación de la información por herramientas de análisis de datos. Aporta conocimiento en bases de datos que posee una empresa a través de herramientas de minería de datos y data warehouse con el fin de explotarlo y que sirva como soporte para la toma de decisiones.

3. ¿Qué aporta al perfil profesional del ingeniero en Informática esta asignatura?

R= Aporta la capacidad para diseñar e implementar estrategias en la inteligencia de negocios, basadas en información, contribuyendo con investigación, análisis y propuestas de solución a una eficiente gestión de cualquier tipo de organización tanto a nivel nacional como internacional, orientado al Marketing Estratégico y/o Negocios Internacionales, de acuerdo a sus intereses o inclinaciones profesionales.

Cuestionario Segunda Parte (Video)

1. ¿Qué es el Business intelligence?

R= Combinación de tecnologías de almacenamiento de datos y análisis de información que implementan soluciones orientadas al usuario final para apoyar la toma de decisiones, para evaluar indicadores estratégicos, tácticos u operativos que se encuentran disponibles dentro de la organización.

2. ¿Cuáles son los cuestionamientos se realizan las personas de las organizaciones?

R= se preguntan el ¿Cómo estoy? Y ¿Por qué estoy así? ¿Estrategias dinámicas para la información o las relaciones ocultas dentro de la información?

3. ¿Cuáles son las situaciones cotidianas en las organizaciones?

R= Necesidad del análisis de la información, la estadística, las predicciones, las proyecciones, los análisis en tiempo real. A través de RP’s, sistemas contables, nóminas o financieros.

4. ¿Por qué Business intelligence?

· R=

· Ayuda a tener modelos y estrategias para compartir a la organización, suministrar datos que no pueden ser explicados por el modelo mental.

· Se toman como herramientas de navegación contando con un conjunto de KPI’s y así publicar la realidad de la información tomando en cuenta estos indicadores y analizar resultados para orientar mejoras.

· Ya después de esto, tomar decisiones rápidamente y convertir los datos en información, y utilizar un método razonable para la gestión empresarial. Con el cumplimiento del Ciclo de BI (Análisis, Ideas, Acción, Medición).

· Combinar información, tomar en cuenta la información de otros sistemas, pues ya haciendo esto se crea un conjunto de KPI’s de diferentes sistemas y muestra a través de panoramas o escenarios de información.

· Ofrecer apoyo efectivo al análisis multidimensional, es decir análisis a la velocidad del pensamiento, intuitivos.

· Construcción de datos fáciles de analizar, orientados temáticamente, por tal motivo analistas y consumidores de la información, les facilita el entendimiento de la información.

· Funcionalidad: responder preguntas en tiempo real, formateo de información (pivoteo), cualquier persona puede analizar modelos de negocio con una mínima información.

5. ¿Por qué debe considerarse el Business intelligence con poder de solución?

R= Permite explorar los datos de la misma forma en como lo pensamos, identificando y entendiendo tendencias, patrones y detalles como técnicas de análisis de los datos.

6. ¿Qué es el sistema de información ejecutiva?

R= Permite interactuar al usuario de manera intuitiva y comunicar el comportamiento de los indicadores de desempeño en lo particular o en la salud corporativa en general (escenario de información).

7. ¿Qué es el sistema de soporte de decisiones?

R= Es una técnica de análisis de uno o más variables de negocio para apoyar a la toma de decisiones con una mayor efectividad a través de modelos, planificación y ejecución y monitoreo de los mismos.

8.- ¿Cuáles son las cuatro características que conforman a los Sistemas de Soporte de Decisiones?

R= Incorporar datos y modelos, asistencia en los procesos de decisión, apoyo en la toma de decisiones y el objetivo es mejorar la efectividad de las decisiones y no la eficiencia con la que esas decisiones son tomadas.

REFLEXIÓN.

En la actualidadse han inventado y/o creado técnicas del análisis de la toma de decisiones cuando se hanbla de la información es por que tiene una gran válidez y está a la par con los recursos financieros, humanos y materiales.

Inteligencia de negocios.

Arquitectura para mejorar loas organizaciones ayudando a los empleados en los puntos estratégicos, tácticos y operativos para la toma de decisiones y ¿cómo?

-- Información correcta.

-- Tiempo oportuno.

-- Personas correctas.

Sistemas fuentes: sistemas transaccionales diseñados para el soporte de las operaciones del negocio como: compras, ventas, almácenes, etc.

OLTP (On Line Transactional Process).

Estos datos permitirán generar información para la toma de decisiones a nivel operacional.

Plan estratégoco:

Se recomienda definir éste plan en la organización si no se encuentra, se busan objetivos, estrategias, indicadores y ya en los más remotos casos, se recomienda reestructurar la base de datos y las aplicaciones para satisfacer el plan estratégico.

ETL (Extraer, transformar y cargar)

>>>Integrar datos cuando se lleguen a tener distintas fuentes, es decir, diferentes manejadores de base de datos.

>>> Llevar información de la Base de datos operacionales a la base de datos dimensionales.

DWH.

Es un almacén de datos para analizar la información es la base de datos esttratégica o multidimensional.

DataMars.

Forma parte de Datawarehouse. Si un Data marts es formado por un DWH, es decir puede estar preparado por un DWH o independientemente.

OLAP.

Tecnología para aprovechar la estructura de el DataMars, DWH. Tecnología que permitirá analizar información dinámicamente a los niveles tácticos y estratégicos basados en cubos que contienen las medidas y las dimensiones.

Minería de datos.

A base de algoritmos avanzados descubre cosas ocultas y apunta al nivel estratégico.

Aplicación para soporte de decisiones.

Creadas para cubrir decisiones, táctivas y estratégicas.

Sistemas de Información. para ejecutivos.

Fueron diseñados para dirigir y están basados en alertas y éste indicador se le llama KPI (Key Performance Indicator) y se obtienen a partir de un Balance Scorecard.

----------------------------------------------------------------------------------------------------------------------------

ACTIVIDAD DE APRENDIZAJE CIERRE DE CAPÍTULO
DATA WAREHOUSE

Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar y depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de perspectivas y con grandes velocidades de respuesta. La creación de un Datawarehouse representa en la mayoría de las ocasiones el primer paso, desde el punto de vista técnico, para implantar una solución completa y fiable de Business Intelligence.

La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se almacena la información (modelos de tablas en estrella, en copo de nieve, cubos relacionales, etc.). Este tipo de persistencia de la información es homogénea y fiable, y permite la consulta y el tratamiento jerarquizado de la misma (siempre en un entorno diferente a los sistemas operacionales).

El término Datawarehouse fue acuñado por primera vez por Bill Inmon, y se traduce literalmente como almacén de datos. No obstante, y como cabe suponer, es mucho más que eso. Según definió el propio Bill Inmon, un Datawarehouse se caracteriza por ser:

Integrado: los datos almacenados en el Datawarehouse deben integrarse en una estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. La información suele estructurarse también en distintos niveles de detalle para adecuarse a las distintas necesidades de los usuarios.

Temático: sólo los datos necesarios para el proceso de generación del conocimiento del negocio se integran desde el entorno operacional. Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser consolidados en una única tabla del Datawarehouse. De esta forma, las peticiones de información sobre clientes serán más fáciles de responder dado que toda la información reside en el mismo lugar.

Histórico: el tiempo es parte implícita de la información contenida en un Datawarehouse. En los sistemas operacionales, los datos siempre reflejan el estado de la actividad del negocio en el momento presente. Por el contrario, la información almacenada en el Datawarehouse sirve, entre otras cosas, para realizar análisis de tendencias. Por lo tanto, el Datawarehouse se carga con los distintos valores que toma una variable en el tiempo para permitir comparaciones.

No volátil: el almacén de información de un Datawarehouse existe para ser leído, pero no modificado. La información es por tanto permanente, significando la actualización del Datawarehouse la incorporación de los últimos valores que tomaron las distintas variables contenidas en él sin ningún tipo de acción sobre lo que ya existía.

Otra característica del Datawarehouse es que contiene metadatos, es decir, datos sobre los datos. Los metadatos permiten saber la procedencia de la información, su periodicidad de refresco, su fiabilidad, forma de cálculo... etc.

Los metadatos serán los que permiten simplificar y automatizar la obtención de la información desde los sistemas operacionales a los sistemas informacionales.

Los objetivos que deben cumplir los metadatos, según el colectivo al que va dirigido, son:

Dar soporte al usuario final, ayudándole a acceder al Datawarehouse con su propio lenguaje de negocio, indicando qué información hay y qué significado tiene. Ayudar a construir consultas, informes y análisis, mediante herramientas de Business Intelligence como DSS, EIS o CMI.

Dar soporte a los responsables técnicos del Datawarehouse en aspectos de auditoría, gestión de la información histórica, administración del Datawarehouse, elaboración de programas de extracción de la información, especificación de las interfaces para la realimentación a los sistemas operacionales de los resultados obtenidos... etc.

Por último, destacar que para comprender íntegramente el concepto de datawarehouse, es importante entender cual es el proceso de construcción del mismo, denominado ETL (Extracción, Transformación y Carga), a partir de los sistemas operaciones de una compañía:

Extracción: obtención de información de las distintas fuentes tanto internas como externas.

Transformación: filtrado, limpieza, depuración, homogeneización y agrupación de la información.

Carga: organización y actualización de los datos y los metadatos en la base de datos.

Una de las claves del éxito en la construcción de un datawarehouse es el desarrollo de forma gradual, seleccionando a un departamento usuario como piloto y expandiendo progresivamente el almacén de datos a los demás usuarios. Por ello es importante elegir este usuario inicial o piloto, siendo importante que sea un departamento con pocos usuarios, en el que la necesidad de este tipo de sistemas es muy alta y se puedan obtener y medir resultados a corto plazo.

Principales aportaciones de un datawarehouse

Proporciona una herramienta para la toma de decisiones en cualquier área funcional, basándose en información integrada y global del negocio.

Facilita la aplicación de técnicas estadísticas de análisis y modelización para encontrar relaciones ocultas entre los datos del almacén; obteniendo un valor añadido para el negocio de dicha información.

Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios.

Simplifica dentro de la empresa la implantación de sistemas de gestión integral de la relación con el cliente.

Supone una optimización tecnológica y económica en entornos de Centro de Información, estadística o de generación de informes con retornos de la inversión espectaculares.

Si no está familiarizado con el concepto de Datawarehouse, puede resultarle útil, además, examinar las siguientes definiciones:

Datamart

Datamining

Cuadro de Mando Integral

Sistemas de Soporte a la Decisión (DSS)

Sistemas de Información Ejecutiva (EIS).

MINERÍA DE DATOS

La minería de datos es el proceso de detectar la información accióna de grandes conjuntos de datos. Utiliza el análisis matemático para deducir los patrones y tendencias que existen en los datos. Normalmente, estos patrones no se pueden detectar mediante la exploración tradicional de los datos porque las relaciones son demasiado complejas o porque hay demasiado datos.

Estos patrones y tendencias se pueden recopilar y definir como un modelo de minería de datos. Los modelos de minería de datos se pueden aplicar en escenarios como los siguientes:

· Previsión: calcular las ventas y predecir las cargas de servidor o el tiempo de inactividad del servidor.

· Riesgo y probabilidad: elegir los mejores clientes para la distribución de correo directo, determinar el punto de equilibrio probable para los escenarios de riesgo, y asigna probabilidades a diagnósticos u otros resultados.

· Recomendaciones: determinar los productos que se pueden vender juntos y generar recomendaciones.

· Buscar secuencias: analizar los artículos que los clientes han introducido en el carrito de compra y predecir los posibles eventos.

· Agrupación: separar los clientes o los eventos en clústeres de elementos relacionados, y analizar y predecir afinidades.

La generación de un modelo de minería de datos forma parte de un proceso mayor que incluye desde la formulación de preguntas acerca de los datos y la creación de un modelo para responderlas, hasta la implementación del modelo en un entorno de trabajo.Este proceso se puede definir mediante los seis pasos básicos siguientes:

1. Definir el problema

2. Preparar los datos

3. Explorar los datos

4. Generar modelos

5. Explorar y validar los modelos

6. Implementar y actualizar los modelos

El siguiente diagrama describe las relaciones existentes entre cada paso del proceso y las tecnologías de Microsoft SQL Server que se pueden usar para completar cada paso.

Definir el problema

El primer paso del proceso de minería de datos, tal como se resalta en el siguiente diagrama, consiste en definir claramente el problema y considerar formas de usar los datos para proporcionar una respuesta para el mismo

métricas por las que se evaluará el modelo y definir los objetivos concretos del proyecto de minería de datos. Estas tareas se traducen en preguntas como las siguientes:

· ¿Qué está buscando?¿Qué tipos de relaciones intenta buscar?

· ¿Refleja el problema que está intentando resolver las directivas o procesos de la empresa?

· ¿Desea realizar predicciones a partir del modelo de minería de datos o solamente buscar asociaciones y patrones interesantes?

· ¿Qué resultado o atributo desea predecir?

· ¿Qué tipo de datos tiene y qué tipo de información hay en cada columna? En caso de que haya varias tablas, ¿cómo se relacionan?¿Necesita limpiar, agregar o procesar los datos antes de poder usarlos?

Preparar los datos

El segundo paso del proceso de minería de datos, como se indica en el siguiente diagrama, consiste en consolidar y limpiar los datos identificados en el paso Definir el problema.

Los datos pueden estar dispersos en la empresa y almacenados en formatos distintos; también pueden contener incoherencias como entradas que faltan o incorrectas. Por ejemplo, los datos pueden mostrar que un cliente adquirió un producto incluso antes que se ofreciera en el mercado o que el cliente compra regularmente en una tienda situada a 2.000 kilómetros de su casa.

Explorar los datos

El tercer paso del proceso de minería de datos, como se resalta en el siguiente diagrama, consiste en explorar los datos preparados.

Debe conocer los datos para tomar las decisiones adecuadas al crear los modelos de minería de datos. Entre las técnicas de exploración se incluyen calcular los valores mínimos y máximos, calcular la media y las desviaciones estándar, y examinar la distribución de los datos. Por ejemplo, al revisar el máximo, el mínimo y los valores de la media se podrían determinar que los datos no son representativos de los clientes o procesos de negocio, y que por consiguiente debe obtener más datos equilibrados o revisar las suposiciones que son la base de sus expectativas.

Generar modelos

El cuarto paso del proceso de minería de datos, como se resalta en el siguiente diagrama, consiste en generar el modelo o modelos de minería de datos Usará los conocimientos adquiridos en el paso Explorar los datos para definir y crear los modelos.

Deberá definir qué columnas de datos desea que se usen; para ello, creará una estructura de minería de datos. La estructura de minería de datos se vincula al origen de datos, pero en realidad no contiene ningún dato hasta que se procesa .Al procesar la estructura de minería de datos, Analysis Services genera agregados y otra información estadística que se puede usar para el análisis. Cualquier modelo de minería de datos que esté basado en la estructura puede utilizar esta información

Explorar y validar los modelos

El quinto paso del proceso de minería de datos, como se resalta en el siguiente diagrama, consiste en explorar los modelos de minería de datos que ha generado y comprobar su eficacia.

Antes de implementar un modelo en un entorno de producción, es aconsejable probar si funciona correctamente. Además, al generar un modelo, normalmente se crean varios con configuraciones diferentes y se prueban todos para ver cuál ofrece los resultados mejores para su problema y sus datos.

Implementar y actualizar los modelos

El último paso del proceso de minería de datos, como se resalta en el siguiente diagrama, consiste en implementar los modelos que funcionan mejor en un entorno de producción.

Una vez que los modelos de minería de datos se encuentran en el entorno de producción, puede llevar a cabo diferentes tareas, dependiendo de sus necesidades.

Estructuras de minería de datos (Analysis Services - Minería de datos)

La estructura de minería de datos define los datos a partir de los cuales se generan los modelos de minería de datos: especifica la vista de datos de origen, el número y el tipo de columnas, y una partición opcional en conjuntos de entrenamiento y de pruebas. Una misma estructura de minería de datos puede admitir varios modelos de minería de datos que comparten el mismo dominio. En el diagrama siguiente, se muestra la relación de la estructura de minería de datos con el origen de datos y con los modelos de minería de datos que la componen.

La estructura de minería de datos del diagrama está basada en un origen de datos que contiene varias tablas o vistas, combinadas en el campo CustomerID .Una tabla contiene información sobre los clientes, como la región geográfica, la edad, los ingresos y el sexo, mientras que la tabla anidada relacionada contiene varias filas de información adicional sobre cada cliente, como los productos que ha adquirido. En el diagrama, se muestra que se pueden generar varios modelos de minería de datos a partir de una misma estructura de minería de datos, y que los modelos pueden usar columnas de la estructura diferentes.

Modelo 1: usa CustomerID, Income, Age, Region y filtra los datos de Region.

Modelo 2: usa CustomerID, Income, Age, Region y filtra los datos de Age.

Modelo 3: usa CustomerID, Age, Gender y la tabla anidada, sin filtros.

APLICACIONES BI

Primera Aplicación BI

Segunda Aplicación BI

Tercera Aplicación BI

BIBLIOGRÁFICA

http://www.sinnexus.com/business_intelligence/datawarehouse.aspx

http://www.definicionabc.com/tecnologia/datawarehouse.php

http://www.stratebi.com/datawarehouse

http://www.definicionabc.com/tecnologia/datawarehouse.php

http://www.monografias.com/trabajos55/mineria-de-datos/mineria-de-datos2.shtml#metodol#ixzz3nfO48Qeu

_________________________________________________________________________________

UNIDAD II

HERRAMIENTAS PARA LA INTELIGENCIA DE NEGOCIOS

RapidMiner

Introducción.

RapidMiner es una herramienta de Minería de Datos ampliamente usada y probada a nivel internacional en aplicaciones empresariales, de gobierno y academia. Implementa más de 500 técnicas de pre-procesamiento de datos, modelación predictiva y descriptiva, métodos de prueba de modelos, visualización de datos, etc.

En este Link se muestra una de tantas herramientas de la inteligencia de negocios RapidMiner.

Esperando que sea de gran ayuda para ustedes.

Powtoon

En este Link se mostrara una presentación (Prezi) donde se explicara mas detalladamente la herramienta de negocios RapidMiner.

Prezi

Conclusión.

La herramienta utilizada RapidMiner, es una muy buena ayuda para llevar a cabo un proceso de Minería de Datos, por un lado porque es muy completa en cuanto a todo lo que en este campo se necesita, y por otro porque aparte de que tiene facilidades para uso del manejo de la herramienta más a fondo.

Se hace evidente que el proceso de Minería de Datos, es una tarea que no es fácil de realizar ya que se necesita hacer una gran cantidad de pruebas para llegar a obtener algún resultado, quizás no el mejor o esperado pero si uno que puede dar cierta claridad en movimientos como las ventas..

jueves, 10 de septiembre de 2015

Estructuras de minería de datos (Analysis Services - Minería de datos)