INSTITUTO TECNOLÓGICO DE CHILPANCINGO
INGENIERÍA EN INFORMÁTICA
INTELIGENCIA DE NEGOCIOS
ACTIVIDAD UNO
EQUIPO:
ABRAHAM MANRIQUE REYES
ANACECI GARCÍA TOLENTINO
Cuestionario primera parte
1.
¿Qué es la inteligencia de negocios?
R=
Proceso
de integración y tratamiento de los datos y convertirlos en toma de decisiones
para la directiva.
2. ¿En
que apoya a los estudiantes estudiar la asignatura de Inteligencia de Negocios?
R=
Capacidad de entender desde la extracción de los datos de sistemas existentes
hasta la explotación de la información por herramientas de análisis de datos.
Aporta conocimiento en bases de datos que posee una empresa a través de
herramientas de minería de datos y data warehouse con el fin de explotarlo y
que sirva como soporte para la toma de decisiones.
3.
¿Qué aporta al perfil profesional del ingeniero
en Informática esta asignatura?
Cuestionario Segunda Parte (Video)
1. ¿Qué
es el Business intelligence?
R= Combinación
de tecnologías de almacenamiento de datos y análisis de información que
implementan soluciones orientadas al usuario final para apoyar la toma de
decisiones, para evaluar indicadores estratégicos, tácticos u operativos que se
encuentran disponibles dentro de la organización.
2. ¿Cuáles
son los cuestionamientos se realizan las personas de las organizaciones?
R= se preguntan el ¿Cómo estoy? Y ¿Por qué estoy
así? ¿Estrategias dinámicas para la información o las relaciones ocultas dentro
de la información?
3. ¿Cuáles
son las situaciones cotidianas en las organizaciones?
R=
Necesidad del análisis de la información, la estadística, las predicciones, las
proyecciones, los análisis en tiempo real. A través de RP’s, sistemas
contables, nóminas o financieros.
4. ¿Por
qué Business intelligence?
· R=
- · Ayuda a tener modelos y estrategias para compartir a la organización, suministrar datos que no pueden ser explicados por el modelo mental.
- · Se toman como herramientas de navegación contando con un conjunto de KPI’s y así publicar la realidad de la información tomando en cuenta estos indicadores y analizar resultados para orientar mejoras.
- · Ya después de esto, tomar decisiones rápidamente y convertir los datos en información, y utilizar un método razonable para la gestión empresarial. Con el cumplimiento del Ciclo de BI (Análisis, Ideas, Acción, Medición).
- · Combinar información, tomar en cuenta la información de otros sistemas, pues ya haciendo esto se crea un conjunto de KPI’s de diferentes sistemas y muestra a través de panoramas o escenarios de información.
- · Ofrecer apoyo efectivo al análisis multidimensional, es decir análisis a la velocidad del pensamiento, intuitivos.
- · Construcción de datos fáciles de analizar, orientados temáticamente, por tal motivo analistas y consumidores de la información, les facilita el entendimiento de la información.
- · Funcionalidad: responder preguntas en tiempo real, formateo de información (pivoteo), cualquier persona puede analizar modelos de negocio con una mínima información.
5. ¿Por
qué debe considerarse el Business intelligence con poder de solución?
R=
Permite explorar los datos de la misma forma en como lo pensamos, identificando
y entendiendo tendencias, patrones y detalles como técnicas de análisis de los
datos.
6. ¿Qué
es el sistema de información ejecutiva?
R=
Permite interactuar al usuario de manera intuitiva y comunicar el
comportamiento de los indicadores de desempeño en lo particular o en la salud
corporativa en general (escenario de información).
7. ¿Qué
es el sistema de soporte de decisiones?
R=
Es una técnica de análisis de uno o más variables de negocio para apoyar a la
toma de decisiones con una mayor efectividad a través de modelos, planificación
y ejecución y monitoreo de los mismos.
8.-
¿Cuáles son las cuatro características que conforman a los Sistemas de Soporte
de Decisiones?
R= Incorporar
datos y modelos, asistencia en los procesos de decisión, apoyo en la toma de
decisiones y el objetivo es mejorar la efectividad de las decisiones y no la
eficiencia con la que esas decisiones son tomadas.
En la actualidadse han inventado y/o creado técnicas del análisis de la toma de decisiones cuando se hanbla de la información es por que tiene una gran válidez y está a la par con los recursos financieros, humanos y materiales.
Inteligencia de negocios.
Arquitectura para mejorar loas organizaciones
ayudando a los empleados en los puntos estratégicos, tácticos y operativos para
la toma de decisiones y ¿cómo?
-- Información correcta.
-- Tiempo oportuno.
-- Personas correctas.
Sistemas fuentes: sistemas transaccionales
diseñados para el soporte de las operaciones del negocio como: compras, ventas,
almácenes, etc.
OLTP (On Line Transactional Process).
Estos datos permitirán generar información para la
toma de decisiones a nivel operacional.
Plan estratégoco:
Se recomienda definir éste plan en la organización
si no se encuentra, se busan objetivos, estrategias, indicadores y ya en los
más remotos casos, se recomienda reestructurar la base de datos y las
aplicaciones para satisfacer el plan estratégico.
ETL (Extraer, transformar y cargar)
>>>Integrar datos cuando se
lleguen a tener distintas fuentes, es decir, diferentes manejadores de base de
datos.
>>> Llevar información de la Base
de datos operacionales a la base de datos dimensionales.
DWH.
Es un almacén de datos para analizar la información
es la base de datos esttratégica o multidimensional.
DataMars.
Forma parte de Datawarehouse. Si un Data marts es
formado por un DWH, es decir puede estar preparado por un DWH o
independientemente.
OLAP.
Tecnología para aprovechar la estructura de el
DataMars, DWH. Tecnología que permitirá analizar información dinámicamente a
los niveles tácticos y estratégicos basados en cubos que contienen las medidas
y las dimensiones.
Minería de datos.
A base de algoritmos avanzados descubre cosas
ocultas y apunta al nivel estratégico.
Aplicación para soporte de decisiones.
Creadas para cubrir decisiones, táctivas y
estratégicas.
Sistemas de Información. para ejecutivos.
Fueron diseñados para dirigir y están basados en
alertas y éste indicador se le llama KPI (Key Performance Indicator) y se
obtienen a partir de un Balance Scorecard.
----------------------------------------------------------------------------------------------------------------------------
ACTIVIDAD DE APRENDIZAJE CIERRE DE CAPÍTULO
DATA WAREHOUSE
----------------------------------------------------------------------------------------------------------------------------
ACTIVIDAD DE APRENDIZAJE CIERRE DE CAPÍTULO
DATA WAREHOUSE
El término Datawarehouse fue acuñado por primera vez por
Bill Inmon, y se traduce literalmente como almacén de datos. No
obstante, y como cabe suponer, es mucho más que eso. Según definió el propio
Bill Inmon, un Datawarehouse se caracteriza por ser:
- Integrado: los datos almacenados en el Datawarehouse deben integrarse en una estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. La información suele estructurarse también en distintos niveles de detalle para adecuarse a las distintas necesidades de los usuarios.
- Temático: sólo los datos necesarios para el proceso de generación del conocimiento del negocio se integran desde el entorno operacional. Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser consolidados en una única tabla del Datawarehouse. De esta forma, las peticiones de información sobre clientes serán más fáciles de responder dado que toda la información reside en el mismo lugar.
- Histórico: el tiempo es parte implícita de la información contenida en un Datawarehouse. En los sistemas operacionales, los datos siempre reflejan el estado de la actividad del negocio en el momento presente. Por el contrario, la información almacenada en el Datawarehouse sirve, entre otras cosas, para realizar análisis de tendencias. Por lo tanto, el Datawarehouse se carga con los distintos valores que toma una variable en el tiempo para permitir comparaciones.
- No volátil: el almacén de información de un Datawarehouse existe para ser leído, pero no modificado. La información es por tanto permanente, significando la actualización del Datawarehouse la incorporación de los últimos valores que tomaron las distintas variables contenidas en él sin ningún tipo de acción sobre lo que ya existía.
- Dar soporte a los responsables técnicos del Datawarehouse en aspectos de auditoría, gestión de la información histórica, administración del Datawarehouse, elaboración de programas de extracción de la información, especificación de las interfaces para la realimentación a los sistemas operacionales de los resultados obtenidos... etc.
Por último, destacar que para comprender íntegramente el
concepto de datawarehouse, es importante entender cual es el proceso de
construcción del mismo, denominado ETL (Extracción, Transformación y Carga), a
partir de los sistemas operaciones de una compañía:
- Extracción: obtención de información de las distintas fuentes tanto internas como externas.
- Transformación: filtrado, limpieza, depuración, homogeneización y agrupación de la información.
- Carga: organización y actualización de los datos y los metadatos en la base de datos.
Una de las claves del éxito en la construcción de un
datawarehouse es el desarrollo de forma gradual, seleccionando a un
departamento usuario como piloto y expandiendo progresivamente el almacén de
datos a los demás usuarios. Por ello es importante elegir este usuario inicial
o piloto, siendo importante que sea un departamento con pocos usuarios, en el
que la necesidad de este tipo de sistemas es muy alta y se puedan obtener y
medir resultados a corto plazo.
Principales aportaciones de
un datawarehouse
- Proporciona una herramienta para la toma de decisiones en cualquier área funcional, basándose en información integrada y global del negocio.
- Facilita la aplicación de técnicas estadísticas de análisis y modelización para encontrar relaciones ocultas entre los datos del almacén; obteniendo un valor añadido para el negocio de dicha información.
- Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios.
- Simplifica dentro de la empresa la implantación de sistemas de gestión integral de la relación con el cliente.
- Supone una optimización tecnológica y económica en entornos de Centro de Información, estadística o de generación de informes con retornos de la inversión espectaculares.
Si no está familiarizado con el concepto de Datawarehouse,
puede resultarle útil, además, examinar las siguientes definiciones:
- Datamart
- Datamining
- Cuadro de Mando Integral
- Sistemas de Soporte a la Decisión (DSS)
- Sistemas de Información Ejecutiva (EIS).
MINERÍA
DE DATOS
La minería de datos es el proceso de detectar la
información accióna de grandes conjuntos de datos. Utiliza el análisis
matemático para deducir los patrones y tendencias que existen en los datos.
Normalmente, estos patrones no se pueden detectar mediante la exploración
tradicional de los datos porque las relaciones son demasiado complejas o porque
hay demasiado datos.
Estos patrones y tendencias se pueden recopilar y
definir como un modelo de minería de datos. Los modelos de minería de
datos se pueden aplicar en escenarios como los siguientes:
·
Previsión:
calcular las ventas y predecir las cargas de servidor o el tiempo de
inactividad del servidor.
·
Riesgo
y probabilidad: elegir los mejores clientes para la distribución de correo
directo, determinar el punto de equilibrio probable para los escenarios de
riesgo, y asigna probabilidades a diagnósticos u otros resultados.
·
Recomendaciones:
determinar los productos que se pueden vender juntos y generar recomendaciones.
·
Buscar
secuencias: analizar los artículos que los clientes han introducido en el
carrito de compra y predecir los posibles eventos.
·
Agrupación:
separar los clientes o los eventos en clústeres de elementos relacionados, y
analizar y predecir afinidades.
La
generación de un modelo de minería de datos forma parte de un proceso mayor que
incluye desde la formulación de preguntas acerca de los datos y la creación de
un modelo para responderlas, hasta la implementación del modelo en un entorno
de trabajo.Este proceso se puede definir mediante los seis pasos básicos
siguientes:
El
siguiente diagrama describe las relaciones existentes entre cada paso del
proceso y las tecnologías de Microsoft SQL Server que se pueden usar para
completar cada paso.
Definir
el problema
El
primer paso del proceso de minería de datos, tal como se resalta en el
siguiente diagrama, consiste en definir claramente el problema y considerar
formas de usar los datos para proporcionar una respuesta para el mismo
métricas
por las que se evaluará el modelo y definir los objetivos concretos del
proyecto de minería de datos. Estas tareas se traducen en preguntas como las
siguientes:
·
¿Qué está buscando?¿Qué tipos
de relaciones intenta buscar?
·
¿Refleja el problema que está
intentando resolver las directivas o procesos de la empresa?
·
¿Desea realizar predicciones a
partir del modelo de minería de datos o solamente buscar asociaciones y
patrones interesantes?
·
¿Qué resultado o atributo desea
predecir?
·
¿Qué tipo de datos tiene y qué
tipo de información hay en cada columna? En caso de que haya varias tablas,
¿cómo se relacionan?¿Necesita limpiar, agregar o procesar los datos antes de
poder usarlos?
Preparar
los datos
El
segundo paso del proceso de minería de datos, como se indica en el siguiente
diagrama, consiste en consolidar y limpiar los datos identificados en el paso
Definir el problema.
Los
datos pueden estar dispersos en la empresa y almacenados en formatos distintos;
también pueden contener incoherencias como entradas que faltan o incorrectas.
Por ejemplo, los datos pueden mostrar que un cliente adquirió un producto
incluso antes que se ofreciera en el mercado o que el cliente compra
regularmente en una tienda situada a 2.000 kilómetros de su casa.
Explorar
los datos
El
tercer paso del proceso de minería de datos, como se resalta en el siguiente
diagrama, consiste en explorar los datos preparados.
Debe
conocer los datos para tomar las decisiones adecuadas al crear los modelos de minería
de datos. Entre las técnicas de exploración se incluyen calcular los valores
mínimos y máximos, calcular la media y las desviaciones estándar, y examinar la
distribución de los datos. Por ejemplo, al revisar el máximo, el mínimo y los
valores de la media se podrían determinar que los datos no son representativos
de los clientes o procesos de negocio, y que por consiguiente debe obtener más
datos equilibrados o revisar las suposiciones que son la base de sus
expectativas.
Generar
modelos
El
cuarto paso del proceso de minería de datos, como se resalta en el siguiente
diagrama, consiste en generar el modelo o modelos de minería de datos Usará los
conocimientos adquiridos en el paso
Explorar los datos para definir y crear los
modelos.
Deberá
definir qué columnas de datos desea que se usen; para ello, creará una
estructura de minería de datos. La estructura de minería de datos se vincula al
origen de datos, pero en realidad no contiene ningún dato hasta que se procesa
.Al procesar la estructura de minería de datos, Analysis Services genera
agregados y otra información estadística que se puede usar para el análisis.
Cualquier modelo de minería de datos que esté basado en la estructura puede
utilizar esta información
Explorar
y validar los modelos
El
quinto paso del proceso de minería de datos, como se resalta en el siguiente
diagrama, consiste en explorar los modelos de minería de datos que ha generado
y comprobar su eficacia.
Antes
de implementar un modelo en un entorno de producción, es aconsejable probar si
funciona correctamente. Además, al generar un modelo, normalmente se crean
varios con configuraciones diferentes y se prueban todos para ver cuál ofrece
los resultados mejores para su problema y sus datos.
Implementar
y actualizar los modelos
El
último paso del proceso de minería de datos, como se resalta en el siguiente
diagrama, consiste en implementar los modelos que funcionan mejor en un entorno
de producción.
Una
vez que los modelos de minería de datos se encuentran en el entorno de
producción, puede llevar a cabo diferentes tareas, dependiendo de sus
necesidades.
Estructuras de minería de datos (Analysis Services - Minería de datos)
La
estructura de minería de datos define los datos a partir de los cuales se
generan los modelos de minería de datos: especifica la vista de datos de
origen, el número y el tipo de columnas, y una partición opcional en conjuntos
de entrenamiento y de pruebas. Una misma estructura de minería de datos puede
admitir varios modelos de minería de datos que comparten el mismo dominio. En
el diagrama siguiente, se muestra la relación de la estructura de minería de
datos con el origen de datos y con los modelos de minería de datos que la
componen.
La
estructura de minería de datos del diagrama está basada en un origen de datos
que contiene varias tablas o vistas, combinadas en el campo CustomerID .Una
tabla contiene información sobre los clientes, como la región geográfica, la
edad, los ingresos y el sexo, mientras que la tabla anidada relacionada
contiene varias filas de información adicional sobre cada cliente, como los
productos que ha adquirido. En el diagrama, se muestra que se pueden generar
varios modelos de minería de datos a partir de una misma estructura de minería
de datos, y que los modelos pueden usar columnas de la estructura diferentes.
Modelo
1: usa CustomerID, Income, Age, Region y filtra los datos de Region.
Modelo
2: usa CustomerID, Income, Age, Region y filtra los datos de Age.
Modelo
3: usa CustomerID, Age, Gender y la tabla anidada, sin filtros.
_________________________________________________________________________________
UNIDAD II
HERRAMIENTAS PARA LA INTELIGENCIA DE NEGOCIOS
RapidMiner
Introducción.
RapidMiner es una herramienta de Minería de Datos ampliamente usada y
probada a nivel internacional en aplicaciones empresariales, de
gobierno y academia. Implementa más de 500 técnicas de pre-procesamiento
de datos, modelación predictiva y descriptiva, métodos de prueba de
modelos, visualización de datos, etc.
En este Link se muestra una de tantas herramientas de la inteligencia de negocios RapidMiner.
Esperando que sea de gran ayuda para ustedes.
Powtoon
En este Link se mostrara una presentación (Prezi) donde se explicara mas detalladamente la herramienta de negocios RapidMiner.
Prezi
Conclusión.
La herramienta utilizada RapidMiner, es una muy buena ayuda para llevar
a cabo un proceso de Minería de Datos, por un lado porque es muy
completa en cuanto a todo lo que en este campo se necesita, y por otro
porque aparte de que tiene facilidades para uso del manejo de la
herramienta más a fondo.
Se hace evidente que el proceso de Minería de Datos, es una tarea que no
es fácil de realizar ya que se necesita hacer una gran cantidad de pruebas
para llegar a obtener algún resultado, quizás no el mejor o esperado pero si uno que puede dar cierta claridad en movimientos como las ventas..






