Pensamientos computables - www.pensamientoscomputables.com
49

Data Warehouses y minería de datos para predecir el futuro

Publicado el: 19/11/2010
Cubo de consulta multidimensional
Los data warehouses, también llamados almacenes de datos o bases de datos multidimensionales, son un tipo de tecnología informática que ha tenido un crecimiento de uso constante en las empresas en los últimos años. Esto no es de extrañar, ya que junto al uso de técnicas de minería de datos, las empresas pueden, nada menos, que predecir el futuro, algo vital para proceso de toma de decisiones. ¿Quieres saber cómo?

La mayoría de empresas, al menos las que son competitivas, tienen sistemas informáticos de bases de datos relacionales para mantener actualizado el trasiego diario de información. Las bases de datos multidimensionales son distintas a las relacionales, ya que guardan información histórica. Veámoslo más fácilmente con un ejemplo: la compra y devolución de un producto en una tienda dejaría intacta la cantidad de stock del producto en la base de datos relacional, sin embargo, en la base datos multidimensional, tendríamos como ha evolucionado el stock a lo largo del tiempo, registrándose la salida y reentrada del producto. Así que los almacenes de datos manejan información histórica y las bases de datos relacionales permiten que la empresa pueda hacer su trabajo diario.

Los almacenes de datos suelen necesitar varios cientos de GB para almacenar toda esa información. Su diseño es muy diferente al de las bases de datos relacionales, ya que con este cambio de diseño ahorramos mucho tiempo a la hora de consultar todos esos GB de datos. La información la obtienen de las bases de datos relacionales, utilizando los llamados procesos ETL (extracción, transformación y carga), que son lanzados automáticamente a altas horas de la madrugada cuando se supone que nadie esta usando la base datos.

Mediante herramientas OLAP se hacen consultas al almacén de datos para extraer resultados que, además, después pueden tratarse con algoritmos de inteligencia artificial y técnicas estadísticas para obtener nueva información y hacer predicciones. De esta manera podemos plantear preguntas como por ejemplo: ¿qué tipo de cliente compra este producto?, ¿qué productos se venden más junto a otros y cuales son?, ¿qué descuento hay que aplicar para obtener el máximo beneficio con las ventas?, ¿cual es la tendencia de las ventas según la época del año y el tipo de producto?, etc.

De esta manera podemos encontrar extrañas relaciones que nunca hubiésemos imaginado, como por ejemplo que los que compran pañales en los supermercados suelen comprar también cervezas, por eso lo normal es que coloquen estratégicamente estos dos productos juntos.

Con toda seguridad estas herramientas también las usan Facebook, Google, Hotmail y otras, para crear perfiles de nuestra personalidad, con el fin de dirigirnos campañas de anuncios a medida. De hecho algunas herramientas de minería de datos usan como fuente de información blogs y redes sociales como Twitter, Facebook, LinkedIn, etc.

Al final las empresas terminarán sabiendo más de nosotros que nosotros mismos.

Pensamientos (0): Comentar
Categorías: ,

Comparte:

Copia y pega en tu página:

Comparte
Escribe tus pensamientos computables

Respondiendo a los siguientes comentarios:

Para comprobar que eres un humano responde correctamente:

Esta pregunta no me gusta, ¡cambialá!

Ninguno de estos datos será almacenado.

(Escribe el correo electrónico)

Campo obligatorio.

(Escribe el correo eléctronico o los correos electrónicos separados por comas)

Campo obligatorio.

Para comprobar que eres un humano responde correctamente:

Esta pregunta no me gusta, ¡cambialá!

Daiatron en Google+