Modelos Predictivos y Data Mining: mayo 2007

jueves, 24 de mayo de 2007

Las distintas etapas de un proyecto de Data Mining

Quizá haya aún mucha gente que no conoce los distintos pasos que se llevan a cabo para realizar un proyecto de Data Mining.
Por esta razón, quisiera hacer al menos una breve descripción del proceso necesario para encontrar resultados lo más rápida y linealmente posible.
Como cualquier proyecto de minería, cuando se realiza un estudio de Data Mining (DM), no se tiene asegurado prima facie los resultados positivos. Sin embargo aplicando la metodología correcta es posible saber en un plazo relativamente corto y con un esfuerzo razonable si lo que hay al fin del camino es oro o no.
La primera regla a cumplir para ejecutar exitosamente un proyecto de estas características es definir un problema que queremos estudiar.
Ejemplos de problemas típicos son: mejorar la tasa de respuesta de una campaña de mails, aumentar la tasa de compradores de un sitio de ecommerce, disminuir la tasa de abandono de abonados a un servicio, mejorar la tasa de click-through de los banners impresos en un sitio web, predecir la cantidad de llamados a un call center, etc.
Una vez definido el problema a atacar, se realiza lo que llamamos “Entendimiento del Negocio”. La idea para esta etapa, es que el analista de DM se interiorice de las características que rodean al problema (como funciona la industria, quienes son los clientes, como son los productos o servicios ofrecidos, como son los procesos, etc.). Para esto es fundamental que pueda interactuar con un especialista en el tema (normalmente alguna persona de marketing o comercial de la compañía). Esta etapa se lleva adelante con una o varias entrevistas entre ambos.
A continuación se realiza el “Entendimiento de Datos”. Esta vez el analista interactuará con un experto de las bases de datos de la compañía (habitualmente gente del área de sistemas de la misma). Para este proceso hará falta una o varias reuniones y acceso a la documentación de los modelos de datos.
Una vez realizados los pasos de entendimiento, el analista solicitará una primera tanda de datos para analizar. Esto lo podrá hacer junto con el área de sistemas o en forma directa si cuenta con los permisos necesarios.
Luego trabajará realizando la “Preparación de Datos” que sea necesaria (limpieza, transformaciones, sumarizaciones, etc.). La idea es obtener al final de esta etapa una tabla de dos dimensiones con los datos “limpios” para iniciar el paso siguiente.
Ahora llegamos al núcleo del trabajo de DM con la etapa de “Modelización”. De aquí surgirán modelos que describan o predigan circunstancias o comportamientos. Es interesante hacer notar que existen numerosos tipos de modelos, por lo cuál el analista determinará en esta instancia el más adecuado para el problema que estamos tratando (ej. reglas de asociación, clusters, árboles de decisión, redes neuronales, regresiones, etc.).
Una vez obtenidos los primeros modelos el analista proseguirá con la fase de “Evaluación”, etapa en la que tratará de medir la calidad o efectividad predictiva del modelo obtenido.
Si los modelos obtenidos superan un umbral de calidad aceptable, se realizará la “Implementación” del mismo. Esta implementación tiene infinitos “flavors” (sabores). Desde listas con clientes con mayor propensión a adquirir un producto, hasta formulas que nos permitan calcular en tiempo real que banner presentar al visitante de nuestro sitio en determinado momento.
Por último, medir los resultados de los modelos implementados nos permitirá recalibrar los mismos para lograr una mejora permanente de los efectos buscados.

Para más información sobre las etapas de un proyecto de Data Mining, pueden visitar: http://www.crisp-dm.org.

Daniel Ferro.

martes, 15 de mayo de 2007

El RFID en las tarjetas de afinidad

Tecnología fascinante la del RFID. Inicialmente pensada para el reconocimiento automático y a distancia de mercaderías, hoy encuentra aplicaciones en distintos procesos de marketing.
Para los que no lo conocen, un sistema de RFID, está formado por un lado por “tags” (pequeñas antenas con un chip adosado) y por el otro por “lectores” (antenas más importantes encargadas de la lectura de los tags).
Existen dos tipos de tags, los “activos” que emiten una señal en forma permanente y por lo tanto requieren de una batería y los “pasivos” que funcionan en base a la energía, que en forma remota, emiten los lectores o antenas principales.
En ambos casos, la identificación precisa se realiza ya que cada chip contiene un número único (no hay dos tags en el mundo que tengan la misma secuencia de dígitos).
Un ejemplo conocido de tags activos lo constituyen los utilizados en las autopistas para atravesar los peajes sin detenerse con el auto.
Al ser más sofisticados, los tags activos tienen un costo mayor, pero también un alcance de lectura más importante que los pasivos (aproximadamente 8 metros contra 1).
Por otro lado, los tags pasivos dado su bajo costo y su pequeño tamaño y espesor (aproximadamente el de una tarjeta de crédito) son la elección natural al pensar en aplicaciones masivas.
Desde mi punto de vista, una aplicación interesante del RFID, es la posibilidad de utilizar tags pasivos en las tarjetas de afinidad. Esto permite, por ejemplo, que el reconocimiento del cliente en un local, se produzca a distancia sin que el cliente necesite pasar la tarjeta de manera explícita por un lector.
Me imagino que un futuro no muy lejano, será común encontrarse con displays de ofertas que se personalicen al paso de un cliente que posea este tipo de tarjetas de afinidad.
Un ejemplo concreto de esto, pero en la vía pública, lo implementó la gente de marketing de Mini Cooper en Estados Unidos. Ellos colocaron billboards (carteles enormes en la vía pública) que emitían mensajes personalizados cuando se acercaba un Mini de alguno de sus clientes que se habían sumado a la promo. Cada auto contaba, desde fábrica, con un tag activo que les permitía reconocer al cliente cuando pasaba cerca de alguno de sus carteles dinámicos.
Imaginen esto: la posibilidad de reconocer al cliente en forma automática y un modelo predictivo por detrás que nos permita realizar la oferta más adecuada para esa persona en esa situación.
Interesante, no?

Daniel Ferro.

jueves, 10 de mayo de 2007

Banners Pertinentes

La profusión de mensajes actuales y la necesidad de encontrar un lugar en la mente del consumidor, lleva a los creativos a una búsqueda de nuevas formas de llamar la atención de los usuarios online. Esta creatividad muchas veces apela a la interrupción del usuario (pop-ups en todas sus formas).
De más está decir lo frustrante que puede resultar esto para quien está buscando una determinada información en un sitio web. Mientras trata de concentrarse en la lectura de un artículo, la pantalla se completa con una oferta de un producto cualquiera. Definitivamente es malo para la experiencia del usuario. Es realmente bueno para la marca? Yo creo que no.
Ahora bien, desde mi punto de vista existen alternativas que beneficien a ambas partes (usuario y marca). El secreto es la presentación de banners pertinentes.
Hoy es posible inferir el perfil de un cliente online a partir de su comportamiento histórico en el sitio. Esto es así, aún en los casos donde el usuario no necesita loguearse para acceder a la información. Quizá desconozcamos el nombre y apellido, pero aún así podemos estimar sus preferencias.
La base de todo esto es la utilización de técnicas de datamining para la confección de modelos descriptivos y predictivos del comportamiento de nuestros usuarios.
Con esta información en la mano, lo razonable es presentar las ofertas comerciales (propias o de nuestros anunciantes) de manera adecuada. Esto significa que es posible ofrecer lo que a la persona le pueda llegar a interesar. Que les parece una mejora del 30% en la tasa de click-through?
Todos contentos, no?
Actualmente soluciones como AdSense de Google utilizan una opción intermedia, basada en la utilización de la información de contexto de la página, a fin de presentar la publicidad más adecuada. Esto es, si la página habla sobre tenis, ofrecer avisos de tickets para el próximo torneo. Si bien no se basa en el comportamiento del usuario, es un acercamiento interesante. La clave aquí es la manera en la que la página se convierte en “keywords” que a su vez se relacionan con los correspondientes de los anuncios disponibles. De ese matching surgirán los avisos más pertinentes a presentar.
Desde el punto de vista de los medios online, el uso de los modelos de comportamiento y el entendimiento profundo de la audiencia, marcan el futuro de cómo deberán manejar su stock de impresiones. En un medio interactivo como lo es la web, no es razonable aplicar modelos publicitarios de medios masivos. En la medida que los anunciantes entiendan las posibilidades que se presentan, exigirán a los medios que publiquen sus avisos a los clientes más adecuados a sus objetivos.

Daniel Ferro.

El nuevo marketing en el Retail

Actualmente los dueños de locales al público se enfrentan a desafíos interesantes. Por un lado el crecimiento económico de la Argentina, trajo una recuperación en la nivel de facturación. Por otro lado, los clientes hoy tienen más opciones que nunca para elegir que comprar, donde, por cuanto y como. Internet parece estar consolidándose como herramienta de difusión, pero a pesar del crecimiento sostenido del uso de la red, el local a la calle sigue siendo la opción de compra para la mayoría de los clientes de rubros como Alimentos, Electrodomésticos, Deportes, Ropa, Viajes, Libros, Servicios Profesionales, etc.
Pareciera ser que la regla es “difunda por Internet, venda en el local”. Lo cierto es que si el retailer quiere mejorar el valor del ticket promedio y la retención de clientes, es fundamental que pueda aprovechar lo nuevo que la tecnología tiene para ofrecer.
Por ej. hoy es posible saber con un buen grado de certeza, que productos ofrecer al cliente, según su patrón de compra, para mejorar el proceso de cross-selling. Esto es posible gracias a los “modelos de comportamiento”, un conjunto de técnicas matemáticas, estadísticas y de inteligencia artificial, que permiten conocer a partir de los datos de consumo que puede desear el cliente. Complejo? No tanto, ya que los proveedores de este tipo de soluciones han trabajado extensa y exitosamente en simplificar las herramientas utilizadas y brindar servicios empaquetados. Hoy las áreas de Marketing de un Retail pueden acceder a convenientes servicios de consultoría que le permitan conocer más profundamente que quieren sus clientes.
Veamos un ejemplo: una cadena de tiendas que vende libros, CDs y electrodomésticos desea mejorar sus niveles de venta disminuyendo el tiempo transcurrido hasta que los clientes vuelven al local luego de una compra.
Una forma tradicional de realizar esto es a través del cuponing, esto es, la entrega de un ticket de oferta que se ha impreso junto con el ticket de venta. Esa oferta tiene una validez determinada, por lo tanto se estimula al cliente a volver al local antes que este vencimiento se produzca. Hasta aquí lo conocido. Lo nuevo es que el contenido de esa oferta puede estar personalizado de acuerdo al “patrón” de compra del cliente. Este patrón fue calculado a partir de la información demográfica, transaccional y cualquier otra interacción que ese cliente ha tenido con la compañía. De tal manera que hemos podido establecer cuál es la oferta más adecuada para ese cliente en ese momento, aumentando las chances que vuelva a nuestro local.
Otra área de aplicación, tiene que ver con fidelizar a los clientes de empresas de servicios. Que mejor para esto que conocer con anticipación la probabilidad de “fuga” del mismo, a partir de lo cuál es posible tomar acciones anticipadas para minimizar dicha probabilidad.
Reconocer al cliente en el punto de venta, conocer su historial de compra y analizar dicha información es clave para el retailer que quiera sobrevivir en un mundo hipercompetitivo como en el que vivimos.

Daniel Ferro.

Modelos Predictivos y Data Mining

jueves, 24 de mayo de 2007

Las distintas etapas de un proyecto de Data Mining

martes, 15 de mayo de 2007

El RFID en las tarjetas de afinidad

jueves, 10 de mayo de 2007

Banners Pertinentes

El nuevo marketing en el Retail

Archivo del blog

Datos personales

Etiquetas

Links interesantes

Modelos Predictivos y Data Mining

jueves, 24 de mayo de 2007

Las distintas etapas de un proyecto de Data Mining

martes, 15 de mayo de 2007

El RFID en las tarjetas de afinidad

jueves, 10 de mayo de 2007

Banners Pertinentes

El nuevo marketing en el Retail

Suscribirse a este blog

Archivo del blog

Datos personales

Etiquetas

Links interesantes