jueves, 30 de octubre de 2008

Evento HOWA

El sábado pasado en Buenos Aires se realizó HOWA (Hands on Web Analytics) en la Universidad de Palermo (Buenos Aires). La verdad que el evento fue super interesante y muy bien organizado (felicitaciones para Juan Damia).
Si bien la mayoría de las charlas rondaron la utilización de Google Analytics, hubo también presentaciones relacionadas con la aplicación de modelos predictivos al mundo del marketing online.
Link: http://www.howa.com.ar/

Daniel Ferro

Evento en la maestría de Data Mining de la UBA

Durante el día de hoy se está llevando a cabo el evento anual que organiza la gente de la maestría de Data Mining de la Universidad de Buenos Aires. Ernesto Mislej estará a cargo de la disertación sobre "Behavioral Targeting. Publicación de avisos centrada en el usuario".
Participan distintas empresas del rubro del DM: SPSS, SAS, Org Veraz entre otras.
Para más información: http://www-2.dc.uba.ar/materias/mdmkd/jadm/index_1024.html.

Daniel Ferro

Behavioral Targeting Standards Consortium

El BTSC se reunió durante Octubre para discutir los distintos aspectos de la actividad de las empresas involucradas en proyectos de Behavioral Targeting. El NAI (Network Advertising Initiative - http://www.networkadvertising.org/) hizo su presentación basada en los principios de privacidad necesarios para esta actividad.
Más información en: http://www.btstandards.org/

Daniel Ferro

viernes, 11 de julio de 2008

La personalización de los medios online

El concepto de personalización en los medios online no es nuevo, pero por alguna razón tarda en imponerse. Inicialmente los intentos de personalización se basaban en que la gente dijera de manera explícita (quizá a través de un formulario) que rubros de información deseaba consumir. Pero esta técnica no deja de ser un método de comunicación "pull" (el usuario debe "tirar" de la información para recibirla). Quizá se puede pensar en métodos más del estilo "push" que faciliten al usuario la interacción con el medio.
A mi entender, en ese sentido, es mucho más eficiente producir la personalización en base al patron de comportamiento del visitante. Si historicamente no consulto artículos relacionadas con futbol, porque seguir presentandome dichas notas en la home del sitio de noticias. Esto no quiere decir que impidamos al usuario el acceso a dichas notas, simplemente digo que hay que priorizar la forma de mostrarlas reduciendo la presencia de las notas de menor interés a accesos secundarios (por ej. con una opción general de notas de deporte, en lugar de poner los titulares y las bajadas en la página principal).
Los modelos de comportamiento basados en data mining pueden establecer perfectamente perfiles que me permitan inducir como personalizar la home page de un medio electrónico asegurando que dichos artículos serán de relevancia para el usuario. De hecho una manera simplificada de esto es utilizar la estadística más básica: computar y registrar como un voto positivo cada vez que el usuario clickea en una nota de determinada categoría me permite a lo largo del tiempo usar una técnica del tipo RF (Recencia y Frecuencia) para identificar y rankear las categorías más relevantes para dicho usuario.
Las técnicas por detrás del Behavioral Targeting pueden servir no solo para potenciar una campaña publicitaria, sino que también pueden resultar úliles al momento de querer personalizar un sitio.

Daniel Ferro

lunes, 23 de junio de 2008

Social Discovering

Este post es una invitación a pensar. Con la cantidad de información disponible en las redes sociales, pensar en el uso de Sistemas de Recomendación para conocer nuevos amigos en función del análisis de patrones de comportamiento parece obvio.

Que algoritmos serán los más adecuados? Conocen alguna experiencia en este sentido? Cuales fueron los resultados?

Daniel Ferro.

viernes, 20 de junio de 2008

Pensar en Audiencias no en Medios

Uds. se preguntarán que tiene que ver este título con el Data Mining?
La respuesta es: mucho, pero permitanme primero hacer una breve reflexión antes de entrar de pleno en la relación entre el DM y la detección de audiencias.
La digitalización de todos los medios de comunicación está provocando una ruptura en los modelos de pensamiento que hemos estado utilizando en los últimos 40 años desde la TV como medio masivo de comunicación.
Uno de los aspectos más importantes de este proceso es el hecho que por primera vez un medio de comunicación, la web, es a la vez masivo y a la vez individual. Masivo por el grado de penetración que está logrando en todos los segmentos socio-económicos. Individual en la posibilidad de:
1) Personalizar el mensaje
2) Poder recibir una respuesta inmediata por parte del consumidor
Ninguna de estas posibilidades estaba presente de manera tan patente en un medio.
Ahora bien, vamos al centro de la cuestión. A través de la web puedo llegar a millones y millones de consumidores con mi mensaje. La pregunta es: es posible discriminar de manera inteligente quienes de esos consumidores son los más adecuados para mi producto/servicio?
La respuesta es: a través del análisis de comportamiento online es posible construir modelos predictivos que me permitan identificar aquellos consumidores con mayor propensión a aceptar mi propuesta. De esta manera es posible dejar de pensar en Medios y empezar a pensar en Audiencias. Dentro de muy poco todos los medios brindarán la posibilidad ya no de imprimir banners en determinadas zonas del sitio en tal franja horaria, sino de imprimir esos banners cuando frente a la computadora esté la persona más adecuada para recibir mi oferta. Sin duda esto va a mejorar enormemente el valor brindado por el medio al anunciante, ya que este último utilizará de manera más eficiente su presupuesto de marketing.
Interesante, no?

Daniel Ferro

martes, 13 de mayo de 2008

La paradoja de la elección

Gracias a Marcos Amadeo de IconoLab, conocí el pensamiento de Barry Schwartz relacionado con la teoría llamada "The Paradox of Choice" (pueden ver un video bastante entretenido de unos 20 minutos en inglés en http://www.ted.com/index.php/talks/view/id/93 o uno un poco más largo con subtitulos en inglés en http://video.google.com/videoplay?docid=6127548813950043200).
El tema es simple: la visión de Schwartz es que "Más es menos" cuando se refiere a exponer a un usuario a decenas o centenas de opciones. En general, dice, esto provoca parálisis en la decisión y una peor experiencia para el cliente.
Sin duda no dejo de pensar en los portales o mismo en los sitios de medios que en sus home pages presentan más de 200 opciones de click diferentes a sus usuarios.
No es hora de proponer algo más sensato basado en la relevancia que puedan tener esas opciones para CADA cliente?
Creo que personalizar utilizando los Sistemas de Recomendación automáticos y los AdServers inteligentes basados en Behavioral Targeting son el camino. Ambas propuestas analizan el comportamiento del usuario y no es necesario que el mismo opte manualmente por lo que quiere ver, disminuyendo al mismo tiempo el espacio de decisión a algo más razonable como experiencia.
Coinciden conmigo?

Daniel Ferro

martes, 22 de abril de 2008

BT: El futuro de la publicidad online

Actualmente existe en el mundo online un abanico de posibilidades para llegar con nuestros mensajes publicitarios a las audiencias objetivo.
La forma básica es contratar espacios en medios que cuenten con un servicio de AdServing. En general estas contrataciones se hacen pagando un costo por millar de impresiones (CPM) y el adserver es el encargado de rotar esos banners hasta cumplir con el tope de impresiones contratado. Sin duda esta opción es muy básica en cuanto a la forma azarosa de presentar los banners que utilizan los adservers actuales. Estos consideran poco o nada a quien tengo enfrente al momento de presentar un banner por lo que las tasas de click (CTR) son realmente muy bajas.
Otra posibilidad es utilizar Google AdWords, un servicio que permite publicar avisos teniendo en cuenta keywords (palabras clave) relacionadas con el mensaje, de tal manera que, a quien realice una búsqueda relacionada con esa keyword dentro de Google, se le presentaran los avisos pertinentes (relevantes).
AdWords también posee una red de contenido relacionada. Se trata de sitios de distintos rubros que han adherido a la red de avisos de Google (llamada AdSense), de tal manera que cuando se imprime alguna página de esos sitios cuyo contenido se relaciona con las keywords de algún aviso disponible, estos son publicados automáticamente.
Ahora bien, Google AdWords no considera el perfil completo del consumidor, solo se limita a presentar mensajes relacionados con lo que la persona está buscando en ese momento. Buen punto, pero incompleto.
Existe alguna opción que contemple el perfil completo del consumidor, tanto en cuanto a su historia como a los intereses recientes? Definitivamente, y su nombre es Behavioral Targeting.
El Behavioral Targeting es un conjunto de técnicas que permiten almacenar de manera automática el comportamiento histórico del consumidor, identificando, a través de modelos predictivos, las categorías con mayor propensión a ser aceptadas por los mismos en un momento determinado. De esta manera, los AdServers que utilizan Behavioral Targeting, presentan los banners más adecuados a cada perfil de usuario en el momento más adecuado.
Un punto interesante de aclarar, es que, para sustentar los principios de privacidad, el Anonymous Behavioral Targeting no utiliza información de identificación de los consumidores (no se registra nombre, ni dirección, etc.) para calcular los modelos de propensión, de tal manera que se construye un perfil al solo efecto de presentar opciones relevantes de avisos.
El beneficio es la mejora inmediata de la tasa de Click Through (CTR). Si los avisos son más relevantes para los consumidores, estos están más dispuestos a clickear.
La tendencia concreta es que los anunciantes van a dejar de pagar impresiones (CPM) y se focalizarán en pagar clicks (CPC). En definitiva, pagar por que su mensaje llegue a la mejor audiencia posible: la realmente interesada en su producto.

Daniel Ferro.

jueves, 13 de marzo de 2008

La fuga de clientes en los servicios de telefonía movil

A partir de un comentario que recibí en este mismo blog me puse a pensar en el servicio que recibimos de nuestras compañías de celulares (Celcos) y lo poco que realmente conocen de nuestro comportamiento como usuarios. Uno de los principales problemas que tienen dichas compañías se produce al momento de retener a personas disconformes con el servicio. Las barreras para cambiar de compañía son realmente bajas. Este problema de abandono llamado Attrition o Churn, ha sido momentáneamente ignorado por las empresas gracias a la alta tasa de adquisición de clientes (líneas nuevas) que estás compañías han experimentado en los últimos años.La realidad es que la cantidad de nuevos consumidores, en los mercados que van alcanzando su madurez, se acerca a su techo físico. Las empresas están llegando con sus ofertas a niños de temprana edad, pero incluso ese segmento se está empezando a saturar.
Que hacer entonces? Sin duda empezar a mirar con mayor interés el hecho de retener a los clientes. Las tasas actuales de churn en algunos paises son de alrededor de 4% mensual. Si, 4 de cada 100 clientes abandona por mes el servicio por uno de la competencia. En un escenario donde la adquisición se desacelera es fundamental revertir dichos índices de abandono.
Que puede hacer el mining en este sentido? Mucho sin duda. Conocer con anticipación los comportamientos que conducen a un abandono, permiten realizar campañas de retención apuntadas a aquellos clientes con riesgo real de fuga. Esto permite concentrar los presupuestos disponibles para estos casos en esos clientes y no tener que realizar campañas de retención masivas. Las campañas de retención masivas son difíciles de sostener en el tiempo por ser rápidamente copiadas por la competencia.Ahora bien, la sola identificación de los clientes con riesgo de fuga representa la mitad del camino. También es posible a través de técnicas de análisis de comportamiento, predecir qué oferta es la más conveniente para lograr la retención para cada segmento de clientes en riesgo.Señores gerentes de empresas de telefonía movil, las herramientas están disponibles. No dejen que los abandonemos.

Daniel Ferro

martes, 22 de enero de 2008

La economía Long Tail y los Sistemas de Recomendación

La economía Long Tail (ver articulo original de Chris Anderson en http://www.wired.com/wired/archive/12.10/tail.html y posterior libro http://www.amazon.com/Long-Tail-Future-Business-Selling/dp/1401302378) parece ser un hecho.
Tradicionalmente, en un mundo masificado por las comunicaciones televisivas y radiales (de una sola vía), todos seguíamos a "los exitos", sean estos: artistas, programas, productos o servicios.
Las decisiones de compra de los consumidores muchas veces estaban guiadas por los "hits" o "best-sellers", listas y rankings que las compañias comercializadoras y los medios nos hacian conocer amablemente. Esto provocaba una polarización: los productos que se vendían mucho, se vendían aún más y los productos menos exitosos se vendían menos.
La razón de un sistema basado en éxitos es muy simple: si Ud. es el dueño de una tienda con un espacio limitado de manera razonable querrá ocuparlo solo con productos con mucha rotación (exitos). Conclusión: los consumidores eran expuestos solo a esa oferta.
Pero que sucede si fuera posible tener locales comerciales con espacio ilimitado?
La gente compraría más de otros productos menos exitosos?
La realidad es que internet permite un infinito "shelf space" (tamaño del estante). El costo de agregar un producto a mi catalogo online no es significativo.
Amazon lo ha entendido perfectamente. Un comercio con, literalmente, millones de productos ofrecidos.
Ahora bien, la cuestión central es: pueden los consumidores lidiar con una oferta cuasi infinita de opciones?
La respuesta es que solo con algo de ayuda. Un buen buscador es el comienzo. Pero solo para el caso que yo, como usuario, conozca lo que estoy buscando. La segunda opción son los sistemas de recomendación. Se trata de aplicaciones basadas en el descubrimiento de patrones dentro de los datos de ventas. Haciendo mining sobre los datos es posible encontrar regularidades del tipo: cuando alguien compra el producto A, normalmente también adquiere el producto B.
Con ese conocimiento entre manos, cuando un próximo visitante pida el producto A, no nos costará mucho ofrecer el producto B, no es verdad?
Consecuencia: product discovering. Algo que no tenía pensado comprar y que no conocía previamente, se me presenta como una opción que muy probablemente me interese considerar.
Una aplicación muy intersante de todo esto se da en la música. Como hago para conocer nuevos temas e interpretes que sean de mi agrado? Los sistemas de recomendación realizan el music discovering de manera muy eficiente. Ejemplos de esto son Pandora (http://www.pandora.com/ solo utilizable dentro de USA) y LastFM (http://www.last.fm/). Se trata de radios online pero personalizadas. Comenzando con un artista ingresado por el usuario, el sistema propone artistas y temas relacionados. El usuario va indicando si le gusta o no el nuevo tema. A partir de la décima "votación" el sistema reproduce música adecuada al gusto del usuario en un 85% de las veces.
Interesante, no?

Daniel Ferro

lunes, 21 de enero de 2008

Motores de reglas y Data Mining

Muchas veces los proyectos de Data Mining pueden fallar por la falta de una correcta implementación de los resultados de los distintos modelos.
Esto suele pasar por las transformaciones que sufren los aprendizajes logrados en tiempo de modelización, con la implementación a nivel de negocio (etapas normalmente realizadas por grupos de personas diferentes).
Para achicar esta brecha existen formas de incorporar de manera integral los resultados de los modelos con el resto de las reglas de negocio que surgen desde las gerencias (normalmente las comerciales y de marketing).
Los "motores de reglas" son herramientas extraordinarias para llevar a cabo esto.
Para proyectos que exijan la "toma de decisión" en tiempo real, existen soluciones de código abierto (ej. Drools, Jess, etc.), que permiten separar la lógica de las reglas de negocio, de la codificación del resto de la solución. Esto permite cubrir los hallazgos realizados en la etapa de minería de los datos junto con el conocimiento que la empresa tiene de su negocio.
En la aplicación de mi modelo de 4 capas al e-commerce (ver http://predictivos.blogspot.com/search/label/E-commerce) muchas veces he tenido que hacer convivir reglas para realizar ofertas al usuario online que provenían de estímulos de distinto origen (los intereses propios del usuario, el comportamiento de su segmento, los intereses de la empresa, etc).
Aqui es donde los motores de reglas se presentan como una solución interesante.

Daniel Ferro

Clustering de resultados en buscadores

Están apareciendo una cantidad de buscadores que tienen como característica interesante la de clusterizar (agrupar) los resultados de la búsqueda de acuerdo a conceptos relacionados.
Un ejemplo de esto es Clusty (http://clusty.com) que funciona bastante bien aunque he notado que la cobertura de crawling todavía está incompleta.
Lo interesante de estas opciones es sin duda la de colaborar con el usuario en encontrar el "sentido" más apropiado de la búsqueda realizada.
Si uno está buscando la palabra "Tejidos" puede referirse de manera muy diferente a las confecciones con hilados, como al conjunto de células que forman los organos.
En el futuro cercano veremos la incorporación de la visualización gráfica de esos resultados, lo que mejorará aún más la utilidad de estas aplicaciones indispensables en la actualidad.

Daniel Ferro