martes, 22 de enero de 2008

La economía Long Tail y los Sistemas de Recomendación

La economía Long Tail (ver articulo original de Chris Anderson en http://www.wired.com/wired/archive/12.10/tail.html y posterior libro http://www.amazon.com/Long-Tail-Future-Business-Selling/dp/1401302378) parece ser un hecho.
Tradicionalmente, en un mundo masificado por las comunicaciones televisivas y radiales (de una sola vía), todos seguíamos a "los exitos", sean estos: artistas, programas, productos o servicios.
Las decisiones de compra de los consumidores muchas veces estaban guiadas por los "hits" o "best-sellers", listas y rankings que las compañias comercializadoras y los medios nos hacian conocer amablemente. Esto provocaba una polarización: los productos que se vendían mucho, se vendían aún más y los productos menos exitosos se vendían menos.
La razón de un sistema basado en éxitos es muy simple: si Ud. es el dueño de una tienda con un espacio limitado de manera razonable querrá ocuparlo solo con productos con mucha rotación (exitos). Conclusión: los consumidores eran expuestos solo a esa oferta.
Pero que sucede si fuera posible tener locales comerciales con espacio ilimitado?
La gente compraría más de otros productos menos exitosos?
La realidad es que internet permite un infinito "shelf space" (tamaño del estante). El costo de agregar un producto a mi catalogo online no es significativo.
Amazon lo ha entendido perfectamente. Un comercio con, literalmente, millones de productos ofrecidos.
Ahora bien, la cuestión central es: pueden los consumidores lidiar con una oferta cuasi infinita de opciones?
La respuesta es que solo con algo de ayuda. Un buen buscador es el comienzo. Pero solo para el caso que yo, como usuario, conozca lo que estoy buscando. La segunda opción son los sistemas de recomendación. Se trata de aplicaciones basadas en el descubrimiento de patrones dentro de los datos de ventas. Haciendo mining sobre los datos es posible encontrar regularidades del tipo: cuando alguien compra el producto A, normalmente también adquiere el producto B.
Con ese conocimiento entre manos, cuando un próximo visitante pida el producto A, no nos costará mucho ofrecer el producto B, no es verdad?
Consecuencia: product discovering. Algo que no tenía pensado comprar y que no conocía previamente, se me presenta como una opción que muy probablemente me interese considerar.
Una aplicación muy intersante de todo esto se da en la música. Como hago para conocer nuevos temas e interpretes que sean de mi agrado? Los sistemas de recomendación realizan el music discovering de manera muy eficiente. Ejemplos de esto son Pandora (http://www.pandora.com/ solo utilizable dentro de USA) y LastFM (http://www.last.fm/). Se trata de radios online pero personalizadas. Comenzando con un artista ingresado por el usuario, el sistema propone artistas y temas relacionados. El usuario va indicando si le gusta o no el nuevo tema. A partir de la décima "votación" el sistema reproduce música adecuada al gusto del usuario en un 85% de las veces.
Interesante, no?

Daniel Ferro

lunes, 21 de enero de 2008

Motores de reglas y Data Mining

Muchas veces los proyectos de Data Mining pueden fallar por la falta de una correcta implementación de los resultados de los distintos modelos.
Esto suele pasar por las transformaciones que sufren los aprendizajes logrados en tiempo de modelización, con la implementación a nivel de negocio (etapas normalmente realizadas por grupos de personas diferentes).
Para achicar esta brecha existen formas de incorporar de manera integral los resultados de los modelos con el resto de las reglas de negocio que surgen desde las gerencias (normalmente las comerciales y de marketing).
Los "motores de reglas" son herramientas extraordinarias para llevar a cabo esto.
Para proyectos que exijan la "toma de decisión" en tiempo real, existen soluciones de código abierto (ej. Drools, Jess, etc.), que permiten separar la lógica de las reglas de negocio, de la codificación del resto de la solución. Esto permite cubrir los hallazgos realizados en la etapa de minería de los datos junto con el conocimiento que la empresa tiene de su negocio.
En la aplicación de mi modelo de 4 capas al e-commerce (ver http://predictivos.blogspot.com/search/label/E-commerce) muchas veces he tenido que hacer convivir reglas para realizar ofertas al usuario online que provenían de estímulos de distinto origen (los intereses propios del usuario, el comportamiento de su segmento, los intereses de la empresa, etc).
Aqui es donde los motores de reglas se presentan como una solución interesante.

Daniel Ferro

Clustering de resultados en buscadores

Están apareciendo una cantidad de buscadores que tienen como característica interesante la de clusterizar (agrupar) los resultados de la búsqueda de acuerdo a conceptos relacionados.
Un ejemplo de esto es Clusty (http://clusty.com) que funciona bastante bien aunque he notado que la cobertura de crawling todavía está incompleta.
Lo interesante de estas opciones es sin duda la de colaborar con el usuario en encontrar el "sentido" más apropiado de la búsqueda realizada.
Si uno está buscando la palabra "Tejidos" puede referirse de manera muy diferente a las confecciones con hilados, como al conjunto de células que forman los organos.
En el futuro cercano veremos la incorporación de la visualización gráfica de esos resultados, lo que mejorará aún más la utilidad de estas aplicaciones indispensables en la actualidad.

Daniel Ferro