FORMAPYME

Formación, Información y Servicios ON-LINE para empresas

Tecnología


Ver todas las categorías de Reportajes

Predicciones y percepciones: Descargando sabiduría del público online

Los mercados de predicción están de moda. En estos mercados la gente apuesta sobre cualquier cosa, desde la probabilidad de que una película sea un éxito, la posibilidad de que un político se convierta en presidente o si la bolsa va a subir o bajar. Se han realizado muchos artículos de investigación sobre su grado de exactitud y a los medios les gusta escribir sobre cómo a menudo estas predicciones derrotan a supuestos expertos.


Pero no son perfectos. Los mercados necesitan centinelas. Alguien tiene que crearlos y asegurarse que el dinero de los participantes –en aquellos casos en los que por ejemplo la gente compra acciones-, cambia de manos de manera disciplinada. Los profesores de Wharton Albert Saiz y Uri Simonsohn han encontrado un modo menos costoso de ofrecer algunas de sus ventajas. Se llama búsqueda en Internet.


Concretamente Saiz, del Departamento de Activos Inmobiliarios, y Simonsohn, del Departamento de Gestión de las Operaciones e Información, sostienen en un nuevo artículo de investigación que la probabilidad de que un tema, haciendo referencia a determinada localización, se debata online guarda correlación con su relativa prevalencia en el mundo real. “Estamos interesados en la posible sabiduría resultante de la agregación de un tipo específico de juicio, esto es, el determinar sobre qué tema merece la pena escribir”, se puede leer en el artículo titulado "Downloading Wisdom from Online Crowds” (“Descargando sabiduría del público online”). Su objetivo era discernir qué países, estados y grandes ciudades de Estados Unidos eran percibidos como los más corruptos. Así pues, introdujeron las palabras adecuadas en un motor de búsqueda llamado Exalead. Evaluando la cifra de documentos que contenían la palabra “corrupción” en el mismo párrafo en que aparecía el nombre de la localización correspondiente calcularon sus rankings de corrupción.


Los resultados no son para nada sorprendentes. Entre los países que se consideran más corruptos están Nigeria, Serbia y Haití. En el caso de los estados destacan Nueva Jersey, Nueva York e Illinois. Chicago y Nueva Orleans son supuestamente las ciudades más corruptas.


Simonsohn señala que no existe modo alguno de saber a ciencia cierta si estos lugares son realmente corruptos. Sus investigaciones simplemente concluyen que muchos documentos online contienen los términos corrupción y el nombre de la localización y además están relativamente cercanos en el texto.


Pero la gente habla y está preocupada por cosas en relación al lugar en que se encuentren. En Florida, pero no en Maine, a la gente le preocupa el tema de los caimanes hambrientos. Y de hecho, los ataques de caimanes son más frecuentes en Florida, donde a excepción de un solo caso, se han producido todos los accidentes fatales en el país desde 1948.


Tal y como estos dos profesores explican en su artículo, “suponiendo que cuanta mayor sea la frecuencia con que sucede un fenómeno, permaneciendo todo lo demás constante, mayor será la probabilidad de que alguien escriba sobre ello, los indicadores agregados formados por el número de gente que escribe sobre el tema deberían estar correlacionados con la frecuencia relativa con la que tiene lugar dicho fenómeno”.


Para crear una muestra del mayor tamaño posible, Saiz y Simonsohn no se ciñeron únicamente a las búsquedas en los medios de comunicación. También buscaron entre una amplia variedad de documentos y encontraron que ninguno en particular interfería en sus resultados. “Utilizamos muchas noticias pero también muchos documentos gubernamentales”, dice Simonsohn. Además, “cuando empezamos a buscar los indicadores sociales, como el número de afro-americanos o hispanos en una ciudad, encontramos muchos documentos elaborados por organizaciones culturales y museos”.


Y ese es el motivo por el que Simonsohn cree que están documentando algo más que meros “rumores”, esto es, los cotilleos y chismorreos que frecuentemente alimentan los debates en blogs y chats. “Los rumores suelen tener poca vida, pero los comentarios que vimos no eran perecederos”, dice. “Creí que íbamos a utilizar muchos blogs, pero al final empleamos muchos menos de los que habíamos pensado”.


Cuantificando las tendencias sociales


De hecho, su artículo muestra patrones claros y estables en relación con un número significativo de características socio-demográficas de las ciudades y estados. Concretamente, Saiz y Simonsohn estudiaron el número de documentos de Internet que contenían las palabras “afro-americano”, “hispano”, “inmigrante”, “pobreza” y “asesinato” y que además estuviesen relativamente próximas a los nombres de las principales ciudades y estados. Sorprendentemente, encontraron una fuerte correlación positiva entre la frecuencia con la que sucede el fenómeno en determinada localización, como por ejemplo el porcentaje de hispanos en una ciudad y la frecuencia de documentos en Internet debatiendo sobre dicho fenómeno haciendo referencia a cada localización. Las correlaciones resultaban evidentes para las ciudades y estados de Estados Unidos.


Saiz y Simonsohn demostraban así que la frecuencia con que aparecen documentos en Internet podría emplearse para crear una proxy de rankings relativos de ciudades y estados en relación con los principales fenómenos sociales, de los cuales se disponen datos precisos. Pero también estaban intrigados por la posibilidad de utilizar dicha técnica para cuantificar una variable que no se puede cuantificar tan fácilmente: la corrupción.


Simonsohn señala que en su momento consideraron los resultados como prueba de una técnica útil para los investigadores sociales y para la gente interesada en cuantificar tendencias sociales en ciudades, no como una técnica para hacer afirmaciones tajantes sobre qué lugares tienen un alto porcentaje de policías y políticos que aceptan sobornos. Nadie debería vender su casa en Los Ángeles simplemente porque aparece en lo más alto de la lista de corrupción de Saiz y Simonsohn (pero tal vez estaría bien hacer una donación en Navidades a la Asociación Benévola de Policías).


Los dos investigadores contrastaron sus resultados de corrupción obtenidos gracias a Internet con el importante ranking anual elaborado por Transparency International, una entidad sin ánimo de lucro con sede en Berlín que gestiona informes de gente de negocios y de expertos para elaborar su ranking. Transparency International también elabora rankings sobre la percepción de corrupción en los países, no sobre la corrupción en sí.


Saiz y Simonsohn encontraron que su ranking no presentaba grandes diferencias con el elaborado por Transparency International, con una excepción: Islandia. De acuerdo con su ranking, Islandia era uno de los países más corruptos, mientras que según Transparency International era el segundo menos corrupto, sólo por detrás de Finlandia. “Cometimos nuestro mayor error con Islandia”, reconoce Simonsohn. “Creemos que se debe a que durante mucho tiempo ha sido uno de los países menos corruptos. La gente habla mucho sobre corrupción en el país, pero en positivo”.


No existe ninguna entidad similar a Transparency International que elabore rankings sobre estados y ciudades de Estados Unidos, así que estos dos profesores tenían que encontrar otro modo de contrastar su método para sus resultados dentro del país. En el caso de los estados, compararon sus resultados con el número medio de condenas penales que se dictaban por empleado público. De nuevo sus resultados y dichas cifras parecían ir de la mano. De acuerdo con su ranking, Nebraska era el estado que se percibía como menos corrupto y también según el ratio de condenas penales por funcionario. Por el contrario, Nueva Jersey era considerado como uno de los estados más corruptos en su ranking y también tenía un alto ratio de condenas penales por empleado público. En otras palabras, el hecho de que la acción de Los Soprano, la famosa serie de televisión, se desarrolle en Nueva Jersey no es una casualidad.


En cuanto al ranking de ciudades, Saiz y Simonsohn tuvieron que recurrir a indicadores más complejos para validar sus resultados, ya que no había una sola fuente que proporcionase un medio definitivo de comparación. Pero eso les obligó a manejar datos demográficos y socio-económicos, donde encontraron correlaciones que, en opinión de Simonsohn, son más instructivas que una lista con las ciudades más corruptas.


“Teniendo en cuenta que investigaciones previas habían mostrado que los lectores de rankings suelen conceder mayor importancia a las diferencias en posición que a las diferencias en las variables continuas subyacentes empleadas para elaborar dichos rankings, presentamos los resultados de nuestras estimaciones de corrupción en las ciudades en grupos de diez, sin desvelar la posición que cada ciudad ocupaba dentro del grupo”, escriben Saiz y Simonsohn. “El primer grupo es consistente con nuestra idea previa sobre corrupción, ya que incluye ciudades como San Diego, Nueva Orleans, Los Ángeles, Filadelfia y Chicago”.


A medida que analizaban los datos, se dieron cuenta que las ciudades más pobres eran, según su índice, más corruptas que las ciudades del noreste. Asimismo, las ciudades grandes parecían ser más corruptas, lo contrario que le ocurría a las ciudades con gobiernos de mayor tamaño –cuantificado el tamaño como el porcentaje de trabajadores del sector público-.


Lanzamiento de la nueva PlayStation


“Las ciudades étnicamente diversas –medido como el porcentaje de afro-americanos y personas no nacidas en el país-, parecen experimentar mayores niveles de corrupción”, añaden. “Los negros y los inmigrantes suelen ser tratados injustamente por parte de los políticos corruptos. Este patrón en que los burócratas oportunistas explotan a las minorías y a los extranjeros resulta consistente con algunos resultados previos obtenidos para el país. También es consistente con la historia de la corrupción en Estados Unidos y con la maquinaria política que, de manera oportunista, explota las minorías étnicas para obtener rentas”.


Este vínculo entre los indicadores socio-económicos y la corrupción indica que la gente interesada en cuantificar las tendencias sociales podría utilizar la técnica de Saiz y Simonsohn. Por ejemplo, alguien podría evaluar la frecuencia con que la palabra “contaminación” aparece en un texto cerca del nombre de cada región china es las páginas web de dicho país. No está muy claro si las actuales fuentes oficiales de datos constituyen una fuente fiable de información sobre el tema. La técnica de Saiz y Simonsohn podría de este modo proporcionar una medida del grado de preocupación por la contaminación en cada área de China.


Sus investigaciones identifican un patrón de datos recurrente en situaciones en que las cantidades masivas de información en forma de texto son generadas por gente diferente de un modo totalmente descentralizado. Los investigadores sociales posiblemente empleen la frecuencia con que se visita un documento en Internet como proxy de las tendencias sociales locales que, de otro modo, serían de muy difícil cuantificación.


No obstante, existen otras aplicaciones orientadas hacia los negocios. Simonsohn sostiene que algunas búsquedas por palabra, si se realizan escrupulosamente, podría, contribuir a que los expertos en marketing ahorren dinero porque les ayudaría a centrar más sus esfuerzos. Una empresa como Sony podría intentar evaluar los “rumores” que corren online cuando lanza una nueva versión de su consola Playstation. “Cuando Sony lanza una nueva PlayStation tiene grandes problemas logísticos”, señala. “¿A qué ciudades envías una mayor cantidad de unidades? Supongamos que has cuantificado el rumor en diferentes ciudades antes del lanzamiento, y luego puedes ajustar el número de pedidos, de tal manera que en las ciudades donde se ha mostrado un mayor interés llegan más PlayStations”. De hecho, empresas como Nielsen Buzzmetrics ya están utilizando los contenidos generados por los consumidores en Internet para temas de marketing.


Los asesores políticos –que en el fondo no son más que expertos en marketing que venden personas, no productos-, también podrían utilizar esta técnica. Podrían comprobar la frecuencia con la que la gente escribe sobre sus candidatos y oponentes, y sobre una variedad de adjetivos deseables o desdeñables. Luego podrían pasar a investigar los informes o grupos de discusión.


Una de las ventajas de este estudio fue la posibilidad de evaluar los diversos motores de búsqueda de Internet, ya que Saiz y Simonsohn intentaron utilizarlos todos. Empezaron con Google y el resultado no fue satisfactorio. “No permite realizar una única búsqueda automatizada”, dice Simonsohn. Sus preferencias se inclinaron por Exalead, un motor de búsqueda francés pero disponible en inglés, porque consideraron que, junto con Ask.com, era el más fiable. “Descubrimos que Yahoo era el menos fiable”, añade. “Si buscas algo hoy en Yahoo y de nuevo la semana que viene, el número de resultados podría variar en varios millones de páginas web. No creo que se hayan creado varios millones de documentos nuevos en una semana”.


Fuente: Universia Knowledge Wharton

Herramienta creada por Universia para los clientes de Banco Santander.
Si desea acceder a más informes y artículos sobre otros temas de interés, acceda a FORMAPYME.com y regístrese.