Que la clasificación de Mejor Valorados sea por mayor porcentaje de SIES
La clasificación de Mejor Valorados de Decide Madrid se realiza contando sólo el número de SIES de cada propuesta. Esto conduce a absurdos como que la propuesta más valorada sea una que tiene casi tantos NOES como SIES, por tener mucha polémica y muchos votos, además de ser de las más antiguas. Además, ello favorece injustamente a las propuestas iniciales que tienen muchos más votos, de tal forma que todas las propuestas mejor valoradas son las más antiguas. Si se hiciera por porcentaje de SIES respecto de votos totales la clasificación de Mejor Valorados sería mucho más dinámica y daría una oportunidad a las nuevas propuestas.
Podéis dar y comentar las explicaciones técnicas sobre cómo funciona la clasificación pero para el interés general las palabras de "clasificación" deben tener un significado que no requiera de explicación. Me explico: Que cuándo alguien selecciona "mejor valorados" vea entre las primeras pantallas los debates o propuestas que posiblemente él/ella también apoyaría y votaría a favor sin importar mucho si deben aparecer tres posiciones más arriba o más abajo. Siguiendo con esta selección de "mejor valorados" en las últimas pantallas deberían aparecer los debates o propuestas que yo también tumbaría. Pero claro, surge la pregunta ¿Qué pasa con la mayoría que no aparecen ni en las primeras ni en las últimas pantallas? Aquí deben ponerse en marcha los otros clasificadores de preferencia por el/la usuaria/o que es quién sabe lo que busca en cada momento.
Hola Pepepepe! Muchas gracias por darte cuenta y ponerlo por aquí! Lo hemos arreglado hace poco: https://github.com/AyuntamientoMadrid/participacion/blob/master/app/models/debate.rb#L135 https://github.com/AyuntamientoMadrid/participacion/blob/master/spec/features/debates_spec.rb#L362 También queremos añadir un filtro específico para debates polémicos: https://github.com/AyuntamientoMadrid/participacion/issues/312
Hola! No entiendo el cambio que habeis hecho, pero sigo viendo que, por ejemplo, en la página 1 de Mejor Valorados hay una propuesta con 1300 votos con un 85% de SIES y un 15% de NOES, mientras que en la página 4, mucho más atrás hay una propuesta con 184 votos y un 98% de SIES. En mi opinión ésta última propuesta está mejor valorada que la anterior, lo que se reflejaría en la clasificación si se atendiera al porcentaje de SIES. Podría exigirse un mínimo de 5 votos o así para aparecer en la lista de Mejor Valoradas con el criterio del porcentaje propuesto.
Hola! Así es como lo calculábamos antes, pero entonces no se tiene en cuenta la confianza de los resultados, sólo se mira el porcentaje. Cuantos más votos tenga una propuesta más te puedes fiar de que está bien valorada. Imagínate una propuesta con 10 votos a favor y 2 en contra, comparado con una propuesta que tenga 10.000 votos a favor y 2.500 en contra. Aunque la segunda tenga menos porcentaje de votos a favor, el resultado de que está bien valorada es más seguro. En los ejemplos que pones, el resultado de su valoración utilizando la fórmula sería: (votos_positivos - votos_negativos) * (porcentaje_de_votos_positivos) ----------(1105) * (0.85) = 935 -------- (172) * (0.98) = 168
Hola Rai! El argumento de la confianza suena bien, pero basta observar la primera página de los Más Valorados para darse cuenta que los resultados que se están obteniendo tienen un elevadísimo sesgo hacia las propuestas del primer día, el 7 de Septiembre, al que corresponden todas las propuestas Mejor Valoradas, salvo 2 que son del día 8 de Septiembre. Qué pasa? No hay ninguna propuesta realizada en los días subsiguientes que sea mejor que alguna de las numerosas del día 7 incluidas en la primera página? Lógicamente si debe haberlas, pero con el procedimiento de valoración empleado es imposible en la práctica que alcancen la primera página de Mejor Valorados. Incluso si una propuesta excepcionalmente buena realizada hoy recibiera en las primeras horas de su publicación, mientras se encuentra en las primeras posiciones de los Nuevos, 100 SIES y 0 NOES (muy difícil), no pasaría con ello de la página 7 de los Mejor Valorados. Al cabo de unas horas, hundida en la página N de los Nuevos y en la página 7 de los Mejor Valorados, ya prácticamente no la vería casi nadie y no recibiría muchos más votos ni mejoraría su posición en la lista de Mejor Valorados, que seguiría con sus propuestas inamovibles del día 7 de Septiembre, votadas una y otra vez por las nuevas personas que acceden a la página Web, que para más inri acceden preferentemente a esa clasificación de Mejor Valorados sesgada. Insisto que la clasificación de Mejor Valorados por porcentaje de SIES, según comentas la idea original, conduciría a resultados mucho más correctos. Si se quiere incrementar la confianza se podría multiplicar el porcentaje de votos positivos por la diferencia entre votos positivos y negativos elevada a un exponente pequeño, por ejemplo 0,01. En el ejemplo anterior se tendría: 1105^0.01 *0.85 = 1.0726 *0.85 = 0.912. 172^0.01 * 0.98 = 1.0528 *0.98 = 1.032, es decir mejor que la anterior, como en realidad lo es. Una propuesta nueva entraría con un valor de 1, es decir entre estas 2 propuestas, pero necesitaría más de 20 SIES (y ningún NO) para situarse por encima de la de 1,032. Sin embargo, creo que sería aún mejor considerar sólo el porcentaje de SIES y simplemente no poner las propuestas en la clasificación de Mejor Valoradas hasta que no tengan un mínimo de votos, por ejemplo 5 o 10 como máximo.
Hola Pepe! Tienes razón en el problema que describes. Siempre salen los mismos debates y los demás debates no tienen tanta oportunidad de ser vistos y votados. Una cosa no quita la otra. El algoritmo de mejor valorados que estamos usando es correcto, valora mejor a los debates, que utilizando sólo los porcentajes de votos a favor y en contra. Sí podríamos aplicarle algún tipo de corrección como la que describes. Pero en lugar de eso tenemos desarrollado un algoritmo más específico para ello. El algoritmo de más activos. Está inspirado en Reddit http://inaka.net/blog/2015/03/25/hot-score-with-ruby-postgresql-and-elastic-part-1/ http://www.evanmiller.org/how-not-to-sort-by-average-rating.html http://amix.dk/blog/post/19588 y debería cumplir la función que describes para mostrar los debates más recientes que a la vez están siendo mejor valorados y más comentados. Este algoritmo es que el queremos utilizar cuando la gente entra a Debates.Sólo nos faltan unos ajustes para que funcione bien.
Contenido relacionado (0)
Creado por
Creado el 10/09/2015 20:19
Inicia sesión para comentar