Hate Speech en Redes Sociales Chilenas

Organized by alvaro.fuentesm - Current server time: April 18, 2025, 5:44 a.m. UTC

First phase

Fase Concurso
Aug. 19, 2022, noon UTC

End

Competition Ends
Oct. 10, 2022, 8 p.m. UTC

Hate Speech en Redes Sociales Chilenas

Contexto

Durante los últimos años, diferentes organismos han manifestado su preocupación por el aumento de los denominadas expresiones o discursos de odio (hate speech), es decir, formas de expresión o contenido audio-visual que incentivan la discriminación o la violencia contra personas o grupos solamente por razón de su género, origen étnico, religión, nacionalidad, u orientación sexual. Monitorear este fenómeno de manera oportuna puede ayudar a las sociedades y sus gobiernos a prevenir tensiones, crímenes y conflictos que amenazan no sólo los valores democráticos más fundamentales, sino también el orden, la estabilidad y la paz social.

La rápida masificación de herramientas tecnológicas como las redes sociales, las ha convertido en uno de los principales medios que utilizan hoy las personas para generar y compartir información. Consecuentemente, plataformas virtuales de comunicación como Twitter, Instagram o Facebook, son los escenarios donde hoy en día se propaga la mayor parte de los discursos de odio. Lamentablemente, el gran alcance de estas redes, su naturaleza pública, las dinámicas sociales que allí se instauran, así como la ausencia de un marco regulatorio explícito, no hacen sino empeorar la magnitud y peligrosidad del fenómeno.

 

Competencia

La competencia de este año consiste en desarrollar un modelo/algoritmo que permita determinar automáticamente si un Tweet ha sido marcado como caso de Hate Speech por anotadores humanos. Se solicitará también determinar si el Tweet hace referencia a un grupo vulnerable específico.

Fecha de término: domingo 9 de octubre de 2022 a las 23:55 (Hora Chile).

F.A.Q

  • Tengo una duda técnica -> Enviar un correo a datatonutfsm@gmail.com con la palabra [TECNICO] en el asunto.
  • Tengo otras dudas -> Enviar un correo a datatonutfsm@gmail.com con la palabra [DUDA] en el asunto.
  • Aún no se acepta mi participación -> La aceptación se realiza manualmente, por lo que durante el día se verifica la inscripción y la posterior aceptación.
  • ¿Cómo registro mi equipo en CodaLab?-> Leer la sección Equipos.

Importante

Solo se van a considerar predicciones con el nombre del equipo.  El número máximo de integrantes por equipo es 3.
La competencia no acepta más de 2 predicciones al día por persona. Los intentos se reinician diariamente según el Coordinated Universal Time (UTC).

Leaderboard Final

Posición refleja su posición final en el tablero.

PosiciónTeamPuntaje
#1 Lonely Wolf 0.821767083
#2 DC 0.817286665
#3 MoccaOverflow 0.812800622
#4 NxtData 0.811327846
#5 Luna 0.798233898
#6 data-test 0.782816914
#7 Team-Titan 0.763211481
#8 Ramon Nikodym 0.743054057
#9 HallowText 0.671663635
#10 IC1101 0.645648829
#11 DataBiscuit 0.604979638
#12 Ragiñelwe 0.587637906
#13 Tensor Style 0.392333896
#14 YastAI 0.324710587
#15 Chikorita 0.216770898

Métrica de evaluación

Se utilizará métrica Puntaje para evaluar sus predicciones. Su cálculo es descrito a continuación:

F1_Odio = Binary F1 Score utilizando la columna "Odio".
F1_Comunidades = Macro F1 Score utilizando las 4 columnas de comunidades.

Puntaje = 0.5*F1_Odio + 0.5*F1_Comunidades

Se recomienda consultar scikit-learn .

Sobre el tablero de resultados (leaderboard)

El tablero preliminar de resultados es visible durante toda la duración de la competencia. El puntaje de una solución en este tablero se determinará utilizando un 70% de los datos de pruebas (test) elegido aleatoriamente del total.

El día 03 de octubre se publicará un tablero final donde los puntajes de cada solución se determinarán usando el 100% de los datos de prueba. Si un equipo hubiese enviado múltiples soluciones, se considerará la última. Es responsabilidad de cada equipo decidir qué solución deja como más reciente en el tablero.

Reglas

  • ¡No hagas trampa!
  • ¡Da lo mejor de ti!
  • Se admite expandir el conjunto de entrenamiento utilizando datos: recolectados y anotados manualmente, o mediante datasets públicos.
  • No se permite etiquetar a mano las predicciones. Las predicciones deben ser generadas por un modelo/algoritmo.
  • El número máximo de integrantes por equipo es 3. Solo se van a considerar predicciones con el nombre del equipo.
  • Las submissions deben ser realizadas antes de domingo 9 de octubre de 2022 a las 23:55 (Hora Chile) para ser considerada en el leaderboard final.

 

Este concurso se rige por el general ChaLearn contest rules.

Equipos

El número máximo de integrantes por equipo es 3.
Solo se van a considerar predicciones con el nombre del equipo.

Inscripción de equipos en CodaLab

Cada integrante debe editar su perfil:

Yellow_tester_settings

En este ejemplo, el usuario "yellow-tester" edita su Settings indicando su nombre de equipo en el campo de "Team name", en este caso, el equipo se llama "YELLOW". Opcionalmente debajo se puede agregar los nombres de los integrantes del equipo (no es necesario y no es utilizado en el sistema). Lo que importa es que todos los integrantes del equipo coloquen el mismo nombre en "Team name". No olvidar hacer click en "Save Changes".

Yellow_team

Una vez estén todos en el mismo equipo cualquier integrante puede subir una predicción en Participate -> Submit/View results

Learderboard_w_global_team

Fase Concurso

Start: Aug. 19, 2022, noon

Description: Fase Concurso: Sube tu predicción sobre el test set.

Competition Ends

Oct. 10, 2022, 8 p.m.

You must be logged in to participate in competitions.

Sign In