Un modelo extremeño revoluciona la detección de odio en redes: así funciona SHS-ALBETO
10 de Diciembre de 2025
La creciente presencia de discursos de odio y mensajes ofensivos en internet continúa siendo uno de los principales desafíos para plataformas y comunidades digitales, especialmente en idiomas donde la detección automática sigue siendo menos precisa que en inglés. Para abordar este problema, investigadores de la Escuela Politécnica de la Universidad de Extremadura (UEx) han desarrollado SHS-ALBETO, un nuevo modelo de inteligencia artificial diseñado exclusivamente para identificar discurso de odio en español.
Este avance se basa en la arquitectura BERT, un sistema que permite a las máquinas comprender el lenguaje humano, aunque optimizado mediante ALBETO, una versión ligera que reduce el coste computacional sin perder capacidad. SHS-ALBETO emplea tecnología basada en Transformers y mecanismos de self-attention, esenciales para captar el contexto, la ironía, el sarcasmo o el lenguaje ambiguo en redes sociales.
Entrenado con datos reales de X para mejorar la detección de odio
Para entrenar el modelo, los investigadores utilizaron contenido real de la red social X: “para ver si podía mejorar la detección de mensajes de odio frente a otras soluciones existentes. También buscábamos comparar su desempeño con modelos previos basados en la arquitectura BERT, como BETO o DistilBETO, evaluando si su enfoque lograba resultados superiores”, anuncia Carlos Javier Pérez Sánchez, catedrático del área de Matemáticas de la UEx.
El equipo empleó además el conjunto HatEval del concurso SemEval 2019. En palabras de Pérez Sánchez, “hemos empleado el conjunto HatEval del concurso SemEval 2019, que contiene unos 6.600 tuits en español etiquetados como discurso de odio o no odio. Este conjunto de datos se centra en mensajes de odio contra dos colectivos, mujeres e inmigrantes”.
Resultados superiores a todos los modelos previos en español
SHS-ALBETO ha logrado resultados destacados en precisión, sensibilidad y exactitud. Basado en la versión optimizada ALBETO, el sistema ha demostrado ser más eficiente y preciso que alternativas anteriores, superando a modelos como BERT multilingüe o BETO.
En las pruebas con tuits de HatEval, el modelo alcanzó una puntuación F1 cercana a 0,78, por encima del rango 0,70–0,72 de las soluciones previas. Según los investigadores, esta mejora supone aproximadamente un 10% más en métricas clave, consolidando un nuevo referente en la detección de odio en español.
Aplicaciones prácticas y utilidad para redes, medios e instituciones
La eficiencia de SHS-ALBETO lo convierte en una herramienta especialmente útil para complementar los filtros automáticos de redes sociales y plataformas digitales. El español presenta dificultades añadidas por su diversidad dialectal y la escasez de grandes conjuntos de datos etiquetados, lo que limita la robustez de los modelos existentes.
Su aplicación podría resultar decisiva en la moderación de contenido. Tal y como señala Pérez Sánchez: “Los medios digitales lo podrían aplicar para controlar mejor los comentarios ofensivos que escapan a sus actuales mecanismos. Y en el caso de instituciones públicas, educativas o entidades que luchan contra la discriminación, SHS-ALBETO facilitaría la monitorización de tendencias o incidentes de odio en tiempo real, ayudando a reaccionar antes y con más información”.
Los investigadores destacan que este sistema permite actuar con mayor rapidez, evitando la difusión de mensajes dañinos y mejorando la seguridad y bienestar en entornos digitales en español.
Noticias relacionadas
Comenta esta noticia
A Fondo