Desarrollo de un sistema de detección de fake news en español y aplicación en noticias
No Thumbnail Available
Date
2020-04-30
Journal Title
Journal ISSN
Volume Title
Publisher
Centro Universitario de la Defensa de Marín
Abstract
El controvertido ascenso de Donald Trump hacia la Casa Blanca ha despertado un mal que
permanecía oculto para toda la sociedad, las fake news. Este fenómeno ha sido capaz de poner en jaque
la credibilidad del periodismo en general y ha propiciado la búsqueda de diferentes mecanismos para
detectar e identificar este tipo de noticias. El método tradicional y más empleado pasa por el procesado
manual de las noticias mediante la comprobación del autor, la fuente o el contenido (fact-checking).
En este TFG se busca un sistema más sofisticado basado en la utilización de técnicas de
procesamiento del lenguaje natural mediante machine learning para el desarrollo en lenguaje Python de
un sistema, en el cual el usuario sea un mero observador y el programa pueda dirimir la veracidad de la
noticia. En función de un conjunto de datos textuales proporcionados, en el cual encontramos las noticias
clasificadas como verdaderas y falsas, se crea un modelo a partir de diferentes algoritmos de aprendizaje
como Long Short-Term Memory (LSTM) para discernir si la noticia es verdadera o falsa. Antes de poder
hacer que el texto sea comprendido por el modelo creado precisa pasar por diferentes procesos como es
el embedding, en otras palabras, la transformación del corpus tal y como lo conocemos a un lenguaje
numérico y que permite un óptimo funcionamiento de los diferentes algoritmos empleados.
Description
Keywords
Fake news, python, Dataset, procesamiento del lenguaje natural, machine learning, embedding