LUPPAR NEWS-REC: UM RECOMENDADOR INTELIGENTE DE NOTÍCIAS
Autor(es):
SOUZA, ANTONIO ALEX DE
Palavras Chaves:
Não informado
Ano de Publicação:
2019
Resumo:
A presente dissertação documenta a construção de um sistema recomendador de notícias, denominado Luppar News-Rec, e sua avaliação. Luppar News-Rec é constituído de três subsistemas: o subsistema de captura, pré-processamento e armazenamento, o subsistema de classificação e o subsistema de aquisição de perfis de assinantes e distribuição de notícias. O foco principal é no subsistema de classificação de notícias sendo que para os outros dois foram implementadas apenas funcionalidades básicas essenciais. No projeto do subsistema de classificação avalia-se a eficácia da combinação de modelos de representação de documentos, incluindo uma abordagem embedding ponderada, com algoritmos de classificação de texto monorrótulo e multirrótulo. O trabalho deste subsistema é classificar as notícias em tópicos de interesse e distribuí-las conforme o perfil dos assinantes. Os modelos de representação de documentos do tipo BoW, matriz TF-IDF, Word2Vec e FastText, esses dois últimos também utilizando a abordagem E2V-IDF, são combinados com os classificadores KNN, SVM(RBF), Decision Tree, Random Forest. Os resultados mostram o desempenho significativamente superior da combinação SVM (kernel: RBF) com embeddings utilizando a abordagem E2V-IDF em relação a representações embeddings tradicionais, para a maioria das coleções abordadas. Palavras-chave: Classificação. Representação de Documentos. Incorporação de Palavras. Notícias. Recomendação
Abstract:
The present dissertation documents the construction of a news recommending system, called Luppar News-Rec, and its evaluation. Luppar News-Rec consists of three subsystems: the capture, preprocessing and storage subsystem, the rating subsystem, and the subscriber profiling and news distribution subsystem. The main focus is on the news rating subsystem, and for the others only essential functionalities have been implemented. The design of the classification subsystem assesses the effectiveness of combining document representation models, including a weighted embedding approach, with single-label and multi-label text classification algorithms. The role of this subsystem is to classify the news into topics of interest and distribute them according to the subscriber profile. BoW, TF-IDF matrix, Word2Vec, and FastText document representation models, the latter two also using the E2V-IDF approach, are combined with the KNN, SVM (RBF), Decision Tree, Random Forest classifiers. The results show the significantly superior performance of combining SVM (kernel: RBF) with embeddings using the E2V-IDF approach over traditional embeddings representations for most of the collections addressed. Keywords: Classification. Document Representation. Word Embeddings. News. Recommender
Tipo do Trabalho:
Dissertação
Referência:
SOUZA, ANTONIO ALEX DE. LUPPAR NEWS-REC: UM RECOMENDADOR INTELIGENTE DE NOTÍCIAS. 2018. 95 f. Dissertação (Mestrado Acadêmico ou Profissional em 2018) - Universidade Estadual do Ceará, , 2018. Disponível em: Acesso em: 25 de abril de 2024
Universidade Estadual do Ceará - UECE | Departamento de Tecnologia da Informação e Comunicação - DETIC
Política de Privacidade e Segurança Build 1