Carregando ...
Visualização do Trabalho Acadêmico
Repositório Institucional - UECE
Título:
LUPPAR NEWS-REC: UM RECOMENDADOR INTELIGENTE DE NOTÍCIAS

Autor(es):
SOUZA, ANTONIO ALEX DE

Palavras Chaves:
Não informado

Ano de Publicação:
2019

Resumo:
A presente dissertação documenta a construção de um sistema recomendador de notícias, denominado
Luppar News-Rec, e sua avaliação. Luppar News-Rec é constituído de três subsistemas:
o subsistema de captura, pré-processamento e armazenamento, o subsistema de classificação e
o subsistema de aquisição de perfis de assinantes e distribuição de notícias. O foco principal é
no subsistema de classificação de notícias sendo que para os outros dois foram implementadas
apenas funcionalidades básicas essenciais. No projeto do subsistema de classificação avalia-se a
eficácia da combinação de modelos de representação de documentos, incluindo uma abordagem
embedding ponderada, com algoritmos de classificação de texto monorrótulo e multirrótulo. O
trabalho deste subsistema é classificar as notícias em tópicos de interesse e distribuí-las conforme
o perfil dos assinantes. Os modelos de representação de documentos do tipo BoW, matriz
TF-IDF, Word2Vec e FastText, esses dois últimos também utilizando a abordagem E2V-IDF, são
combinados com os classificadores KNN, SVM(RBF), Decision Tree, Random Forest. Os resultados
mostram o desempenho significativamente superior da combinação SVM (kernel: RBF)
com embeddings utilizando a abordagem E2V-IDF em relação a representações embeddings
tradicionais, para a maioria das coleções abordadas.
Palavras-chave: Classificação. Representação de Documentos. Incorporação de Palavras.
Notícias. Recomendação

Abstract:
The present dissertation documents the construction of a news recommending system, called
Luppar News-Rec, and its evaluation. Luppar News-Rec consists of three subsystems: the
capture, preprocessing and storage subsystem, the rating subsystem, and the subscriber profiling
and news distribution subsystem. The main focus is on the news rating subsystem, and for the
others only essential functionalities have been implemented. The design of the classification
subsystem assesses the effectiveness of combining document representation models, including a
weighted embedding approach, with single-label and multi-label text classification algorithms.
The role of this subsystem is to classify the news into topics of interest and distribute them
according to the subscriber profile. BoW, TF-IDF matrix, Word2Vec, and FastText document
representation models, the latter two also using the E2V-IDF approach, are combined with the
KNN, SVM (RBF), Decision Tree, Random Forest classifiers. The results show the significantly
superior performance of combining SVM (kernel: RBF) with embeddings using the E2V-IDF
approach over traditional embeddings representations for most of the collections addressed.
Keywords: Classification. Document Representation. Word Embeddings. News. Recommender

Tipo do Trabalho:
Dissertação

Referência:
SOUZA, ANTONIO ALEX DE. LUPPAR NEWS-REC: UM RECOMENDADOR INTELIGENTE DE NOTÍCIAS. 2018. 95 f. Dissertação (Mestrado Acadêmico ou Profissional em 2018) - Universidade Estadual do Ceará, , 2018. Disponível em: Acesso em: 25 de abril de 2024

Universidade Estadual do Ceará - UECE | Departamento de Tecnologia da Informação e Comunicação - DETIC
Política de Privacidade e Segurança
Build 1