Classificação de Contexto para Processamento da Linguagem Natural Baseado em Representação Vetorial de Palavras e no Agrupamento por K-Means

Tiago B.N. Silveira, Heitor S. Lopes, A. E. Lazzaretti, D. P. Araújo, C. F. Valério

Resumo


Este trabalho traz como proposta a associação do algoritmo skipgram, para representação vetorial de palavras, com o algoritmo de agrupamento não-supervisionado k-means. Ao longo do texto, além de detalhar esta metodologia e demonstrar sua eficácia de 75.3% na classificação de contexto em documentos escritos utilizando linguagem natural, buscamos discutir as vantagens e limitações do método proposto em uma perspectiva de longo prazo, inserida tanto na metodologia empírica de processamento da linguagem natural quanto na busca de modelos descritivos para a linguagem.


Texto completo:

PDF

Apontamentos

  • Não há apontamentos.