Um Método para Coleta, Tratamento de uma Base de Dados de Textos Literários em Língua Portuguesa para uso na Identificação de Autoria

Paulo Júnior Varela; Jivago Bulsing Schoot

doi:10.14210/cotb.v0n0.pp.239-246

Pesquisa

Resumo

Um Método para Coleta, Tratamento de uma Base de Dados de Textos Literários em Língua Portuguesa para uso na Identificação de Autoria

10.14210/cotb.v0n0.pp.239-246

Data de publicação:

A utilização do meio computacional para a resolução de casos de identificação de autoria tem crescido progressivamente em áreas como a computação, a linguística e o direito. Este artigo tem por objetivo apresentar um método para auxiliar no processo de coleta, tratamento e validação de base de dados para fins de testes de modelos computacionais. Como base de dados foram coletados, tratados e validados 100 amostras de textos de autores consagrados da literatura brasileira. Ao final a base de dados foi validada e com as características utilizadas tal base se mostrou robusta e confiável para utilização no processo de identificação de autoria de textos.

Anais do Computer on the Beach

O Computer on the Beach é um evento técnico-científico que visa reunir profissionais, pesquisadores e acadêmicos da área de Computação, a fim de discutir as tendências de pesquisa e mercado da computação em suas mais diversas áreas.

Access journal

Autor(es)

Paulo Júnior Varela

Universidade Tecnológica Federal do Paraná (UTFPR) Coordenação de Licenciatura em Informática - COLIN Francisco Beltrão - Paraná
Jivago Bulsing Schoot

Universidade Tecnológica Federal do Paraná (UTFPR) Coordenação de Licenciatura em Informática - COLIN Francisco Beltrão - Paraná

PDF

Edição
v. 4 (2013)

Seção
Artigos Completos

Portal de Periódicos

Anais do Computer on the Beach

Portal de Periódicos

Pesquisa

Um Método para Coleta, Tratamento de uma Base de Dados de Textos Literários em Língua Portuguesa para uso na Identificação de Autoria

Anais do Computer on the Beach