A extração de informaçães de documentos não estruturados é um dos recursos da área de Processamento de Linguagem Natural (PLN). Várias aplicações podem utilizar esses resultados, uma vez que já tenham sido extraídos e classificados. Alguns recursos de PLN fornecem informações sobre
dados já estruturados como, por exemplo, a polaridade de uma palavra, que
denota o sentimento associado com a mesma. Entretanto, não são observados
trabalhos integrando estes dois aspectos. Este artigo descreve a implementação
da ferramenta WiTi-Lex. WiTi-Lex é uma aplicação web para extração de informações sobre pessoas e identificação da opinião de outras pessoas em
relação a pessoa pesquisada. Para isso, as informações sobre pessoas são extraídas da base de dados do Wikipédia e categorizadas com a Academia Brasileira de Letras. Além disso, as opiniões das outras pessoas são extraídas
do Twitter e classificadas com o SentiLex. Neste contexto, este artigo também
descreve uma ontologia sobre extração de classe gramatical e de polaridade
de palavras, chamada WiTi-Onto. Finalmente, foi realizado um conjunto de
procedimentos de avaliação com a ferramenta. A avaliação permitiu demonstrar
resultados promissores ao testar a ferramenta WiTi-Lex uma base de dados
pública.
O Computer on the Beach é um evento técnico-científico que visa reunir profissionais, pesquisadores e acadêmicos da área de Computação, a fim de discutir as tendências de pesquisa e mercado da computação em suas mais diversas áreas.