Análise do Impacto da Replicação de Dados Implementada pelo Apache Hadoop no Balanceamento de Carga

Rhauani Weber Aita Fazul; Paulo Vinicius Cardoso; PatrÄ±cia Pitthan Barcelos

Pesquisa

Resumo

Análise do Impacto da Replicação de Dados Implementada pelo Apache Hadoop no Balanceamento de Carga

Data de publicação: 29/05/2019

Ferramentas especializadas em Big Data, como o Apache Hadoop, devem portar meios que garantam a integridade e a disponibilidade dos dados. Para tal, o HDFS, sistema de arquivos distribu´ıdo do Hadoop, faz uso de diversas técnicas de tolerância a falhas, dentre elas a replicação de dados. Tratando-se de clusters altamente escal´aveis, há a preocupação em verificar se a distribuição dos dados replicados ocorre de forma homogênea. Este trabalho analisa experimentalmente o comportamento do HDFS em cenários com e sem a ocorrência de falhas, avaliando o desbalanceamento de carga resultante do processo de replicação de dados implementado pelo Apache Hadoop. Experimentos adicionais medem o desempenho alcançado ao balancear um cluster.

Anais do Computer on the Beach

O Computer on the Beach é um evento técnico-científico que visa reunir profissionais, pesquisadores e acadêmicos da área de Computação, a fim de discutir as tendências de pesquisa e mercado da computação em suas mais diversas áreas.

Access journal

Autor(es)

Rhauani Weber Aita Fazul

Laboratório de Sistema de Computação (LSC) Universidade Federal de Santa Maria (UFSM) Santa Maria – RS
Paulo Vinicius Cardoso

Pós-Graduação em Ciência da Computação (PGCC) Universidade Federal de Santa Maria (UFSM) Santa Maria – RS
PatrÄ±cia Pitthan Barcelos

Pós-Graduação em Ciência da Computação (PGCC) Universidade Federal de Santa Maria (UFSM) Santa Maria – RS

PDF

Edição
v. 10 (2019)

Seção
Artigos Completos

Portal de Periódicos

Anais do Computer on the Beach

Portal de Periódicos

Pesquisa

Análise do Impacto da Replicação de Dados Implementada pelo Apache Hadoop no Balanceamento de Carga

Anais do Computer on the Beach