Apache Impala: My Insights and Best Practices

Como fizemos o nosso Impala correr mais rápido?

Então você tem o seu Hadoop, terabytes de dados estão a entrar nele por dia, ETLs são feitos 24/7 com Centelha, Colmeia ou Deus nos livre – Porco. E depois os dados estão na forma exata que você quer que estejam (ou mesmo antes disso) e tudo é perfeito – os analistas querem consultá-los. Se você escolheu Impala para essa missão, este artigo é para você.

Apache Impala: My Insights and Best Practices

Como fizemos o nosso Impala correr mais rápido?

O que é Impala?

Impala Vs. Outras Soluções SQL-on-Hadoop

Impala Vs. SparkSQL

Impala Vs. Presto

Impala Best Practices

Work With Partitions

A declaração REFRESH

Estatísticas de Cálculo

Optimal File Size – 256MB/File

Configure Coordinators & Executors Per Daemon

Tipos de dados das colunas

Impala Query Limits

Sumário

Deixe uma resposta Cancelar resposta