Importante
Habilite a integração do AWS CloudWatch Metric Streams para monitor todas as métricas do CloudWatch de seus serviços da AWS, incluindo namespace personalizado. A integração individual não é mais nossa opção recomendada.
A integração da infraestrutura da New Relic inclui uma integração para relatar seus dados do Amazon EMR (Elastic MapReduce) para a New Relic. Este documento explica como ativar essa integração e descreve os dados que podem ser relatados.
Recurso
Você pode monitor e alertar sobre seus dados EMR diretamente do New Relic, consultar dados e criar um painel.
Ativar integração
Para habilitar essa integração, siga os procedimentos padrão para conectar os serviços da AWS ao New Relic.
Configuração e polling
Você pode alterar a frequência de pesquisa e filtrar dados usando opções de configuração.
Informações de pesquisa padrão para a integração do Amazon EMR:
- Intervalo de sondagem New Relic : 5 minutos
 - Resolução: 1 ponto de dados a cada 5 minutos
 
Explore dados de integração
Para usar seus dados de integração, acesse one.newrelic.com > All capabilities > Infrastructure > AWS e selecione um dos links de integração do EMR.
Você pode consultar e explorar seus dados usando o tipo de evento ElasticMapReduceClusterSample , com um valor provider de ElasticMapReduceCluster.
Dados métricos
Essa integração coleta os seguintes dados do Amazon EMR. Para casos de uso e informações adicionais, consulte a documentação do EMR da Amazon.
Nome  | Descrição  | 
|---|---|
  | Indica que um cluster não está mais executando trabalho, mas ainda está ativo e acumulando cobranças. É definido como 1 se nenhuma tarefa estiver em execução e nenhum trabalho estiver em execução, e definido como 0 caso contrário. Esse valor é verificado em intervalos de cinco minutos, e um valor 1 indica apenas que o cluster estava inativo quando verificado, e não que ficou inativo durante os cinco minutos inteiros. Recomendação: Para evitar falso positivo, aumente um limite de alerta quando este valor for 1 por mais de uma verificação consecutiva de cinco minutos. Por exemplo, gere um alerta sobre esse valor se ele tiver sido 1 por trinta minutos ou mais.  | 
  | O número de nós principais funcionando. Os pontos de dados para esta métrica são reportados apenas quando existe um grupo de instâncias correspondente.  | 
  | O número de nós principais aguardando para serem atribuídos. Todos os nós principais solicitados podem não estar disponíveis imediatamente; esta métrica relata as solicitações pendentes. Os pontos de dados para esta métrica são reportados apenas quando existe um grupo de instâncias correspondente.  | 
  | A porcentagem de nós de dados que estão recebendo trabalho do Hadoop.  | 
  | O número de bytes gravados no Amazon S3. Esta métrica agrega apenas trabalhos MapReduce. Não se aplica a outras cargas de trabalho no EMR.  | 
  | O número de bytes lidos do Amazon S3. Esta métrica agrega apenas trabalhos MapReduce e não se aplica a outras cargas de trabalho no EMR.  | 
  | A porcentagem de armazenamento HDFS usado atualmente.  | 
  | O número de bytes lidos do HDFS.  | 
  | O número de bytes gravados no HDFS.  | 
  | O número de blocos nos quais o HDFS não possui réplicas. Estes podem ser blocos corrompidos.  | 
  | O número total atual de leitores e gravadores relatados por todos os DataNodes em um cluster.  | 
  | A quantidade de tempo que o backup anterior levou para ser concluído. Essa métrica é definida independentemente de o último backup concluído ter sido bem-sucedido ou falhar. Enquanto o backup estiver em andamento, essa métrica retornará o número de minutos após o início do backup. Esta métrica é reportada apenas para cluster HBase.  | 
  | O número de minutos decorridos após o último backup bem-sucedido do HBase ter sido iniciado em seu cluster. Esta métrica é reportada apenas para cluster HBase.  | 
As seguintes métricas aparecem na amostra dependendo da versão Hadoop do recurso.
Métrica de AMIs do Hadoop 1
Nome  | Descrição  | 
|---|---|
  | O número de trabalhos no cluster que estão em execução no momento.  | 
  | O número de trabalhos no cluster que falharam.  | 
  | O número de tarefas de mapa em execução para cada trabalho. Se você tiver um planejador instalado e vários trabalhos em execução, vários gráficos serão gerados.  | 
  | O número de tarefas de mapa restantes para cada trabalho. Se você tiver um planejador instalado e vários trabalhos em execução, vários gráficos serão gerados. Uma tarefa de mapa restante é aquela que não está em nenhum dos seguintes estados:   | 
  | A capacidade de tarefa de mapa não utilizada. Isso é calculado como o número máximo de tarefas de mapa para um determinado cluster, menos o número total de tarefas de mapa atualmente em execução nesse cluster.  | 
  | A proporção entre o total de tarefas de mapa restantes e o total de slots de mapa disponíveis no cluster.  | 
  | O número de tarefas de redução em execução para cada trabalho. Se você tiver um planejador instalado e vários trabalhos em execução, vários gráficos serão gerados.  | 
  | O número de tarefas de redução em execução para cada trabalho. Se você tiver um planejador instalado e vários trabalhos em execução, vários gráficos serão gerados.  | 
  | Não utilizados reduzem a capacidade da tarefa. Isso é calculado como a capacidade máxima de redução de tarefas para um determinado cluster, menos o número de tarefas de redução atualmente em execução nesse cluster.  | 
  | O número de nós de tarefa em funcionamento. Os pontos de dados para esta métrica são reportados apenas quando existe um grupo de instâncias correspondente.  | 
  | O número de nós principais aguardando para serem atribuídos. Todos os nós de tarefas solicitados podem não estar imediatamente disponíveis; esta métrica relata as solicitações pendentes. Os pontos de dados para esta métrica são reportados apenas quando existe um grupo de instâncias correspondente.  | 
  | A porcentagem de rastreadores de tarefas funcionais.  | 
  | Se o último backup falhou. Isso é definido como 0 por padrão e atualizado para 1 se a tentativa de backup anterior falhar. Esta métrica é reportada apenas para cluster HBase.  | 
Métrica de AMIs do Hadoop 2
Nome  | Descrição  | 
|---|---|
  | A quantidade de contêineres de recursos alocados pelo ResourceManager.  | 
  | A quantidade de contêineres de recursos alocados pelo ResourceManager.  | 
  | A quantidade de contêineres na fila que ainda não foram alocados.  | 
  | A relação entre contêineres pendentes e contêineres alocados.  | 
  | O número de aplicativos enviados ao YARN que foram concluídos.  | 
  | O número de aplicativos enviados ao YARN que não foram concluídos.  | 
  | O número de aplicativos enviados ao YARN que foram eliminados.  | 
  | O número de aplicativos enviados ao YARN que estão em estado pendente.  | 
  | O número de aplicativos enviados ao YARN que estão em execução.  | 
  | O número de aplicativos enviados ao YARN.  | 
  | O número de nós atualmente disponíveis para trabalhos MapReduce.  | 
  | O número de nós atualmente executando tarefas ou trabalhos do MapReduce.  | 
  | O número de nós alocados para MapReduce que foram marcados em estado LOST.  | 
  | O número de nós disponíveis para tarefas MapReduce marcadas em um estado UNHEALTHY.  | 
  | O número de nós alocados para o aplicativo MapReduce que foram marcados em um estado DECOMMISSIONED.  | 
  | O número de nós disponíveis para MapReduce que foram reinicializados e marcados em estado REBOOTED.  | 
  | O número de blocos que o HDFS relata como corrompidos.  | 
  | A quantidade total de memória no cluster.  | 
  | A quantidade de memória reservada.  | 
  | A quantidade de memória disponível para ser alocada.  | 
  | A quantidade de memória alocada para o cluster.  | 
  | A porcentagem de memória restante disponível para o YARN  | 
  | O número de blocos que precisam ser replicados uma ou mais vezes.  | 
  | O status da replicação de bloco: blocos sendo replicados, idade das solicitações de replicação e solicitações de replicação malsucedidas.  | 
  | A quantidade de capacidade restante do disco HDFS.  | 
  | Se o último backup falhou. Isso é definido como 0 por padrão e atualizado para 1 se a tentativa de backup anterior falhar. Esta métrica é reportada apenas para cluster HBase.  |