Com a guia APM Group errors você pode filtrar e agrupar erros dinamicamente para uma análise mais profunda.
Visualização da lista de erros
Comece com os gráficos de taxa de erros para ver rapidamente se há picos, quedas ou padrões inesperados com erros em geral.
Correlacione quaisquer padrões gerais no gráfico dos 5 principais erros com alertas ocorridos durante o mesmo período.
Dynamic grouping:
O agrupamento padrão para ocorrências de erro é baseado na mensagem de erro, na classe de erro e no nome da interface de transação. Você tem a opção de alterar as opções de agrupamento por qualquer atributo, até cinco atributos por vez.
Filtering:
Muitos clientes da New Relic instrumento atributo personalizado. Filtrar um atributo personalizado específico pode ser uma maneira rápida de eliminar o ruído de todas as ocorrências de erros.
Perfis de erro
Perfis de erro podem ajudá-lo a responder perguntas como: qual usuário foi mais comum em todos os eventos de erro durante o intervalo de tempo selecionado? Ou qual sessão foi mais comum em todos os eventos de erro durante o intervalo de tempo selecionado?
Clique em Attribute profiles para expandir para perfis individuais.
Visualização de detalhes de erros
Nesta página, você pode se aprofundar em um grupo de erros específico: Talvez você tenha identificado um grupo específico de hosts que está causando um pico de erros. A visualização detalhada fornece detalhes contextualizados.
Na visualização detalhada, você pode percorrer erros específicos usando o botão de alternância no canto superior direito para navegar entre a primeira instância do erro, a última ou qualquer instância intermediária.
Na parte superior da página de detalhes, você pode inspecionar os campos Filtered e Grouped By para ver como as informações foram filtradas e agrupadas. Você pode receber um link permanente de uma ocorrência específica. É importante conhecer os filtros e seleções de agrupamento para entender o contexto da ocorrência.
Guia Ocorrências
A guia Occurrences inclui não apenas frequência de erros, detalhes de ocorrências e rastreamento de pilha, mas também informações de triagem e rastreamento distribuído relacionado.
Seção de triagem
A seção de triagem vincula a ocorrência de erro específica que você está visualizando a um grupo de erros criado pelo sistema que possui uma impressão digital exclusiva. Por que isso importa? Essa impressão digital exclusiva permite fazer a triagem de um grupo de erros usando uma atualização ou atribuição de status . Os grupos de erros criados pelo sistema são aqueles que você encontra na guia Triage . Para obter mais informações sobre como eles são gerados, consulte Como funcionam os grupos de erros.
Distributed tracing
Se você configurou distributed tracing e se houver amostras de rastreamento relacionadas a erros, você verá opções para visualizar detalhes trace . Esta é uma maneira rápida de visualizar informações trace sem acessar a página principal distributed tracing :
No painel esquerdo denominado Distributed traces, você pode expandir o cabeçalho para mostrar uma lista de todos os rastreamentos associados a erros neste grupo de erros. Alternativamente, você pode clicar em Explore all para abrir uma lista de todos os rastreamentos.
No painel direito denominado Distributed trace, você verá o trace associado à ocorrência de erro exibida nesta página. Para ver os intervalos do trace em uma visualização em cascata:
Clique diretamente no nome do trace ou clique no ícone com uma seta à direita, que abre a visualização de foco em cascata que destaca extensões trace com erros.
Clique em Explore para abrir uma cascata não filtrada onde você pode clicar em todos os trechos.
Selecione o período de tempo para dados de erro
Use o seletor de hora para examinar os detalhes do evento de erro na última semana, mês ou outro intervalo de tempo.
Os dados de eventos de erro na guia
Group errors
estão disponíveis para uma janela de dados coletados de até sete dias nos últimos oito dias.
Os metadados de eventos de erro na guia
Triage
são armazenados por até 13 meses.
Você poderá notar pequenas diferenças na contagem se a janela de tempo estiver definida como "terminando agora". Isso ocorre porque as contagens da lista e da tabela podem ser solicitadas em momentos ligeiramente diferentes à medida que a página é atualizada automaticamente.
Erro esperado
Reduza erros barulhentos marcando-os como “erro esperado”. Tais erros não afetarão a taxa de erro reportada ou a Apdex métrica. Para obter mais detalhes, consulte Gerenciar erros.
Erro esperado não são mostrados por padrão na guia Group errors . Você pode exibi-los ativando o botão Show N expected errors abaixo da barra Group by .
Erros fora da transação
Usando a API do agente New Relic, você pode registrar erros personalizados em qualquer ponto da execução do seu código. Às vezes, esses erros personalizados ocorrerão quando uma transação não estiver em execução, como em código assíncrono de alto volume que não processa uma transação HTTP.
Os erros fora das transações são mostrados por padrão na aba Group errors , mas se quiser visualizar apenas os erros fora da transação, aplique o seguinte filtro:
NomeDaTransação = “Desconhecido”
Exclusão de rastreamento de erro
Se você precisar excluir qualquer informação sensível da experiência de erros, recomendamos que você envie uma solicitação para remover dados pessoais.
Dados de erro
Tipos de dados de erro: detalhes de evento e trace
Por padrão, nosso agente APM coleta dois tipos de dados de erro: detalhes de evento e trace .
Evento
O tipo de dados do evento de erro inclui o atributo padrão, bem como qualquer atributo instrumento personalizado em seu serviço. Não inclui um stack trace.
Evento estão sujeitos a amostragem (consulte Limites para relatórios de erros e Gráficos de taxa de erros e contagens). Para obter mais informações sobre dados de eventos de erro, consulte evento relatado pelo APM.
Detalhes trace
O tipo de dados de erro de detalhes trace inclui rastreamento de pilha e atributo e complementa o evento com mais dados. Espera-se que mais eventos sejam relatados do que detalhes trace – consulte Limites no relatório de erros.
Show only errors with stack trace está habilitado por padrão, para restringir os erros mostrados apenas àqueles que possuem esse tipo de dados coletados.
Esses dados são regidos por regras de retenção específicas para detalhes de erros.
Limites no relatório de erros
O New Relic limita o relatório de erros em:
- 100 eventos por minuto por instância de agente
- 20 detalhes trace por minuto por instância de agente
Esses limites evitam que o relatório de erros afete negativamente o desempenho do aplicativo.
Exemplos:
Aplicativo rodando em cinco instâncias do EC2, uma JVM cada. O New Relic limita o relatório de erros em:
- 100 eventos por minuto x 5 instâncias = 500 eventos por minuto
- 20 detalhes trace por minuto x 5 instâncias = 100 detalhes trace por minuto
Aplicativo rodando em um host com dez instâncias. O New Relic limita o relatório de erros em:
- 100 eventos por minuto x 10 instâncias = 1000 eventos por minuto
- 20 detalhes trace por minuto x 10 instâncias = 200 eventos por minuto
Mapeando taxas de erros e contagens
O Error rate chart é orientado por uma consulta em dados de métrica de fração de tempo, que é um tipo de dados agregados sem amostragem que é preciso, mas tem dimensionalidade muito limitada. Esses dados não podem ser facetados ou filtrados com a mesma flexibilidade que os dados de eventos de erro.
Você pode reproduzir esse gráfico em um dashboard ou explorar mais detalhadamente os dados da métrica de fração de tempo clicando no menu ... em Error rate chart e usando as opções View query ou Add to dashboard.
Para traçar contagens de erros facetados usando dados de eventos, como no gráfico dos 5 principais erros, use uma consulta de evento NRQL. Clique no menu ... no gráfico dos 5 principais erros e escolha View query como ponto de partida na criação do seu gráfico.
Como os dados do evento podem ser amostrados (consulte Limites no relatório de erros), você pode usar a palavra-chave EXTRAPOLATE para obter uma contagem de erros precisa, mesmo se a amostragem estiver ocorrendo.
Relatar erros personalizados
Você pode reportar erros não coletados por padrão com nosso agente usando nossa API do agente. Para mais informações, consulte a documentação da API.
Erro ignorado
Você pode evitar que certos erros que normalmente seriam relatados ao New Relic sejam coletados usando nossa API do agente ou a UI de configuração no lado do servidor. Para obter mais detalhes, consulte Gerenciar erros no APM.
Reduza o ruído com erro esperado
Às vezes, você deseja coletar dados de erros, mas não permite que esses erros o despertem por meio de alerta. Usando a API do agente, você pode marcar esses erros como “esperados”. Eles ainda estarão visíveis na página Erros, mas não afetarão a taxa de erros do seu serviço ou Apdex métrica.
Desativar rastreamento de erros
Para evitar que certos erros sejam relatados à New Relic, desative-os no arquivo de configuração do seu agente. Para a maioria dos agentes, você pode ignorar certos códigos de erro ou desabilitar os erros completamente. Para obter mais informações, consulte a documentação de configuração específica do seu agente: