Ao criar uma condição, você define thresholds personalizados que determinam o que abrirá um evento de alerta. Este documento explica o que são limites e como defini-los.
Anomaly: um limite de anomalia usa dados passados para prever dinamicamente o comportamento dos dados no futuro próximo. Isso se ajustará ao longo do tempo à medida que aprende os padrões dos seus dados.
Exemplos de limite:
O tempo médio de resposta da web de um aplicativo é superior a 5 segundos por 15 minutos.
A taxa de erros por minuto de um aplicativo atinge 10% ou mais pelo menos uma vez a cada hora.
O tempo de resposta AJAX de um aplicativo se desvia um pouco do comportamento esperado.
Além de um nível de limite crítico, você também pode definir limites para um nível de alerta menos sério.
Visualize e atualize o limite das condições existentes
Para visualizar o limite de uma condição: encontre essa condição na interface. Para atualizar o limite, selecione o limite de uma condição e faça alterações.
Para saber mais sobre tipos específicos de alerta (como anomalia e NRQL), consulte Tipos de condições.
Você pode definir limites para dois níveis: crítico e aviso. Pelo menos um limite deve ser definido.
Nível limite
Detalhes
Crítico (vermelho)
Opcional. Isso abrirá um evento de alerta de nível de prioridade crítica e enviará notificações dependendo da configuração de preferência de criação de problemas da política e de qualquer fluxo de trabalho que você possa ter configurado. Limites de sinal perdido, quando acionados, também abrem eventos de alerta de nível de prioridade crítica. Veja abaixo para mais detalhes.
Aviso (amarelo)
Opcional. Isso abrirá um evento de alerta de alta prioridade e poderá enviar notificações, dependendo da configuração de preferência de criação de incidentes da política e de qualquer fluxo de trabalho que você tenha configurado. Use um limite de aviso se quiser monitorar quando o comportamento de um sistema for preocupante ou digno de nota, mas não importante o suficiente para exigir um limite de nível crítico.
Uma perda de sinal é um período de tempo em que nenhum dado é recebido pela New Relic. Isso pode ser o resultado de uma entidade ou serviço ficando offline, um problema com um agente ou coletor, ou problemas de rede em um data center ou na internet. Você pode usar a detecção de perda de sinal para criar um novo evento de alerta quando um sinal parar inesperadamente. Você também pode usar isso para determinar quando um serviço efêmero para e definir a ação para fechar quaisquer eventos de alerta abertos que existam para essa condição. Outra opção nas configurações de perda de sinal é ignorar a abertura de um evento de alerta quando se espera que um sinal termine. Consulte a documentação sobre perda de sinal para mais informações.
Talvez você também precise configurar a perda de sinal se estiver usando count(*) ou uniqueCount(*) em sua consulta. Consulte Condições NRQL e ordem de consulta das operações para obter mais detalhes.
Diferentes tipos de condições têm diferentes intervalos de tempo mínimos. Por exemplo, alguns tipos de condição têm um intervalo de tempo mínimo de 5 minutos (por exemplo, condição métrica do alerta) e outros têm um intervalo de tempo mínimo de 1 minuto (por exemplo, NRQL condição do alerta). O mesmo acontece com o intervalo de tempo máximo, onde o valor é de 120 minutos.
Para saber como definir isso por meio da interface do usuário, consulte instruções do Runbook.