A integração do NVML com New Relic fornece insights valiosos sobre a utilização da GPU e a métrica de desempenho de seu aplicativo e sistemas, facilitando a otimização de recursos, a identificação de desempenho gargalo e a manutenção da estabilidade e eficiência geral em seu ambiente.
Depois de configurar a integração NVML com New Relic, veja seus dados em um dashboard pronto para uso.
Configure a integração NVML
Conclua as etapas a seguir para configurar a integração NVML:
Instalar o agente de infraestrutura
Para usar a integração NVML, primeiro é necessário instalar o agente de infraestrutura no mesmo host. O agente de infraestrutura monitora o próprio host, enquanto a integração nvml estende seu monitoramento com dados específicos do seu cluster gpu.
Use NRI-Flex para capturar métricas
O Flex vem junto com o agente New Relic Infrastructure . Você precisa configurar o NRI-Flex para nvml e criar um arquivo de configuração flexível. Siga esses passos:
Crie um arquivo chamado
nvml-config.yml
no caminho abaixo:- para Linux,
/etc/newrelic-infra/integrations.d
- para Windows,
C:\Program Files\New Relic\newrelic-infra\integrations.d\
- para Linux,
Use o trecho abaixo para atualizar seu arquivo de configuração chamado
nvml-config.yml
integrations:- name: nri-flex# interval: 30sconfig:name: NVMLexampleapis:- name: nvmlfile: <PATH_TO_METRIC_CSV_FILE>
Reinicie o agente de infraestrutura
Use as instruções em nossos documentos do agente de infraestrutura para reiniciar seu agente de infraestrutura. Este é um comando básico que deve funcionar para a maioria das pessoas:
$sudo systemctl restart newrelic-infra.service
Veja sua métrica nvml no New Relic
Depois de concluir a configuração acima, você poderá visualizar sua métrica usando nosso modelo dashboard pré-construído. Para acessar este dashboard:
Acesse one.newrelic.com > + Integrations & Agents.
Clique na guia do Dashboards .
Na caixa de pesquisa, digite
nvml
.Selecione-o e clique em Install.
Para instrumentar o nvml início rápido e ver métricas e alertas, você também pode acompanhar nossa página NVML início rápido clicando no botão
Install now
.Aqui está um exemplo de consulta para verificar o número de dispositivos na GPU:
SELECT latest(temperature_gpu) FROM nvmlSample TIMESERIES
Qual é o próximo?
Para saber mais sobre como construir uma consulta NRQL e gerar um painel, confira estes documentos:
Introdução ao criador de consulta para criação de consultas básicas e avançadas.
Introdução aos dashboards para personalizar seu dashboard e realizar diversas ações.
Gerencie seu dashboard para ajustar o
modo de exibição ou para adicionar mais conteúdo ao dashboard.