Como funciona o Percentil 95?
O percentil 95 é uma métrica amplamente utilizada no monitoramento de redes e sistemas para entender o comportamento do tráfego de dados. Ele representa o valor abaixo do qual 95% de todas as amostras de dados se encontram. Em outras palavras, 5% das amostras de dados estão acima desse valor. É uma medida robusta, pois desconsidera os picos de tráfego mais extremos (os 5% superiores), que muitas vezes são anomalias ou eventos isolados, fornecendo uma visão mais realista do tráfego "normal" ou de pico sustentável.
Impacto da Granularidade da Amostragem no Percentil 95
No monitoramento de tráfego de dados, a granularidade da amostragem — ou seja, a frequência com que os dados são coletados — tem um impacto direto no valor do percentil 95. No experimento abaixo, observamos que o percentil 95 foi maior em monitoramentos com amostragem a cada 1 minuto em comparação com monitoramentos com amostragem a cada 5 minutos.
Isso ocorre devido à capacidade inerente da amostragem mais frequente de capturar variações mais rápidas e picos de uso. Vamos detalhar tecnicamente:
Amostragem a Cada 1 Minuto: Captura mais Precisa de Picos
Quando os dados são amostrados a cada 1 minuto, o sistema de monitoramento registra o tráfego de dados em intervalos muito curtos. Isso permite que ele capture com maior precisão os picos de uso transitórios e de curta duração. Imagine um cenário onde há um aumento abrupto no tráfego de dados por 30 segundos e depois ele retorna aos níveis normais. Uma amostragem a cada 1 minuto tem uma alta probabilidade de registrar esse pico, já que o intervalo de coleta possui um intervalo menor entre as amostras.
Amostragem a Cada 5 Minutos: Suavização dos Picos
Por outro lado, quando a amostragem é realizada a cada 5 minutos, o sistema calcula uma média do tráfego de dados ao longo de um período de 300 segundos. Essa média de tempo maior inerentemente suaviza os picos de uso. Se ocorrer um pico de tráfego de curta duração (por exemplo, 30 segundos) dentro de um intervalo de 5 minutos, seu impacto é diluído pela média dos 4 minutos e 30 segundos restantes de tráfego potencialmente mais baixo.
Em termos técnicos, cada amostra de 5 minutos é uma representação agregada do tráfego nesse intervalo. A menor frequência de amostragem resulta em um conjunto de dados mais "suavizado", onde as variações rápidas são menos perceptíveis. Os valores extremos (os picos) são "achatados" devido ao cálculo da média sobre um período mais longo, o que resulta em um percentil 95 menor. Isso não significa que os picos não existam, mas sim que a amostragem com menor granularidade não os registra com a mesma fidelidade.
Como exemplo, o gráfico abaixo possui um intervalo de amostragem a cada 30 minutos. A diferença do percentil 95 para as demais amostragens atenua consideravelmente:
Conclusão
A escolha da granularidade da amostragem em monitoramento de tráfego de dados é crucial e depende dos objetivos da análise. Para uma detecção precisa e oportuna de picos de uso e para entender a capacidade de explosão da rede, uma amostragem mais granular (como a cada 1 minuto) é preferível, mesmo que resulte em um percentil 95 mais alto. Isso fornece uma visão mais detalhada e fiel do comportamento da rede em momentos de alta demanda. Se o objetivo é ter uma visão mais consolidada e estável do tráfego médio e descartar flutuações muito rápidas, uma amostragem menos granular (como a cada 5 minutos) pode ser suficiente. É importante estar ciente de que amostras com intervalos grandes pode subestimar a magnitude real dos picos de uso.
Contato
Monsta Tecnologia Ltda
Site: http://www.monsta.com.br
Downloads: http://www.monsta.com.br/download.html
E-mail: contato@monsta.com.br