31.4 C
São Paulo
6 de fevereiro de 2025

O fim do rastreamento de rotas

<p>Agora estamos colocando todas as nossas apostas na nuvem, em SaaS e na TI híbrida, e ferramentas respeitáveis tão básicas quanto o rastreamento de rotas estão se tornando obsoletas. Como os administradores, que têm cada vez menos autoridade administrativa, podem solucionar problemas de serviços em ambiente cada vez mais opacos? <br /><br /><strong>A corrida até a opacidade</strong><br />Uma das funções mais sedutoras da nuvem e de SaaS é um anátema histórico para engenheiros, mas é muito empolgante para gerentes de TI: ¨há menos a ser gerenciado.¨ Não há nada inerentemente errado em migrar serviços importante para uma abordagem de SLA confidimus: em SLAs nós confiamos. A promessa é bem intencionada, e os provedores de serviço geralmente fazem todo o possível para satisfazer os clientes… na maior parte. <br />O problema é que os engenheiros de rede ainda são os responsáveis por garantir que o usuário tenha uma boa experiência. E isso está acontecendo ao mesmo tempo em que eles concordam em reverter décadas de progresso em direção ao monitoramento avançado. As equipes de TI estão aceitando colocar sistemas que são a base do sucesso dos negócios em locais onde elas têm pouco ou nenhum acesso para solucionar problemas e têm opções limitadas de controle e geração de relatórios sobre o desempenho geral. E, como você provavelmente já descobriu, mesmo que a Amazon, a Google, a Salesforce e a Azure sejam boas e estejam cada vez melhores, elas certamente não têm infraestruturas ilimitadas imunes a falhas. Essas empresas estão sujeitas às mesmas leis da física que nossos datacenters, e tíquetes da central de ajuda ainda estão sendo abertos. <br /><br /><strong>APIs substituem SNMP</strong><br />Por vários muito bons motivos, os provedores de nuvem não abrem seus firewalls nem permitem que monitoremos suas infraestruturas definidas por software. Em vez disso, somos forçados a confiar neles para fornecer APIs de gerenciamento e ferramentas proprietárias que nos forneçam algum grau de supervisão. Mas essas interfaces não contêm nem parte das informações a que estamos acostumados em nossos datacenters; elas não são fáceis de usar; e nenhuma delas oferece agnosticismo e ubiquidade de plataformas do ICMP, do SNMP e de outros protocolos. Mas elas abrem completamente caminhos específicos para o tráfego de aplicativos.<br /><br />Mesmo em nossas redes internas, o rastreamento de rotas e o ping enfrentam limites para solucionar problemas de desempenho de rede entre usuários e servidores devido à multiplicidade de rotas. O rastreamento de rotas pressupõe que o caminho entre um observador e um serviço seja linear e, consequentemente, retorna um caminho de roteamento aproximado para esse teste. Com redes de TI híbridas, o roteamento da Internet multiplica enormemente o problema com multihoming interconectado e adiciona impedâncias para tráfego de UDP ou ICMP. Então, como é possível isolar a causa da queda no desempenho da Salesforce quando o problema pode ser a grande latência em um dos quatro links que carregam 25% do tráfego de aplicativos?<br /><br /><strong>Encantador de firewalls</strong><br />A resposta é parar de pensar nas redes internas, tão cuidadosamente projetadas, e começar a pensar na internet. Com as redes internas, eliminamos o máximo de incertezas possível; já a internet depende da incerteza de rotas controlada para obter robustez. Se pensar em um pacote específico de aplicativo, você poderá procurar várias rotas possíveis em diversas dimensões, inclusive tempo, por todo o caminho do tráfego, do usuário ao servidor de nuvem. Essa técnica não oferece uma gratificação tão imediata quanto o rastreamento de rota (ela leva algum tempo para sondar e se difundir), mas os resultados são abrangentes e visuais.<br /><br />Embora o monitoramento baseado em sondagens de equipamentos no local vá continuar retornando informações críticas sobre as operações por alguns anos, o monitoramento visual de caminho nos ajuda a reaver grande parte da autoridade perdida na migração para redes de TI híbridas. Ele nos permite não apenas simplificar a detecção da causa-raiz dos problemas em nossas redes internas de mau funcionamento ou configuração incorreta, mas também estende a solução de problemas através da internet e para as redes dos provedores de serviço.<br /><br />Isso funciona porque as ferramentas modernas de monitoramento de caminhos de rede simulam tráfego específico de aplicativo, que passa por firewalls exatamente da mesma forma que o tráfego de usuário. Elas resolvem o problema do roteamento específico de protocolo ou porta por meio de balanceadores de carga encontrando os mesmos problemas de latência de links assimétricos com multihoming e revelam todos os saltos que podem interferir no desempenho do serviço. Em vez de reagir a um ícone vermelho em uma CPU de roteador, podemos reagir a um salto vermelho, onde quer que ele esteja. E quando isso acontecer dentro de uma nuvem ou uma rede de provedor de SaaS, poderemos contatar a central de ajuda deles com as informações necessárias para a resolução do problema, em vez de passar o dia todo esperando ociosamente que eles descubram como resolver a questão.<br /><br />Talvez, se pudermos recuperar a visibilidade de TI híbrida e manter os usuários satisfeitos, ¨menos a ser gerenciado¨ não seja tão ruim.<br /><br /><em>(*) Gerente técnico da SolarWinds</em><br /><br /><br /><br /></p>