Page tree

Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Info
titleResumo sobre observabilidade, objetivo da página e links de referência

Observabilidade, neste contexto, refere-se à análise de saídas do sistema para determinar seu comportamento. Esta página tem como objetivo fornecer insumos para clientes que não possuam uma equipe de infraestrutura dedicada para desenvolver este conceito.

A seguir, os links que foram utilizados como referência ou podem auxiliar no entendimento do conteúdo como um todo:

Teoria Geral da Observabilidade (pdf, em inglês)

Observabilidade é um conceito criado na área da Engenharia, sendo um termo recente para o setor de tecnologia. O conceito inicial foi desenvolvido pelo engenheiro elétrico, matemático e inventor Rudolf E. Kálmán. De maneira extremamente resumida e para facilitar o entendimento sobre a Teoria Geral da Observabilidade, Kalman a define com a frase “um sistema é completamente observável se todo constate for observável”. A leitura da teoria é recomendada caso queira se aprofundar no assunto.

De acordo com esta definição temos, de maneira menos formalinformalmente, o seguinte resumo sobre observabilidade: "A partir de saídas do sistema é possível determinar o comportamento de todo o sistema.". 

Como desenvolver esse conceito? 

Na área de tecnologia , esse conceito tem sido desenvolvido, principalmente, por grandes corporações, onde os sistemas operantes não podem parar, ou o downtime deve ser o mínimo possível em sua extensa gama de serviços e microsserviços.

...

O investimento para manter um sistema disponível 99,99% do tempo ativo, engloba soluções de High Availability (HA) e Desaster Recovery (DR).


E para o Protheus, como tudo isso funciona?

Agora vamos à prática, em um cenário hipotético de apenas 100 conexões no Protheus.

Se o seu MTTR for de 24 horas, posso pensar em um dimensionamento com o hardware mínimo recomendável para o ambiente ERP, onde precisamos de 2 servidores físicos, virtualizados ou em nuvem.

Porém, se falamos de um MTTR de 1 min, vamos precisar de no mínimo 4 servidores no cenário básico de HA e DR, e em cenários mais complexos, 8 servidores para atender às mesmas 100 conexões. 

Para “cuidar” desses ambientes, seja o formato mais simples ou mais complexo, usando o conceito de observabilidade, vamos começar pelo bom e conhecido monitoramento, depois partimos para análise de logs e tracert.

Na observabilidade, utilizaremos uma tríade muito importante para aplicar esse conceito: logs, traces e métricas.

Temos diversas ferramentas que podem coletar e apresentar esses dados.