Incidente

Alguns são imprevisíveis, mas trabalhando com tecnologia e fazendo análises pós acontecimentos, é impressionante como aprendemos e validamos ações que poderiam ter sido realizadas de forma antecipada, pensando em prevenção.

E claro que também lembro que comentarista de jogo terminado é sempre um sucesso. O ponto aqui é menos criticar o estado atual, mas organizar e preparar o futuro próximo de um produto ou serviço.

O que se pode fazer para ser mais resiliente?
Para ter mais foco em prevenção?
E por assim dizer, mais previsível?

Alguns carros ganham uma percepção de qualidade, de não parada. A qualidade é presente e previsível. No caso de infraestrutura de sistemas de informação, olhamos a disponibilidade de um sistema, mas outras medições são importantes também: o tempo de recuperação de uma falha e o tempo entre falhas em um sistema.

E neste trabalho com sistemas, lembro de algumas frases, que me ajudam a manter a humildade e a calma na gestão de sistemas:

  • Não existe manter. Existe melhoria contínua.
  • Os resultados atingidos até ontem não significam nada hoje.
  • Planos de recuperação de sistemas não testados são apenas obras de ficção. Talvez sua equipe não consiga implementar algo parecido com o conceito de Chaos Monkey, mas pode ter um ciclo de atualizações de versões ou de componentes relacionados.
  • Uma infraestrutura não atualizada ou não exercitada com alguma frequência, se torna um risco. Atualizada podem ser componentes relacionados, versões de bibliotecas por exemplo. Exercitada envolve uma infraestrutura recebendo novas instalações de versões por exemplo.

Adiciona nesta lista os itens que fazem sentido para o seu dia a dia.

— Daniel Wildt

Venha junto! Consciência de tempo, projetos paralelos e apoio no seu caminho de aprendizagem, através do projeto A Filosofia da Tranquilidade! Olha também a newsletter e projetos do agora.