Fala galera, beleza? Vamos falar um pouquinho sobre observabilidade, galera. Observabilidade, alertas, etc. Eu queria falar um pouco com vocês sobre o CloudWatch. A maior parte das pessoas falham muito em observabilidade. Quantas vezes eu vi a gente colocar coisa em produção, coisa para o cliente usar em vários lugares e o pessoal esquecer do principal, de como que a gente vai ver se está tudo certo. Normalmente a galera coloca uma observabilidade pífia ou não coloca, ou coloca só dashboards e não coloca alertas, por exemplo. Então é importante a gente pensar como a gente vai assistir esse sistema funcionando. Não adianta nada a gente ter um sistema sensacional e a gente não conseguir entender como as coisas estão acontecendo, não conseguir fazer nenhum tipo de ação quando estiver tendo problema no nosso sistema ou para entender como ele está reagindo ao dia a dia. Então, mais importante do que qualquer coisa é a observabilidade. Eu costumo brincar que quando a gente não coloca alertas, não coloca observabilidade, não coloca nada que a gente consiga monitorar o nosso sistema, seria a mesma coisa que você sair com um avião sem o painel de instrumentos dele. Você sabe que você vai voar, você só não sabe por quanto tempo. Com certeza você vai subir, mas você não sabe se o seu combustível está bom, se o avião está tudo bem, se as coisas estão certas. Você só sabe que ele está voando. Aí uma hora ele pode ter parado ali, você cai, morre todo mundo e você não tinha nem notado. Então não dá para brincar com isso, sinceramente. Quando a gente está olhando para a produção, quando a gente está olhando para o ambiente que está tendo contato com o cliente, a gente precisa se preparar para isso. Então ter uma observabilidade, um monitoramento decente é muito importante. e um monitoramento decente é muito importante. Outra coisa também, a maior parte das vezes isso acontece porque as lideranças, os PMs e o próprio time acabam colocando uma coisa muito interessante, que é assim, colocar o produto ou o sistema em produção é mais importante do que observá-lo. Então a gente pode fazer em duas vezes, MVP, vou fazer uma MVP, eu coloco sem observabilidade e depois eu ponho a observabilidade. Bom, pois bem, isso não é MVP. MVP é o mínimo produto viável. Se você coloca um MVP onde você não tem uma observabilidade, não é um MVP. É um produto capenga, tá? Então é muito diferente. Então não sigam essa linha. Desculpa essa introdução mais chata, mas a gente tem que prestar atenção nisso, eu queria só dar aqui o alerta pra vocês não caírem nessa vocês, com os times de vocês, vocês como liderança, dêem um exemplo de que a gente precisa ter isso, olhem os dashboards, olhem as alertas antes de subir as coisas, antes de começar a usar isso no dia a dia mas vamos lá, a gente vai falar um pouquinho do CloudWatch. CloudWatch é similar a um Datadog, a um Splunk, a esse tipo de ferramenta. Então, basicamente, a gente está falando de ferramentas de monitoramento e observabilidade. Ele vai ser usado ali dentro da AWS, então esse cara é da AWS, a gente usa ele ali dentro para você coletar e monitorar as suas aplicações, os recursos que você está usando ali na w então durante todo o tempo falando pra vocês aqui pouco coloca isso para observar no quadro ótimo não esquece que você tem que colocar essa outra ferramenta no código ótimo por diante basicamente vai conseguir fazer a citar e a leitura de de dos eventos que estão acontecendo e e monitorar como é que seus recursos da AWS estão indo, tanto em infra quanto em lógica de negócio, tá? Então a gente consegue ficar monitorando tudo isso, a aplicação ali personalizada em tempo real. Ele vai te ajudar ali a ter insights operacionais e para você resolver os problemas e detectar os problemas quando eles estiverem acontecendo, beleza? Você consegue também automatizar as ações com base nos dados coletados coisa que também muita gente não faz nem sempre você precisa ser alarmado e atuar você às vezes pode deixar isso já preparado no sistema para ele fazer sozinho também acho que é até melhor porque eu tenho mesmo mttr ou seja o seu tempo é para resolver um problema, para você que não conhece o MTTR, é o time to repair. O tempo que você demora para descobrir um problema e resolver aquele problema. Beleza? Então, a gente está falando aqui de diminuir isso. Quando você automatiza as suas ações ali, baseadas nos dados que você está gerando, esse MTTR tem a tendência de diminuir bastante. Beleza? Vamos lá. Então, como eu falei, ele vai coletar automaticamente as métricas de vários dos serviços da AWS e vai enviar essas métricas para o CloudWatch. O que a gente pode visualizar por monitoração, ou seja, você pode ter dashboards ou definir alarmes ali. E agora eu vou mostrar para vocês um pouco de como isso funciona. Imagina que a gente está falando de métricas primeiro. Então no Amazon EC2, vou dar alguns exemplos. Você pode olhar, por exemplo, a métrica de percentual de uso do CPU, beleza? Aí você vai estar sabendo quanto que está isso aqui e pode tomar uma decisão. Dependendo do percentual de uso da CPU, você pode alarmar alguma coisa ou pode até disparar algum lambda que vai executar alguma ação por exemplo, você tem também o número de operações de leitura do disco, se você tiver muita leitura acontecendo e isso for um problema, você também pode alarmar outra coisa que você pode também fazer é o contrário não está tendo nenhuma operação sendo lida, pô estranho né então você pode colocar também alertas de não utilização, o que é importante também. Você pode também ver como é que está a sua rede, como é que ela está trafegando, e a mesma coisa. Imagina que seu EC2 começou a ter zero de tráfego de rede. Estranho, né? Alguma coisa pode estar acontecendo. Então, é interessante a gente colocar alertas tanto para quando está tendo muito quanto quando está tendo pouco. É simplesmente pensar no que não é comum. A gente deve rodar no comum. Tem o RDS também. Quando a gente está falando do RDS, por exemplo, você também pode colocar o uso da CPU, número de conexões no banco de dados. Aqui o número de conexões no banco de dados eu vejo muita gente falhando também. Abre muita thread às vezes, elas ficam ali abertas, a gente não, por alguns motivos, a gente programou errado e não fecha. Então esse cara aqui acaba derrubando muita gente, tá? Mas quando a gente tá falando de sistemas escaláveis, a gente às vezes começa a escalar ali um monte de máquina, beleza? Um monte de máquina começa ali, de EC2 começa a subir, você começa a aumentar o pool de conexões com o banco, o banco começa a ficar cheio de conexão, topa e você nem vê. Então olhar esse número de conexões com o banco é importante até para você ver se você está tendo lixo de conexão, conexão que abriu e não fechou, algum maluco colocou um slip no meio de uma conexão ali, então é importante a gente olhar esse cara também. Outra coisa também que é legal a gente olhar esse cara também. Outra coisa também que é legal a gente olhar ali é o espaço de armazenamento para ver quanto você ainda tem, se está tudo bem ou se o seu RDS precisa ser repensado e assim por diante. Amazon S3, vou colocar aqui alguns exemplos para vocês também, você pode olhar ali o tamanho do bucket, você pode ver se está tendo muitos objetos ali no bucket, pô, está enchendo muito ele, você pode ver o número total de solicitações que estão rolando para entender se esse cara está aguentando e coisas nesse sentido também que é bem interessante. O AWS Lambda, você pode olhar o número de invocações, ou seja, se estava ali preparado para receber 10 mil e está tendo 5 milhões. É legal você olhar isso também. E a duração das execuções ali também. E o melhor de tudo, o número de execuções ali que elas estão retornando o erro também. É importante olhar. Porque eles são só exemplos. Lógico que tem uma porrada de coisa que você pode olhar. Vou dar outro exemplo de coisa. Por exemplo, a WSLambda, ele é um serverless. Ele vai estar subindo ali a aplicação e vai estar respondendo as chamadas que estão rolando. Você colocar alertas, até para ver seu Finops é interessante. Porque imagina que começa a subir Lambda para cacete lá e daí depois vem uma conta super cara para você. Então, colocar alertas, inclusive, que conseguem preparar o seu Finops para você não tomar nenhuma pancada depois em questão de faturamento é importante também tomar água que eu tô com a garganta meio complicado hoje vamos seguir lá aqui eu coloquei pra vocês é um do dashboard da aws que você pega no próprio site da aws um bem simples não tem nada demais nesse aqui é um dashboard de métrica bastante simples bastante simples que ele está aqui olhando vários vários produtos da aws se você olhar e colocando os alarmes assim por diante não tem nada demais é um bem simples um bem basicão mas só para vocês olharem mais ou menos a carinha de como é o cloudwatch como é que você pode acompanhar as coisas que estão rolando ali beleza