O estratégia de dados, sob a qual os nossos bancos de dados estarão submetidos. Quero comentar com vocês três abordagens sobre duas dimensões, agilidade e vantagem competitiva para os negócios. Aqui eu trago um gráfico para a gente analisar entre dois eixos, agilidade, eixo vertical, eixo Y, e vantagem competitiva para o negócio no eixo horizontal, eixo X. Do ponto de vista de estratégia de dados, nós vamos encontrar, historicamente, três grandes abordagens. A primeira dessas abordagens são os modelos semânticos, que tem tudo a ver com o que nós discutimos até agora sobre data warehouses e sobre os bancos de dados que suportam implementações de data warehouses. Vamos lembrar que, no começo desse tipo de implementação de Data Warehouse, o banco de dados relacional foi um grande motor desse tipo de implementação e que adotou uma modelagem de dados mais relaxada, aceitando denormalizações. E como vimos no conceito de Data Warehouse, existe toda a necessidade de preparação prévia dos dados ingeridos para que estes sejam consumidos. E essa preparação ao respectivo consumo, seja um consumo de relatório, de painel gerencial ou uma montagem de um data frame para um modelo de machine learning, essa preparação é entendida como um modelo semântico, um modelo de compreensão. Ou seja, como que nós conseguimos compreender estes dados que estão armazenados no Waterhouse, conseguir trazer contexto e unidade de análise para que isso se transforme em informação. Então, esta modelagem semântica, esta modelagem de compreensão, tem como principal benefício a governança fortalecida, porque como o dado já foi previamente preparado antes do seu consumo, já está tudo mapeado de como essa informação será utilizada, o seu conteúdo, o seu nível de qualidade. Então, essa primeira onda em relação à agilidade e vantagem competitiva para o negócio, acaba correspondendo também às ondas de implementação de data warehouses. Entretanto, como nós já comentamos no tópico sobre a fama do data warehouse, em algum momento, essa implementação entrega menos vantagem competitiva para o negócio. Seja porque ela fica menos ágil, porque o seu projeto demora mais tempo a ser executado, ou por qualquer outra razão que impeça as organizações de obterem mais vantagem competitiva. Então, como resposta aos modelos semânticos, e na verdade eu diria até como um complemento, nós temos uma segunda onda, que é a onda de autosserviço. temos uma segunda onda que é a onda de autosserviço. Olhando para o que nós discutimos até agora, a palavra autosserviço já aparece quando nós discutimos o tema de data lake, por conta de uma ingestão imediata da sua forma original e bruta dos dados e o preparo a ser realizado no momento do seu consumo, conforme e quando isto for necessário. Então, o autosserviço é justamente a capacidade que os usuários têm de conseguir realizar as suas análises de negócio, as suas consultas, obter os insights necessários, sem o apoio de terceiros, especificamente, sem o apoio de um departamento de tecnologia da informação, de um departamento de BI, de um departamento de ciência de dados. Então, quando nós falamos de autosserviço, estamos falando do empoderamento do usuário final. Nós podemos perceber o autosserviço, sobretudo, na camada de visualização de dados, quando os usuários têm a opção de customizarem seus relatórios, trocarem dimensões, derivarem métricas. Então, todas essas funcionalidades que permitem que as pessoas façam as análises sozinhas, sem a dependência de terceiros, estamos falando de autosserviços. É a produtividade e o empoderamento do usuário. Percebemos bastante isso na camada de visualização, mas isso também está preparado na camada de data warehouse, com o modelo dimensional de dados. Nas implementações modernas de NoSQL, como as famosas visões 360 que já trazem este dado já preparado, ou seja, aqui eu estou falando da camada ouro de um Data Lake ou de uma Lake House, porém também chega um ponto em que essa abordagem começa a perder agilidade ou deixar de ser ágil e deixar de entregar vantagem competitiva para o negócio. Então, como consequência, como complemento, como resposta a essas restrições, nós temos o empoderamento aqui da inteligência artificial e temos diferentes ondas. Falei já de Machine Learning, que foi uma primeira onda, isso depois evoluiu para o Deep Learning. Atualmente, no momento que eu estou gravando este vídeo, está quentíssimo o tema dos LLMs, os modelos de linguagem, grandes modelos de linguagem, e consequentemente o uso de vetorização sobre estas informações. Então, com inteligência artificial, o principal ponto aqui é a gente entender que são mecanismos que permitem identificar padrões que pessoas não conseguem fazer isso, é humanamente impossível detectar padrões desses dados em um grande volume. Então, todas essas abordagens que eu comentei de inteligência artificial, seja o machine learning, o deep learning, os vetorizadores, os encoders atuais, tudo isso também faz parte aqui de ser mais ágil e trazer uma vantagem competitiva para o negócio. Eu, pessoalmente, já encontrei clientes que estão em diferentes pontos destas três ondas. Já passei por clientes que estavam completamente trabalhando com modelos semânticos, muitos clientes trabalhando com autosserviço, outros clientes com inteligência artificial. E também passei por clientes que estão com um pé em cada uma destas abordagens. Aqui não são abordagens excludentes, são abordagens complementares. Ainda é importante destacar que tudo isso já existia antes da era nuvem. É claro que com a popularização dos serviços em nuvem, todos esses serviços foram ficando cada vez mais modernos, mais democráticos, principalmente pensando em nuvem pública. As nuvens públicas dão acesso às pessoas e organizações de qualquer tamanho, às tecnologias de ponta, aos métodos de trabalho de dados mais atuais. Então, consequentemente, nos serviços em nuvem, nós vamos encontrar serviços capazes de entregar modelos semânticos, serviços capazes de entregar o autosserviço e, claro, serviços capazes de realizar a entrega de inteligência artificial. Então, a nossa discussão aqui de banco de dados está inserida neste contexto de estratégia de dados que tem esses desdobramentos, ou essas três abordagens, e nós podemos compreender essas abordagens, pelo menos nesses dois eixos principais de agilidade e vantagem competitiva para o negócio.