Na nossa compreensão e definição dos bancos de dados, é importante a gente relembrar os conceitos de dados estruturados, semi-estruturados e não estruturados. Então, vamos comentar um pouco sobre esses elementos. Primeiramente, vamos começar falando de dados estruturados, porque a gente tem facilmente a referência de uma tabela como a estrutura definida para esse dado que está sendo armazenado em um banco de dados relacional. Então quando nós temos uma tabela, nós temos as colunas representando atributos e as linhas representando ocorrências, os registros. Então, essa estrutura tabular já traz uma estrutura previamente definida. Isso caracteriza esse dado como um dado estruturado. Além disso, é muito comum a gente encontrar nessa estrutura pré-definida os tipos mais primitivos ou primários de dados, como números inteiros, decimais, as datas, os conjuntos de caracteres, que são as strings. Além disso, existe um levantamento bem interessante realizado pelo Gartner, que estima que 20% dos dados empresariais atualmente são dados estruturados. Então, os dados que as empresas utilizam nos seus sistemas de gestão, que são os ERPs, nos sistemas de relacionamento com o cliente, que são os CRMs, esse universo corresponde a 20% dos dados. Uma coisa interessante é que dados estruturados requerem menos armazenamento e, em teoria, podem ser mais fáceis de serem geridos devido a sua variedade, volume, velocidade, volatilidade menores nas soluções. Em contrapartida, nós vamos perceber aqui nos dados não estruturados que provavelmente eles não podem ser expressos ou exibidos em linhas ou colunas dos bancos relacionais. Na verdade, os bancos relacionais têm um desafio muito grande em trabalhar com essa variedade de informação. Então, imagine a gente ter a necessidade de trabalhar com imagens, com áudio, com vídeo, com planilhas, com arquivos de documento em PDF e demais arquivos gerados constantemente na era do Big Data que a gente vive atualmente. Em contrapartida, a estimativa do Gartner fala aqui que a gente tem 80% dos dados ou mais. Então, a gente tem um grande volume, uma grande variedade desse tipo de informação. E aqui não é possível antecipar a estrutura na qual a gente vai receber essa informação seja um e-mail escrito por uma pessoa para outra ou um post em uma rede social uma foto publicada nós não temos como antecipar essa estrutura consequent, esse tipo de informação requer mais armazenamento e é um desafio maior de gestão nas soluções. E no meio do caminho, nós temos aqui os dados semi-estruturados. Então, são aqueles dados que a gente consegue trabalhar com uma estrutura parcial, mas não necessariamente uma estrutura que vai ser completa ou previamente definida. Os melhores exemplos de dados semi-estruturados são os populares arquivos JSON, JavaScript Object Notation, ou os arquivos XML, Extensible Markup Language, muito populares também, principalmente dos anos 2000 para cá. E com isso nós temos definidos o que são dados estruturados, dados não estruturados e dados semi-estruturados.