Nessa aula vamos aprender a trabalhar com sumarização textual, onde dado um determinado texto vamos conseguir gerar um resumo com n parágrafos.
Para isso, vamos precisar instalar a biblioteca Sumy. Para instalá-la execute o comando pip install sumy no terminal.
Pensando nisso, vamos criar o arquivo 4-sumarizacao_texto.py

from goose3 import Goose
from sumy.parsers.plaintext import PlaintextParser
from sumy.nlp.tokenizers import Tokenizer
from sumy.summarizers.luhn import LuhnSummarizer

# 1 - Coletando o Artigo
g = Goose()
url = 'https://olhardigital.com.br/2023/08/09/ciencia-e-espaco/por-que-e-importante-criar-uma-rotina-de-sono/'
noticia = g.extract(url)
# print(noticia.cleaned_text)

# 2 - Trabalhando com a Sumarização
parser = PlaintextParser.from_string(
    noticia.cleaned_text,
    Tokenizer('portuguese')
)
# print(parser.document)
sumarizador = LuhnSummarizer()
resumo = sumarizador(
    parser.document,
    3
)
for sentenca in resumo:
    print(sentenca)

3. Para executar o arquivo, podemos executar o comando python .\4-sumarizacao_texto.py