Grandes modelos de linguagem (LLMs), como ChatGPT e Gemini, foram originalmente projetados para funcionar apenas com texto. Hoje, eles evoluíram para sistemas que podem trabalhar com diversos tipos de informação ao mesmo tempo (sistemas multimodais), bem como compreender e gerar imagens, áudio, fala e música.
Fonte de notícias




