A inteligĂȘncia artificial avança a um ritmo frenĂ©tico, mas um muro se ergue em seu caminho.
Os grandes modelos de linguagem, que alimentam chatbots e assistentes virtuais, consomem quantidades astronĂŽmicas de dados humanos. Ora, essas reservas de conteĂșdo original se esgotam rapidamente. Sem novos aportes, o aprendizado dessas mĂĄquinas pode descarrilar.
Sem novos dados, as IAs começariam a se alimentar de suas prĂłprias produçÔes. Esse ciclo fechado leva a um fenĂŽmeno chamado colapso do modelo, em dois estĂĄgios distintos. No inĂcio, as respostas perdem os detalhes raros e se tornam insĂpidas, semelhantes a texto genĂ©rico. Em seguida, viram puro charabia, tornando a IA inutilizĂĄvel.
Pesquisadores de vårias instituiçÔes identificaram uma solução surpreendentemente simples para esse problema. Seu estudo, publicado na
Physical Review Letters, mostra que um Ășnico exemplo humano autĂȘntico, inserido em um oceano de dados artificiais, basta para impedir o colapso.
Esse resultado decorre de trabalhos sobre modelos matemĂĄticos chamados famĂlias exponenciais, que permitem entender por que e como o colapso ocorre.
Para entender esse mecanismo, Ă© preciso saber que, quando se recicla um modelo em suas prĂłprias saĂdas, as flutuaçÔes estatĂsticas desaparecem gradualmente. Os casos raros e as informaçÔes matizadas desaparecem, dando lugar a respostas homogĂȘneas. Um ponto de referĂȘncia real, devidamente rotulado por um humano, restaura a diversidade perdida.
Os cientistas usaram modelos matemĂĄticos simples para analisar em detalhe esse processo. Munidos dessa compreensĂŁo, puderam conceber uma solução teĂłrica. O prĂłximo passo serĂĄ testar esse mĂ©todo nos gigantescos modelos comerciais para verificar sua eficĂĄcia em larga escala. Se o princĂpio se confirmar, os engenheiros disporĂŁo de uma receita simples para evitar um colapso.