Connect with us

CIÊNCIA & TECNOLOGIA

O que é o colapso dos modelos de IA, sobre o qual alertam pesquisadores

Pesquisadores da área de inteligência artificial têm levantado preocupações sobre um fenômeno chamado “colapso dos modelos de IA”, que pode comprometer a eficácia das futuras gerações dessas tecnologias. O termo se refere a um processo degenerativo que ocorre quando modelos de IA são treinados utilizando dados gerados por outros modelos de IA, em vez de dados originados por humanos.

Esse fenômeno é motivo de preocupação crescente na comunidade científica, especialmente à medida que cresce a quantidade de conteúdos gerados por IA na internet e a utilização desses materiais para “retroalimentar” o treinamento dos modelos.

Colapso dos modelos de IA

Em um artigo publicado na revista Nature no último mês de julho, os pesquisadores Ilia Shumailov, Zakhar Shumaylov, Yiren Zhao, Nicolas Papernot, Ross Anderson e Yarin Gal mostram como os modelos de IA apresentam resultados piores quando são treinados em dados gerados artificialmente.

A principal preocupação dos pesquisadores é que o aumento do conteúdo gerado por IA na internet crie um ciclo de retroalimentação, onde novos modelos de IA são treinados em dados gerados por modelos anteriores.

De acordo com os autores, “o desenvolvimento de modelos de linguagem de larga escala (LLMs) requer grandes quantidades de dados de treinamento. No entanto, embora os LLMs atuais tenham sido treinados em texto predominantemente gerado por humanos, isso pode mudar. Se os dados de treinamento da maioria dos modelos futuros também forem extraídos da web, eles inevitavelmente treinarão em dados produzidos por seus predecessores”.

Pesquisadores alertam que o treinamento de IA com dados gerados por IA pode causar
Pesquisadores alertam que o treinamento de IA com dados gerados por IA pode causar “colapso dos modelos” 

O estudo mostra como essa prática pode resultar em uma perda progressiva de precisão e diversidade nos resultados dos modelos, em um processo que os cientistas chamam de “colapso dos modelos”.

Esse processo, conforme detalhado pelos autores, ocorre devido a três tipos de erros que se acumulam ao longo de gerações de modelos: erro de aproximação estatística, erro de expressividade funcional e erro de aproximação funcional.

Cada um desses erros contribui para a degradação gradual da qualidade dos modelos, que passam a reproduzir de forma imprecisa as informações originais, culminando no que os pesquisadores descrevem como uma “perda de informação” em estágios iniciais e uma “convergência que pouco se assemelha à original” em estágios mais avançados.

Regurgitação de dados no treinamento de IAs

A prática de treinar modelos de IA com dados gerados por outros modelos também é discutida em outro artigo científico: “Regurgitative Training” (ou “Treinamento Regurgitativo”, em tradução direta), de Jinghui Zhang, Dandan Qiao, Mochen Yang e Qiang Wei, também publicado em julho.

Nesse estudo, os autores exploram os efeitos do que chamam de “regurgitação de dados no treinamento de IAs” e concluem que esse processo resulta em uma perda de desempenho dos modelos.

Pesquisadores dizem que IAs treinadas com dados gerados por outros modelos apresentam queda de desempenho (Imagem: Reprodução/Freepik)
Pesquisadores dizem que IAs treinadas com dados gerados por outros modelos apresentam queda de desempenho

Segundo os pesquisadores, “o sucesso explosivo de LLMs, como ChatGPT e Llama, significa que uma quantidade substancial de conteúdo online será gerada por LLMs em vez de humanos, o que inevitavelmente entrará nos conjuntos de dados de treinamento de LLMs de próxima geração”.

O “treinamento regurgitado” é visto pelos autores como algo inevitável, devido à proliferação de conteúdo gerado por IA. “Há evidências que sugerem que uma grande parte da web já é gerada por modelos de tradução automática”, destaca a equipe no artigo.

Porém, os pesquisadores concluem em suas análises que “treinar um novo LLM usando dados gerados (menos que parcialmente) por ele mesmo ou por outros LLMs geralmente resulta em desempenho inferior em relação ao treinamento com dados reais”.

Fim dos dados gerados por humanos

Os dois artigos publicados em julho também se relacionam com outro ponto crítico sobre o treinamento de modelos de IA: a perspectiva de que os dados disponíveis gerados por humanos podem acabar em breve.

Com a popularização das soluções de inteligência artificial, a demanda por banco de dados de alta qualidade para treinar as IAs cresceu exponencialmente. Para obter esses dados, grandes empresas de tecnologia, como OpenAI, Meta e Google, realizam a chamada “raspagem” de conteúdos da web, coletando terabytes de dados para alimentar seus modelos.

Modelos podem ficar sem dados de qualidade produzidos por humanos na web a partir de 2026, alertam pesquisadores (Imagem: Kjpargeter/Freepik)
Modelos podem ficar sem dados de qualidade produzidos por humanos na web a partir de 2026, alertam pesquisadores

No entanto, um artigo publicado em 2023 alerta que o estoque de dados de texto gerados por humanos pode se esgotar até 2026, caso a velocidade da coleta de dados continue no ritmo atual.

Para chegar a essa conclusão, os autores de “Ficaremos sem dados? Limites da escalabilidade do LLM com base em dados gerados por humanos” desenvolveram um modelo preditivo sobre a demanda por dados e a produção humana de texto com disponibilidade pública na web.

“Nossa análise revela uma conjuntura crítica se aproximando até o final desta década, onde a dependência atual de dados de texto humano público para treinamento de LLMs pode se tornar insustentável”, conclui o time de pesquisadores.

Sem dados humanos de alta qualidade, os modelos de IA podem enfrentar um declínio acentuado em sua capacidade de aprendizado e apresentar uma queda de desempenho.

Com a perspectiva de que os futuros LLMs serão inevitavelmente treinados com dados gerados por IA, os pesquisadores temem um processo degenerativo que tornará as IAs cada vez mais “burras”, podendo levar ao colapso dos modelos de inteligência artificial.

Continue Reading

Relógio

Instagram Portal Informa Paraíba

Advertisement

Grupo do Portal Informa Paraíba (Facebook)

TWITTER DO PORTAL INFORMA PARAÍBA

Página do Portal Informa Paraíba (Facebook)

Politíca39 minutos ago

Vereador João Alves: Uma atuação marcante na Câmara de Santa Rita

Esporte10 horas ago

Time do Ecoparque João Pessoa conquista título da Copa Orizon Nordeste 2025

CIÊNCIA & TECNOLOGIA10 horas ago

Inovação tecnológica: patente é concedida a pesquisadores da UFPB

Segurança Pública10 horas ago

Militares estão inquietos e reclamam de percentual de reajuste que “sequer cobre a inflação”

Segurança Pública10 horas ago

Força Aérea Brasileira perde pilotos em ritmo alarmante: evasão em massa por falta de incentivo, baixos salários e sucateamento ameaça a defesa nacional e revela grave fragilidade estrutural da FAB no Brasil

CIDADE11 horas ago

Cabedelo dá início a ações para conquistar certificação Bandeira Azul, um dos mais respeitados selos ecológicos do mundo

ECONOMIA12 horas ago

Tarifa de energia pode ter custo elevado por 25 anos caso Congresso reverta vetos presidenciais

Judiciário22 horas ago

Juizado Especial de Santa Rita vai entregar valores decorrentes das transações penais a entidades

Judiciário22 horas ago

OAB-PB lança campanha para alertar sobre golpes a clientes e escritórios de advocacia

Esporte22 horas ago

Morre aos 75 anos lenda das artes marciais que lutou contra Chuck Norris e Jackie Chan

Esporte23 horas ago

GP do Japão 2025: confira a programação da terceira etapa da temporada da F1

Esporte23 horas ago

Onde os azarões prevalecem — até mesmo a Honda: Os vencedores e perdedores da MotoGP no COTA

Esporte23 horas ago

Handebol

Esporte23 horas ago

Vibrações do primeiro dia de aula para atletas olímpicos que retornam aos treinos no novo ciclo

Esporte23 horas ago

João Fonseca atinge melhor posição da carreira no ranking da ATP

Esporte23 horas ago

Treze confirma contratação de volante campeão da Série D pelo Retrô

Esporte24 horas ago

Palmeiras pode ter Gómez na Libertadores; Maurício e Paulinho são dúvidas

Nacional24 horas ago

Governo Lula trava comissão que fiscalizaria gastos bilionários da Itaipu

Nacional24 horas ago

Janja diz que foi a Paris sem Lula por pedido de Macron

Nacional24 horas ago

Defesa de Bolsonaro aciona Corte Interamericana por perseguição judicial

Judiciário24 horas ago

Aliados de Nunes Marques e Arthur Lira devem vencer guerra por cadeiras no STJ

ECONOMIA1 dia ago

Além de escândalo, Correios ainda têm calote de R$300 milhões a pagar

ECONOMIA1 dia ago

Alíquota do ICMS sobre compras internacionais sobe de 17% para 20%

Segurança Pública1 dia ago

PEC da segurança repara “omissão de 30 anos”, diz representante das guardas municipais

Politíca1 dia ago

Hugo Motta faz reunião estratégica que pode sacramenta destino de projetos prioritários da direita

Nacional1 dia ago

CCJ inicia análise do novo Código Eleitoral nesta quarta-feira

AGRICULTURA & PECUÁRIA1 dia ago

Comissão debate proposta que financia armazenagem rural nesta terça-feira

AGRICULTURA & PECUÁRIA1 dia ago

Embrapa Cerrados mostra tecnologias sustentáveis a participantes de evento sobre Non-GMO

ENTRETENIMENTO1 dia ago

O QUE A SÉRIE ADOLESCÊNCIA RETRATA?

CIÊNCIA & TECNOLOGIA1 dia ago

QUAL DOS TIPOS DE ENERGIA ABAIXO NÃO É ENERGIA RENOVÁVEL?

CONCURSO E EMPREGO3 meses ago

ESA 2025: oportunidade de carreira no exército com 1.100 vagas

Judiciário4 meses ago

Prescrição intercorrente: a aplicação do Decreto nº 20.910 em Estados e Municípios

ENTRETENIMENTO11 meses ago

4 sinais que ela não te quer mais (e o que fazer para ter certeza)

Internacional9 meses ago

Rússia ameaça atacar capitais europeias em retaliação

CONCURSO E EMPREGO3 meses ago

Sine-JP fecha o ano com oferta de 582 vagas de emprego

CIÊNCIA & TECNOLOGIA5 meses ago

ROVER CHINÊS ENCONTRA VESTÍGIOS DE OCEANO EXTINTO EM MARTE

Judiciário11 meses ago

Juízes comemoram inclusão do Judiciário entre atividades de risco

CONCURSO E EMPREGO5 meses ago

ESCALA 6X1: DO TIKTOK AO CONGRESSO

ENTRETENIMENTO10 meses ago

CRIANDO LAGARTOS EXÓTICOS LEGALMENTE

ENTRETENIMENTO5 meses ago

COMO TRANSPLANTAR ORQUÍDEAS DO VASO PARA A ÁRVORE?

Esporte10 meses ago

Viviane Pereira vence luta de estreia no último Pré-Olímpico de Boxe

CONCURSO E EMPREGO3 meses ago

Paraíba gera mais de 2,7 mil empregos com carteira assinada em novembro

Internacional9 meses ago

Pessoas feias tendem a ser de esquerda, revela estudo

ENTRETENIMENTO10 meses ago

CHICO BUARQUE: 80 ANOS DE CRIATIVIDADE

Internacional11 meses ago

Estes são os países onde a Bíblia é proibida

ECONOMIA9 meses ago

PIX TERÁ OPÇÃO DE PAGAMENTO POR APROXIMAÇÃO

ENTRETENIMENTO5 meses ago

AS 9 RARIDADES DO CERRADO

Segurança Pública5 meses ago

Policiais ganham direito após anos de luta: já é possível escolher outro estado para trabalhar

Saúde4 meses ago

BRASILEIROS CRIAM VACINA CONTRA O CÂNCER DE PRÓSTATA

Saúde5 meses ago

UTENSÍLIOS FEITOS DE PLÁSTICO PRETO PODEM TER SUBSTÂNCIAS CANCERÍGENAS

CIDADE10 meses ago

Prefeitura de Cabedelo efetua pagamento de salários do mês de maio nesta quarta-feira (29)

Educação & Cultura5 meses ago

CELULAR PODE IMPACTAR EM ATÉ 40% NO DESEMPENHO ESCOLAR DAS CRIANÇAS

Educação & Cultura5 meses ago

O FUTURO DA EDUCAÇÃO (PARTE I)

Internacional5 meses ago

COMO FAZER PARA TRABALHAR NA ALEMANHA?

Saúde5 meses ago

DIABETES: TUDO O QUE VOCÊ PRECISA SABER SOBRE A CONDIÇÃO

Educação & Cultura5 meses ago

O FUTURO DA EDUCAÇÃO (PARTE II)

Saúde4 meses ago

SISTEMA IMUNE, MAGIA DA NATUREZA

Saúde5 meses ago

QUANDO SUSPEITAR DE UMA INSUFICIÊNCIA CARDÍACA?

Nacional9 meses ago

Manifestação em São Paulo Clama por Liberdade aos Presos Políticos e Impeachment de Alexandre de Moraes

Educação & Cultura5 meses ago

‘IDIOMA QUE FALAMOS DETERMINA COMO PENSAMOS’

ENTRETENIMENTO1 dia ago

O QUE A SÉRIE ADOLESCÊNCIA RETRATA?

CIÊNCIA & TECNOLOGIA1 dia ago

QUAL DOS TIPOS DE ENERGIA ABAIXO NÃO É ENERGIA RENOVÁVEL?

ECONOMIA1 dia ago

PARA QUANDO DEVE SER PAGO O 13º SALÁRIO EM 2025?

Saúde1 dia ago

QUANDO COMEÇOU A PANDEMIA DE COVID-19?

ECONOMIA1 dia ago

O QUE A BIOECONOMIA PROMOVE?

Internacional2 semanas ago

QUAL CONTINENTE É CHAVE PARA A ROTA DA SEDA?

ENTRETENIMENTO2 semanas ago

O QUE AS PLANTAS DE SOL POSSUEM?

Saúde2 semanas ago

QUAL DOENÇA O MARCAPASSO TRATA?

Saúde2 semanas ago

QUEM DEVE EVITAR O GLÚTEN?

ENTRETENIMENTO3 semanas ago

QUAL CARACTERÍSTICA DESSAS AVES FANTASMAS?

Segurança Pública3 semanas ago

POR QUE O BRASIL NÃO TEM BOMBA ATÔMICA?

CIÊNCIA & TECNOLOGIA3 semanas ago

O QUE A COMPUTAÇÃO QUÂNTICA PODE REVOLUCIONAR?

Saúde3 semanas ago

O QUE A INSULINA SEMANAL SUBSTITUI?

Educação & Cultura3 semanas ago

QUANTO TEMPO PODE DEMORAR PARA O ALINHAMENTO SE REPETIR?

Saúde4 semanas ago

O QUE O PROGRAMA EXPLICA SOBRE FIBROMIALGIA?

Educação & Cultura4 semanas ago

QUEM INVENTOU O PARAQUEDAS E QUE CAUSOU SUA PRÓPRIA MORTE?

ENTRETENIMENTO4 semanas ago

ONDE O SANHAÇO-CINZENTO É ENCONTRADO?

Educação & Cultura4 semanas ago

O QUE MOSTRAM AS FERRAMENTAS ANTIGAS USADAS PELOS HOMINÍDEOS?

Educação & Cultura4 semanas ago

A história NÃO CONTADA de EUNICE PAIVA de “AINDA ESTOU AQUI”

CIÊNCIA & TECNOLOGIA1 mês ago

O QUE O DETOX DIGITAL PROPÕE?

ENTRETENIMENTO1 mês ago

QUAL POMBA TEM VOCALIZAÇÃO ESTRANHA?

Saúde1 mês ago

O QUE AS FRUTAS OFERECEM ALÉM DE REFRESCAR?

Educação & Cultura1 mês ago

HÁ QUANTOS ANOS VIVEU ARISTÓTELES?

Saúde1 mês ago

QUAL ORGANIZAÇÃO AFIRMA QUE NÃO HÁ DOSE SEGURA DE ÁLCOOL?

ENTRETENIMENTO1 mês ago

O QUE OS MACACOS DE MINAS GERAIS ALCANÇARAM RECENTEMENTE?

Segurança Pública1 mês ago

QUAL FOI O PREJUÍZO CAUSADO PELA PIRATARIA NO BRASIL EM 2024?

ENTRETENIMENTO1 mês ago

QUAL É O TEMA PRINCIPAL DO VÍDEO SOBRE PLANTAS?

Saúde1 mês ago

O QUE O MINISTÉRIO DA SAÚDE ANUNCIOU SOBRE OS MEDICAMENTOS DA FARMÁCIA POPULAR?

Saúde1 mês ago

QUAL HÁBITO PODE AUMENTAR A LONGEVIDADE?

Educação & Cultura1 mês ago

QUAL FOI O PRINCIPAL OBJETIVO DA EXPEDIÇÃO BRASILEIRA NA ANTÁRTIDA?

Advertisement
Advertisement

Vejam também

Somos o Portal Informa Paraíba, uma empresa de marketing e portal de informações que oferece um noticioso com assuntos diversos. Nosso objetivo é fornecer conteúdo relevante e atualizado para nossos leitores, mantendo-os informados sobre os acontecimentos mais importantes. Nossa equipe é composta por profissionais experientes e apaixonados por comunicação, que trabalham incansavelmente para oferecer um serviço de qualidade. Além disso, estamos sempre em busca de novas formas de melhorar e inovar, para podermos atender às necessidades e expectativas de nossos clientes. Seja bem-vindo ao nosso mundo de informações e descubra tudo o que o Portal Informa Paraíba tem a oferecer. Fiquem bem informados acessando o Portal Informa Paraíba: www.informaparaiba.com.br