Connect with us

CIÊNCIA & TECNOLOGIA

O que é o colapso dos modelos de IA, sobre o qual alertam pesquisadores

Pesquisadores da área de inteligência artificial têm levantado preocupações sobre um fenômeno chamado “colapso dos modelos de IA”, que pode comprometer a eficácia das futuras gerações dessas tecnologias. O termo se refere a um processo degenerativo que ocorre quando modelos de IA são treinados utilizando dados gerados por outros modelos de IA, em vez de dados originados por humanos.

Esse fenômeno é motivo de preocupação crescente na comunidade científica, especialmente à medida que cresce a quantidade de conteúdos gerados por IA na internet e a utilização desses materiais para “retroalimentar” o treinamento dos modelos.

Colapso dos modelos de IA

Em um artigo publicado na revista Nature no último mês de julho, os pesquisadores Ilia Shumailov, Zakhar Shumaylov, Yiren Zhao, Nicolas Papernot, Ross Anderson e Yarin Gal mostram como os modelos de IA apresentam resultados piores quando são treinados em dados gerados artificialmente.

A principal preocupação dos pesquisadores é que o aumento do conteúdo gerado por IA na internet crie um ciclo de retroalimentação, onde novos modelos de IA são treinados em dados gerados por modelos anteriores.

De acordo com os autores, “o desenvolvimento de modelos de linguagem de larga escala (LLMs) requer grandes quantidades de dados de treinamento. No entanto, embora os LLMs atuais tenham sido treinados em texto predominantemente gerado por humanos, isso pode mudar. Se os dados de treinamento da maioria dos modelos futuros também forem extraídos da web, eles inevitavelmente treinarão em dados produzidos por seus predecessores”.

Pesquisadores alertam que o treinamento de IA com dados gerados por IA pode causar
Pesquisadores alertam que o treinamento de IA com dados gerados por IA pode causar “colapso dos modelos” 

O estudo mostra como essa prática pode resultar em uma perda progressiva de precisão e diversidade nos resultados dos modelos, em um processo que os cientistas chamam de “colapso dos modelos”.

Esse processo, conforme detalhado pelos autores, ocorre devido a três tipos de erros que se acumulam ao longo de gerações de modelos: erro de aproximação estatística, erro de expressividade funcional e erro de aproximação funcional.

Cada um desses erros contribui para a degradação gradual da qualidade dos modelos, que passam a reproduzir de forma imprecisa as informações originais, culminando no que os pesquisadores descrevem como uma “perda de informação” em estágios iniciais e uma “convergência que pouco se assemelha à original” em estágios mais avançados.

Regurgitação de dados no treinamento de IAs

A prática de treinar modelos de IA com dados gerados por outros modelos também é discutida em outro artigo científico: “Regurgitative Training” (ou “Treinamento Regurgitativo”, em tradução direta), de Jinghui Zhang, Dandan Qiao, Mochen Yang e Qiang Wei, também publicado em julho.

Nesse estudo, os autores exploram os efeitos do que chamam de “regurgitação de dados no treinamento de IAs” e concluem que esse processo resulta em uma perda de desempenho dos modelos.

Pesquisadores dizem que IAs treinadas com dados gerados por outros modelos apresentam queda de desempenho (Imagem: Reprodução/Freepik)
Pesquisadores dizem que IAs treinadas com dados gerados por outros modelos apresentam queda de desempenho

Segundo os pesquisadores, “o sucesso explosivo de LLMs, como ChatGPT e Llama, significa que uma quantidade substancial de conteúdo online será gerada por LLMs em vez de humanos, o que inevitavelmente entrará nos conjuntos de dados de treinamento de LLMs de próxima geração”.

O “treinamento regurgitado” é visto pelos autores como algo inevitável, devido à proliferação de conteúdo gerado por IA. “Há evidências que sugerem que uma grande parte da web já é gerada por modelos de tradução automática”, destaca a equipe no artigo.

Porém, os pesquisadores concluem em suas análises que “treinar um novo LLM usando dados gerados (menos que parcialmente) por ele mesmo ou por outros LLMs geralmente resulta em desempenho inferior em relação ao treinamento com dados reais”.

Fim dos dados gerados por humanos

Os dois artigos publicados em julho também se relacionam com outro ponto crítico sobre o treinamento de modelos de IA: a perspectiva de que os dados disponíveis gerados por humanos podem acabar em breve.

Com a popularização das soluções de inteligência artificial, a demanda por banco de dados de alta qualidade para treinar as IAs cresceu exponencialmente. Para obter esses dados, grandes empresas de tecnologia, como OpenAI, Meta e Google, realizam a chamada “raspagem” de conteúdos da web, coletando terabytes de dados para alimentar seus modelos.

Modelos podem ficar sem dados de qualidade produzidos por humanos na web a partir de 2026, alertam pesquisadores (Imagem: Kjpargeter/Freepik)
Modelos podem ficar sem dados de qualidade produzidos por humanos na web a partir de 2026, alertam pesquisadores

No entanto, um artigo publicado em 2023 alerta que o estoque de dados de texto gerados por humanos pode se esgotar até 2026, caso a velocidade da coleta de dados continue no ritmo atual.

Para chegar a essa conclusão, os autores de “Ficaremos sem dados? Limites da escalabilidade do LLM com base em dados gerados por humanos” desenvolveram um modelo preditivo sobre a demanda por dados e a produção humana de texto com disponibilidade pública na web.

“Nossa análise revela uma conjuntura crítica se aproximando até o final desta década, onde a dependência atual de dados de texto humano público para treinamento de LLMs pode se tornar insustentável”, conclui o time de pesquisadores.

Sem dados humanos de alta qualidade, os modelos de IA podem enfrentar um declínio acentuado em sua capacidade de aprendizado e apresentar uma queda de desempenho.

Com a perspectiva de que os futuros LLMs serão inevitavelmente treinados com dados gerados por IA, os pesquisadores temem um processo degenerativo que tornará as IAs cada vez mais “burras”, podendo levar ao colapso dos modelos de inteligência artificial.

Continue Reading
Advertisement

Relógio

Grupo do Portal Informa Paraíba (Facebook)

Portal Informa Paraíba

Fiquem bem informados em um site que escreve notícias

TWITTER DO PORTAL INFORMA PARAÍBA

www.informaparaiba.com.br

Fiquem bem informados em um site que escreve notícias.

Página do Portal Informa Paraíba (Facebook)

CIDADE40 minutos ago

Nilvan Ferreira recebe apoio estratégico de Irmão Jauires e intensifica campanha rumo à prefeitura de Santa Rita

ENTRETENIMENTO6 horas ago

Pagode e Samba Entre Amigos: Prepare-se para a Melhor Noite de Música e Diversão no Celebration

Nacional1 dia ago

Programa “Lawfare nunca mais” destaca a trajetória de Daniel Pereira e os desafios enfrentados por governos democráticos no Brasil

Politíca1 dia ago

Estou pronto para ser o prefeito que Santa Rita precisa: Uma cidade que clama por liderança verdadeira

ESTADO2 dias ago

Governo da Paraíba encerra Painel Paraibano de Mudanças Climáticas nesta quinta e sexta, em João Pessoa

ECONOMIA2 dias ago

Calendário INSS setembro 2024: Confira as datas de pagamento

Esporte2 dias ago

Merab Dvalishvili explica beijos nas costas de Sean O’Malley durante disputa de cinturão no UFC 306

Esporte2 dias ago

Máxima pontuação possível para o Belo, 10 pontos eliminaram Volta Redonda em 2023

Esporte2 dias ago

F1: Barrichello pede calma em torno da expectativa sobre Bortoleto na Fórmula 1

Esporte2 dias ago

Djokovic: “Foi provavelmente a última vez que joguei a Davis na Sérvia”

ECONOMIA2 dias ago

Banco Central aponta divergência de R$ 40 bilhões a mais no rombo fiscal do que o informado pelo Ministério da Fazenda

Nacional2 dias ago

Justiça condena jornalistas por declaração sobre filha de Carlos

Nacional2 dias ago

Câmara ignora censura e continua a postar no X

Nacional2 dias ago

Lula recebeu 2,3 mil presentes em 18 meses de mandato

Nacional2 dias ago

Polarização transborda para eleições municipais e pode decidir voto de metade dos brasileiros

Esporte2 dias ago

Vini Júnior recebe troféu de melhor jogador da Liga dos Campeões

Judiciário2 dias ago

Como a suspensão das emendas impositivas federais afeta estados e municípios

Educação & Cultura2 dias ago

Comissão de Educação vota Lei de Responsabilidade Educacional

Esporte2 dias ago

Comissão de Esporte discute vínculo trabalhista para árbitros

Educação & Cultura2 dias ago

Novo PNE deve combater evasão escolar, dizem representantes estudantis na CE

Educação & Cultura2 dias ago

Inscrições abertas para Olimpíada Paraibana de Matemática (OPM) até 15 de outubro

Saúde2 dias ago

Opera Paraíba realiza primeiras cirurgias ortopédicas do Hospital Estadual de Solânea

Segurança Pública2 dias ago

Força-tarefa inicia operação para combater desmatamento da Mata Atlântica na Paraíba

ESTADO2 dias ago

Saibam o que foi tratado no “Programa conversa com o Governador”

Educação & Cultura2 dias ago

Escola Estadual de Ingá é a primeira da Paraíba a conquistar medalhas de ouro e prata na Jornada de Foguetes 2024

Educação & Cultura2 dias ago

Educação inicia distribuição de equipamentos para mais de 500 escolas da rede estadual de ensino

Esporte2 dias ago

Paraíba sedia campeonato brasileiro de ginástica artística a partir desta terça-feira e O Ronaldão retoma atividades

Politíca2 dias ago

Durante entrega do Hospital de Amor de Campina Grande, diretor da rede ressalta atuação de Veneziano na conquista: “A palavra é gratidão”

ESTADO2 dias ago

João Azevêdo formaliza instalação de mais um resort no Polo Turístico Cabo Branco com investimento de R$ 76 milhões

Segurança Pública2 dias ago

Concursos Militares x Exames de saúde: o que pode eliminar os candidatos e como se preparar para essa etapa

ENTRETENIMENTO12 meses ago

Conheça Rocco, um cão mistura de rottweiler com husky siberiano: ‘Parece o Batman’

AGRICULTURA & PECUÁRIA8 meses ago

Com produtor revisando tamanho da safra, 2024 inicia cercado de incertezas para a soja

Internacional8 meses ago

Secretário-geral da ONU condena atos criminosos no Equador

ECONOMIA9 meses ago

Calendário do Bolsa Família 2024: saiba quando você vai receber

CONCURSO E EMPREGO9 meses ago

Carreiras em Extinção? Veja Quais Podem Sumir

Internacional9 meses ago

Fome já é generalizada em Gaza, alerta ONU

CIDADE9 meses ago

Polêmica em Princesa Isabel: Vereadores aprovam aumento salarial próprio e do Executivo

AGRICULTURA & PECUÁRIA9 meses ago

Número de IGs cresceu 60% em quatro anos no Brasil

Saúde9 meses ago

OS PRINCIPAIS LEGUMES E VERDURAS QUE AJUDAM A PREVENIR DOENÇAS CRÔNICAS

Internacional9 meses ago

Israel quer controlar e fechar fronteira entre Gaza e Egito

Judiciário12 meses ago

Entender Direito: especialistas discutem os embargos de divergência

Educação & Cultura9 meses ago

Campina Grande entra na disputa e poderá ser escolhida para receber nova Escola de Sargentos do Exército após impasse em Pernambuco

Internacional2 meses ago

Rússia ameaça atacar capitais europeias em retaliação

Internacional9 meses ago

“Perdas, dor e angústia” após ataques aéreos marcam o início do ano na Ucrânia

CIÊNCIA & TECNOLOGIA9 meses ago

Vale a pena usar um gerador de conteúdo para redes sociais?

Nacional9 meses ago

TCU pede que ministra da Saúde pague R$ 11 milhões a cofres públicos

ENTRETENIMENTO9 meses ago

HORTÊNSIAS

ENTRETENIMENTO8 meses ago

PASSEIO MOSTRA COMO É UM BORBOLETÁRIO

Judiciário4 meses ago

Juízes comemoram inclusão do Judiciário entre atividades de risco

ENTRETENIMENTO7 meses ago

1º Cabedelo MotoFest: prepare-se para uma explosão de emoções na praia do Jacaré!

ESTADO10 meses ago

Energisa reúne empresas de telecomunicações para tratar sobre segurança na disposição de cabos em postes 

CONCURSO E EMPREGO11 meses ago

Concurso da PMPB pode ser suspenso? Jurista avalia

ENTRETENIMENTO6 meses ago

Estes SINAIS mostram que a pessoa te quer, mas FINGE que não está a fim!

ENTRETENIMENTO4 meses ago

CRIANDO LAGARTOS EXÓTICOS LEGALMENTE

Esporte4 meses ago

Viviane Pereira vence luta de estreia no último Pré-Olímpico de Boxe

ENTRETENIMENTO9 meses ago

DEZ FLORES PARA LOCAIS ENSOLARADOS

ENTRETENIMENTO9 meses ago

5 DICAS PARA SEU PINHEIRO DE NATAL DURAR MUITO MAIS

Nacional2 meses ago

Manifestação em São Paulo Clama por Liberdade aos Presos Políticos e Impeachment de Alexandre de Moraes

ENTRETENIMENTO3 meses ago

CHICO BUARQUE: 80 ANOS DE CRIATIVIDADE

Internacional6 meses ago

China

CIÊNCIA & TECNOLOGIA2 dias ago

TURISTAS FAZEM CAMINHADA ESPACIAL HISTÓRICA COM A POLARIS DAWN

Saúde2 dias ago

COMO O AUMENTO DA TEMPERATURA AFETA O NOSSO CORPO?

Educação & Cultura2 dias ago

COLÉGIO AGRÍCOLA CRIA UM SISTEMA PARA PRODUÇÃO DE TILÁPIA

ENTRETENIMENTO2 dias ago

COMO ESCOLHER O CANE CORSO PERFEITO: GUARDA E COMPANHIA

Nacional2 dias ago

PRESERVAÇÃO DA AMAZÔNIA É FUNDAMENTAL PARA O EQUILÍBRIO CLIMÁTICO DO PLANETA

AGRICULTURA & PECUÁRIA2 dias ago

O QUE SERÁ DA AGRICULTURA SEM OS JOVENS?

CIÊNCIA & TECNOLOGIA6 dias ago

ANATEL ENDURECE REGRAS PARA O TELEMARKETING

Internacional6 dias ago

MAIOR GELEIRA DOS ALPES ITALIANOS DOLOMITAS PODE DESAPARECER ATÉ 2040

ENTRETENIMENTO6 dias ago

RECEITA: TORTA DE ABÓBORA COM CACHAÇA

Internacional6 dias ago

5 MOMENTOS-CHAVE DO DEBATE ENTRE KAMALA E TRUMP

Nacional6 dias ago

REGIÃO DA CHAPADA DOS VEADEIROS É ATINGIDA POR “FOGO SUBTERRÂNEO”

ENTRETENIMENTO2 semanas ago

Assistam ao filme – Um Anjo em Nossas Vidas 

Judiciário2 semanas ago

QUAL É A IMPORTÂNCIA E A FUNÇÃO DO STF?

Saúde2 semanas ago

COISAS QUE NINGUÉM TE FALA SOBRE A HÉRNIA DE DISCO

ECONOMIA2 semanas ago

ANEEL ANUNCIA BANDEIRA VERMELHA EM SETEMBRO

Segurança Pública2 semanas ago

O QUE ESTÁ POR TRÁS DOS INCÊNDIOS CRIMINOSOS EM SP?

ENTRETENIMENTO2 semanas ago

RESOLVA AS FOLHAS AMARELADAS

CIÊNCIA & TECNOLOGIA2 semanas ago

FUNGOS QUE COMEM PLÁSTICO

CIDADE2 semanas ago

CEARÁ PODE VIRAR LÍDER NA PRODUÇÃO DE HIDROGÊNIO VERDE

CIÊNCIA & TECNOLOGIA2 semanas ago

COMO INSTALAR PLACAS SOLARES DE FORMA SEGURA

Educação & Cultura2 semanas ago

COMO A ELEVAÇÃO DO MAR AFETA O BRASIL? GEÓLOGO EXPLICA

ENTRETENIMENTO2 semanas ago

RECEITA DO CHICO BALANCEADO

CIÊNCIA & TECNOLOGIA2 semanas ago

ANATEL ANUNCIA FUNCIONALIDADES PARA EVITAR GOLPES

Saúde3 semanas ago

É O FIM DOS HOMENS? CROMOSSOMO Y ESTÁ DESAPARECENDO

Saúde3 semanas ago

PESQUISA REVELA DIETA QUE PODE TE FAZER VIVER MAIS

CIÊNCIA & TECNOLOGIA3 semanas ago

SOL VERMELHO, CHUVA ESCURA E TEMPESTADE DE AREIA

Educação & Cultura3 semanas ago

PRIMEIROS GRÃOS DE SOJA CHEGARAM AO BRASIL EM UMA GARRAFA

ENTRETENIMENTO3 semanas ago

PRAGAS E DOENÇAS DAS PLANTAS E COMO CURÁ-LAS

AGRICULTURA & PECUÁRIA3 semanas ago

PRODUÇÃO ORGÂNICA: MORANGOS EM ABRIGOS

CIÊNCIA & TECNOLOGIA3 semanas ago

O PLANO BRASILEIRO PARA ATRAIR PESQUISADORES DE VOLTA AO PAÍS

Advertisement
Advertisement

Vejam também

Somos o Portal Informa Paraíba, uma empresa de marketing e portal de informações que oferece um noticioso com assuntos diversos. Nosso objetivo é fornecer conteúdo relevante e atualizado para nossos leitores, mantendo-os informados sobre os acontecimentos mais importantes. Nossa equipe é composta por profissionais experientes e apaixonados por comunicação, que trabalham incansavelmente para oferecer um serviço de qualidade. Além disso, estamos sempre em busca de novas formas de melhorar e inovar, para podermos atender às necessidades e expectativas de nossos clientes. Seja bem-vindo ao nosso mundo de informações e descubra tudo o que o Portal Informa Paraíba tem a oferecer. Fiquem bem informados acessando o Portal Informa Paraíba: www.informaparaiba.com.br