Connect with us

CIÊNCIA & TECNOLOGIA

O que é o colapso dos modelos de IA, sobre o qual alertam pesquisadores

Pesquisadores da área de inteligência artificial têm levantado preocupações sobre um fenômeno chamado “colapso dos modelos de IA”, que pode comprometer a eficácia das futuras gerações dessas tecnologias. O termo se refere a um processo degenerativo que ocorre quando modelos de IA são treinados utilizando dados gerados por outros modelos de IA, em vez de dados originados por humanos.

Esse fenômeno é motivo de preocupação crescente na comunidade científica, especialmente à medida que cresce a quantidade de conteúdos gerados por IA na internet e a utilização desses materiais para “retroalimentar” o treinamento dos modelos.

Colapso dos modelos de IA

Em um artigo publicado na revista Nature no último mês de julho, os pesquisadores Ilia Shumailov, Zakhar Shumaylov, Yiren Zhao, Nicolas Papernot, Ross Anderson e Yarin Gal mostram como os modelos de IA apresentam resultados piores quando são treinados em dados gerados artificialmente.

A principal preocupação dos pesquisadores é que o aumento do conteúdo gerado por IA na internet crie um ciclo de retroalimentação, onde novos modelos de IA são treinados em dados gerados por modelos anteriores.

De acordo com os autores, “o desenvolvimento de modelos de linguagem de larga escala (LLMs) requer grandes quantidades de dados de treinamento. No entanto, embora os LLMs atuais tenham sido treinados em texto predominantemente gerado por humanos, isso pode mudar. Se os dados de treinamento da maioria dos modelos futuros também forem extraídos da web, eles inevitavelmente treinarão em dados produzidos por seus predecessores”.

Pesquisadores alertam que o treinamento de IA com dados gerados por IA pode causar
Pesquisadores alertam que o treinamento de IA com dados gerados por IA pode causar “colapso dos modelos” 

O estudo mostra como essa prática pode resultar em uma perda progressiva de precisão e diversidade nos resultados dos modelos, em um processo que os cientistas chamam de “colapso dos modelos”.

Esse processo, conforme detalhado pelos autores, ocorre devido a três tipos de erros que se acumulam ao longo de gerações de modelos: erro de aproximação estatística, erro de expressividade funcional e erro de aproximação funcional.

Cada um desses erros contribui para a degradação gradual da qualidade dos modelos, que passam a reproduzir de forma imprecisa as informações originais, culminando no que os pesquisadores descrevem como uma “perda de informação” em estágios iniciais e uma “convergência que pouco se assemelha à original” em estágios mais avançados.

Regurgitação de dados no treinamento de IAs

A prática de treinar modelos de IA com dados gerados por outros modelos também é discutida em outro artigo científico: “Regurgitative Training” (ou “Treinamento Regurgitativo”, em tradução direta), de Jinghui Zhang, Dandan Qiao, Mochen Yang e Qiang Wei, também publicado em julho.

Nesse estudo, os autores exploram os efeitos do que chamam de “regurgitação de dados no treinamento de IAs” e concluem que esse processo resulta em uma perda de desempenho dos modelos.

Pesquisadores dizem que IAs treinadas com dados gerados por outros modelos apresentam queda de desempenho (Imagem: Reprodução/Freepik)
Pesquisadores dizem que IAs treinadas com dados gerados por outros modelos apresentam queda de desempenho

Segundo os pesquisadores, “o sucesso explosivo de LLMs, como ChatGPT e Llama, significa que uma quantidade substancial de conteúdo online será gerada por LLMs em vez de humanos, o que inevitavelmente entrará nos conjuntos de dados de treinamento de LLMs de próxima geração”.

O “treinamento regurgitado” é visto pelos autores como algo inevitável, devido à proliferação de conteúdo gerado por IA. “Há evidências que sugerem que uma grande parte da web já é gerada por modelos de tradução automática”, destaca a equipe no artigo.

Porém, os pesquisadores concluem em suas análises que “treinar um novo LLM usando dados gerados (menos que parcialmente) por ele mesmo ou por outros LLMs geralmente resulta em desempenho inferior em relação ao treinamento com dados reais”.

Fim dos dados gerados por humanos

Os dois artigos publicados em julho também se relacionam com outro ponto crítico sobre o treinamento de modelos de IA: a perspectiva de que os dados disponíveis gerados por humanos podem acabar em breve.

Com a popularização das soluções de inteligência artificial, a demanda por banco de dados de alta qualidade para treinar as IAs cresceu exponencialmente. Para obter esses dados, grandes empresas de tecnologia, como OpenAI, Meta e Google, realizam a chamada “raspagem” de conteúdos da web, coletando terabytes de dados para alimentar seus modelos.

Modelos podem ficar sem dados de qualidade produzidos por humanos na web a partir de 2026, alertam pesquisadores (Imagem: Kjpargeter/Freepik)
Modelos podem ficar sem dados de qualidade produzidos por humanos na web a partir de 2026, alertam pesquisadores

No entanto, um artigo publicado em 2023 alerta que o estoque de dados de texto gerados por humanos pode se esgotar até 2026, caso a velocidade da coleta de dados continue no ritmo atual.

Para chegar a essa conclusão, os autores de “Ficaremos sem dados? Limites da escalabilidade do LLM com base em dados gerados por humanos” desenvolveram um modelo preditivo sobre a demanda por dados e a produção humana de texto com disponibilidade pública na web.

“Nossa análise revela uma conjuntura crítica se aproximando até o final desta década, onde a dependência atual de dados de texto humano público para treinamento de LLMs pode se tornar insustentável”, conclui o time de pesquisadores.

Sem dados humanos de alta qualidade, os modelos de IA podem enfrentar um declínio acentuado em sua capacidade de aprendizado e apresentar uma queda de desempenho.

Com a perspectiva de que os futuros LLMs serão inevitavelmente treinados com dados gerados por IA, os pesquisadores temem um processo degenerativo que tornará as IAs cada vez mais “burras”, podendo levar ao colapso dos modelos de inteligência artificial.

Continue Reading
Advertisement

Relógio

Grupo do Portal Informa Paraíba (Facebook)

Portal Informa Paraíba

Fiquem bem informados em um site que escreve notícias

TWITTER DO PORTAL INFORMA PARAÍBA

www.informaparaiba.com.br

Fiquem bem informados em um site que escreve notícias.

Página do Portal Informa Paraíba (Facebook)

Esporte11 horas ago

João Azevêdo entrega novo Ronaldão, recepciona medalhistas paralímpicos e destaca investimentos no segmento esportivo

Internacional11 horas ago

Walkie-Talkies de terroristas do Hezbollah explodem na manhã de hoje

CIÊNCIA & TECNOLOGIA11 horas ago

Ministério das Comunicações forma primeira turma de reparos em smartphones da Paraíba

Educação & Cultura11 horas ago

CAIXA DISPONIBILIZA AOS ESTUDANTES CONTRATAÇÃO DIGITAL DO FIES POR APLICATIVO

Internacional11 horas ago

Nações Unidas pedem investigação independente após explosão de pagers no Líbano e na Síria

CIDADE12 horas ago

Castramóvel e hospital veterinário: vereador Janderson Brito apresentou ao menos 12 requerimentos em defesa da causa animal em Cabedelo

Segurança Pública12 horas ago

Força Aérea do Brasil quer transformar o Gripen F-39 com a tecnologia dos aviões de combate mais modernos dos Estados Unidos

Segurança Pública12 horas ago

Brasil fortalece suas Forças Armadas com sistemas avançados de defesa, intercomunicação e foco na segurança: Exército, Marinha e Força Aérea com ênfase na transferência de conhecimento

Internacional12 horas ago

Ex-primeiro-ministro da lituânia, nascido na união soviética, é indicado para liderar a defesa da União Europeia em meio a crescente ameaça russa

Judiciário12 horas ago

Viagens de Flávio Dino com a FAB custaram mais de R$ 3 milhões aos cofres públicos em apenas 8 meses

Educação & Cultura12 horas ago

Prorrogadas inscrições da seleção para o programa de pós-graduação da ENCE

CIDADE12 horas ago

Ao NinjaCast, vereador Marmuthe detalha projeto de infraestrutura para as praias do Sol e Barra de Gramame: “Eram as praias mais esquecidas pelo Poder Público”

Internacional12 horas ago

Deputada americana apresenta lei que impedirá entrada de Moraes nos EUA

Judiciário12 horas ago

Partilha de bens adquiridos antes da Lei da União Estável e gestão de patrimônio

ESTADO12 horas ago

Nota de repúdio ao ataque contra auditores fiscais na Paraíba

Politíca12 horas ago

Deputados aprovam proposta de Jutay que garante capacitação e complementação de renda para pescadores artesanais

Politíca12 horas ago

Assembleia aprova projeto de Camila que inclui campanha ‘Rompa o Ciclo da Violência’ no Calendário de Eventos

CONCURSO E EMPREGO12 horas ago

Fundação de Saúde abre inscrições para concursos com mais de 4.500 oportunidades na Paraíba

Politíca12 horas ago

Deputado Júnior Araújo critica divulgação de pesquisas eleitorais fraudulentas e defende maior rigor na legislação

Politíca12 horas ago

Assembleia aprova projetos em defesa dos direitos das mulheres e das pessoas com deficiência

AGRICULTURA & PECUÁRIA12 horas ago

Embrapa Cerrados aproxima mais de 350 estudantes das pesquisas voltadas para o bioma

Saúde12 horas ago

O que é a febre oropouche e o que se sabe sobre a doença

Judiciário13 horas ago

OAB-PB divulga resultado da eleição para desembargador do TJPB; veja nomes

CIDADE17 horas ago

Nilvan Ferreira recebe apoio estratégico de Irmão Jauires e intensifica campanha rumo à prefeitura de Santa Rita

ENTRETENIMENTO22 horas ago

Pagode e Samba Entre Amigos: Prepare-se para a Melhor Noite de Música e Diversão no Celebration

Nacional2 dias ago

Programa “Lawfare nunca mais” destaca a trajetória de Daniel Pereira e os desafios enfrentados por governos democráticos no Brasil

Politíca2 dias ago

Estou pronto para ser o prefeito que Santa Rita precisa: Uma cidade que clama por liderança verdadeira

ESTADO2 dias ago

Governo da Paraíba encerra Painel Paraibano de Mudanças Climáticas nesta quinta e sexta, em João Pessoa

ECONOMIA2 dias ago

Calendário INSS setembro 2024: Confira as datas de pagamento

Esporte2 dias ago

Merab Dvalishvili explica beijos nas costas de Sean O’Malley durante disputa de cinturão no UFC 306

ENTRETENIMENTO12 meses ago

Conheça Rocco, um cão mistura de rottweiler com husky siberiano: ‘Parece o Batman’

AGRICULTURA & PECUÁRIA8 meses ago

Com produtor revisando tamanho da safra, 2024 inicia cercado de incertezas para a soja

Internacional8 meses ago

Secretário-geral da ONU condena atos criminosos no Equador

ECONOMIA9 meses ago

Calendário do Bolsa Família 2024: saiba quando você vai receber

CONCURSO E EMPREGO9 meses ago

Carreiras em Extinção? Veja Quais Podem Sumir

Internacional9 meses ago

Fome já é generalizada em Gaza, alerta ONU

CIDADE9 meses ago

Polêmica em Princesa Isabel: Vereadores aprovam aumento salarial próprio e do Executivo

AGRICULTURA & PECUÁRIA9 meses ago

Número de IGs cresceu 60% em quatro anos no Brasil

Saúde9 meses ago

OS PRINCIPAIS LEGUMES E VERDURAS QUE AJUDAM A PREVENIR DOENÇAS CRÔNICAS

Internacional9 meses ago

Israel quer controlar e fechar fronteira entre Gaza e Egito

Judiciário12 meses ago

Entender Direito: especialistas discutem os embargos de divergência

Educação & Cultura9 meses ago

Campina Grande entra na disputa e poderá ser escolhida para receber nova Escola de Sargentos do Exército após impasse em Pernambuco

Internacional2 meses ago

Rússia ameaça atacar capitais europeias em retaliação

Internacional9 meses ago

“Perdas, dor e angústia” após ataques aéreos marcam o início do ano na Ucrânia

CIÊNCIA & TECNOLOGIA9 meses ago

Vale a pena usar um gerador de conteúdo para redes sociais?

Nacional9 meses ago

TCU pede que ministra da Saúde pague R$ 11 milhões a cofres públicos

ENTRETENIMENTO9 meses ago

HORTÊNSIAS

ENTRETENIMENTO8 meses ago

PASSEIO MOSTRA COMO É UM BORBOLETÁRIO

Judiciário4 meses ago

Juízes comemoram inclusão do Judiciário entre atividades de risco

ENTRETENIMENTO7 meses ago

1º Cabedelo MotoFest: prepare-se para uma explosão de emoções na praia do Jacaré!

ESTADO10 meses ago

Energisa reúne empresas de telecomunicações para tratar sobre segurança na disposição de cabos em postes 

CONCURSO E EMPREGO11 meses ago

Concurso da PMPB pode ser suspenso? Jurista avalia

ENTRETENIMENTO6 meses ago

Estes SINAIS mostram que a pessoa te quer, mas FINGE que não está a fim!

ENTRETENIMENTO4 meses ago

CRIANDO LAGARTOS EXÓTICOS LEGALMENTE

Esporte4 meses ago

Viviane Pereira vence luta de estreia no último Pré-Olímpico de Boxe

ENTRETENIMENTO10 meses ago

DEZ FLORES PARA LOCAIS ENSOLARADOS

ENTRETENIMENTO9 meses ago

5 DICAS PARA SEU PINHEIRO DE NATAL DURAR MUITO MAIS

Nacional2 meses ago

Manifestação em São Paulo Clama por Liberdade aos Presos Políticos e Impeachment de Alexandre de Moraes

ENTRETENIMENTO3 meses ago

CHICO BUARQUE: 80 ANOS DE CRIATIVIDADE

Internacional6 meses ago

China

CIÊNCIA & TECNOLOGIA3 dias ago

TURISTAS FAZEM CAMINHADA ESPACIAL HISTÓRICA COM A POLARIS DAWN

Saúde3 dias ago

COMO O AUMENTO DA TEMPERATURA AFETA O NOSSO CORPO?

Educação & Cultura3 dias ago

COLÉGIO AGRÍCOLA CRIA UM SISTEMA PARA PRODUÇÃO DE TILÁPIA

ENTRETENIMENTO3 dias ago

COMO ESCOLHER O CANE CORSO PERFEITO: GUARDA E COMPANHIA

Nacional3 dias ago

PRESERVAÇÃO DA AMAZÔNIA É FUNDAMENTAL PARA O EQUILÍBRIO CLIMÁTICO DO PLANETA

AGRICULTURA & PECUÁRIA3 dias ago

O QUE SERÁ DA AGRICULTURA SEM OS JOVENS?

CIÊNCIA & TECNOLOGIA7 dias ago

ANATEL ENDURECE REGRAS PARA O TELEMARKETING

Internacional7 dias ago

MAIOR GELEIRA DOS ALPES ITALIANOS DOLOMITAS PODE DESAPARECER ATÉ 2040

ENTRETENIMENTO7 dias ago

RECEITA: TORTA DE ABÓBORA COM CACHAÇA

Internacional7 dias ago

5 MOMENTOS-CHAVE DO DEBATE ENTRE KAMALA E TRUMP

Nacional7 dias ago

REGIÃO DA CHAPADA DOS VEADEIROS É ATINGIDA POR “FOGO SUBTERRÂNEO”

ENTRETENIMENTO2 semanas ago

Assistam ao filme – Um Anjo em Nossas Vidas 

Judiciário2 semanas ago

QUAL É A IMPORTÂNCIA E A FUNÇÃO DO STF?

Saúde2 semanas ago

COISAS QUE NINGUÉM TE FALA SOBRE A HÉRNIA DE DISCO

ECONOMIA2 semanas ago

ANEEL ANUNCIA BANDEIRA VERMELHA EM SETEMBRO

Segurança Pública2 semanas ago

O QUE ESTÁ POR TRÁS DOS INCÊNDIOS CRIMINOSOS EM SP?

ENTRETENIMENTO2 semanas ago

RESOLVA AS FOLHAS AMARELADAS

CIÊNCIA & TECNOLOGIA2 semanas ago

FUNGOS QUE COMEM PLÁSTICO

CIDADE2 semanas ago

CEARÁ PODE VIRAR LÍDER NA PRODUÇÃO DE HIDROGÊNIO VERDE

CIÊNCIA & TECNOLOGIA2 semanas ago

COMO INSTALAR PLACAS SOLARES DE FORMA SEGURA

Educação & Cultura2 semanas ago

COMO A ELEVAÇÃO DO MAR AFETA O BRASIL? GEÓLOGO EXPLICA

ENTRETENIMENTO2 semanas ago

RECEITA DO CHICO BALANCEADO

CIÊNCIA & TECNOLOGIA2 semanas ago

ANATEL ANUNCIA FUNCIONALIDADES PARA EVITAR GOLPES

Saúde3 semanas ago

É O FIM DOS HOMENS? CROMOSSOMO Y ESTÁ DESAPARECENDO

Saúde3 semanas ago

PESQUISA REVELA DIETA QUE PODE TE FAZER VIVER MAIS

CIÊNCIA & TECNOLOGIA3 semanas ago

SOL VERMELHO, CHUVA ESCURA E TEMPESTADE DE AREIA

Educação & Cultura3 semanas ago

PRIMEIROS GRÃOS DE SOJA CHEGARAM AO BRASIL EM UMA GARRAFA

ENTRETENIMENTO3 semanas ago

PRAGAS E DOENÇAS DAS PLANTAS E COMO CURÁ-LAS

AGRICULTURA & PECUÁRIA3 semanas ago

PRODUÇÃO ORGÂNICA: MORANGOS EM ABRIGOS

CIÊNCIA & TECNOLOGIA3 semanas ago

O PLANO BRASILEIRO PARA ATRAIR PESQUISADORES DE VOLTA AO PAÍS

Advertisement
Advertisement

Vejam também

Somos o Portal Informa Paraíba, uma empresa de marketing e portal de informações que oferece um noticioso com assuntos diversos. Nosso objetivo é fornecer conteúdo relevante e atualizado para nossos leitores, mantendo-os informados sobre os acontecimentos mais importantes. Nossa equipe é composta por profissionais experientes e apaixonados por comunicação, que trabalham incansavelmente para oferecer um serviço de qualidade. Além disso, estamos sempre em busca de novas formas de melhorar e inovar, para podermos atender às necessidades e expectativas de nossos clientes. Seja bem-vindo ao nosso mundo de informações e descubra tudo o que o Portal Informa Paraíba tem a oferecer. Fiquem bem informados acessando o Portal Informa Paraíba: www.informaparaiba.com.br