Connect with us

CIÊNCIA & TECNOLOGIA

O que é o colapso dos modelos de IA, sobre o qual alertam pesquisadores

Pesquisadores da área de inteligência artificial têm levantado preocupações sobre um fenômeno chamado “colapso dos modelos de IA”, que pode comprometer a eficácia das futuras gerações dessas tecnologias. O termo se refere a um processo degenerativo que ocorre quando modelos de IA são treinados utilizando dados gerados por outros modelos de IA, em vez de dados originados por humanos.

Esse fenômeno é motivo de preocupação crescente na comunidade científica, especialmente à medida que cresce a quantidade de conteúdos gerados por IA na internet e a utilização desses materiais para “retroalimentar” o treinamento dos modelos.

Colapso dos modelos de IA

Em um artigo publicado na revista Nature no último mês de julho, os pesquisadores Ilia Shumailov, Zakhar Shumaylov, Yiren Zhao, Nicolas Papernot, Ross Anderson e Yarin Gal mostram como os modelos de IA apresentam resultados piores quando são treinados em dados gerados artificialmente.

A principal preocupação dos pesquisadores é que o aumento do conteúdo gerado por IA na internet crie um ciclo de retroalimentação, onde novos modelos de IA são treinados em dados gerados por modelos anteriores.

De acordo com os autores, “o desenvolvimento de modelos de linguagem de larga escala (LLMs) requer grandes quantidades de dados de treinamento. No entanto, embora os LLMs atuais tenham sido treinados em texto predominantemente gerado por humanos, isso pode mudar. Se os dados de treinamento da maioria dos modelos futuros também forem extraídos da web, eles inevitavelmente treinarão em dados produzidos por seus predecessores”.

Pesquisadores alertam que o treinamento de IA com dados gerados por IA pode causar
Pesquisadores alertam que o treinamento de IA com dados gerados por IA pode causar “colapso dos modelos” 

O estudo mostra como essa prática pode resultar em uma perda progressiva de precisão e diversidade nos resultados dos modelos, em um processo que os cientistas chamam de “colapso dos modelos”.

Esse processo, conforme detalhado pelos autores, ocorre devido a três tipos de erros que se acumulam ao longo de gerações de modelos: erro de aproximação estatística, erro de expressividade funcional e erro de aproximação funcional.

Cada um desses erros contribui para a degradação gradual da qualidade dos modelos, que passam a reproduzir de forma imprecisa as informações originais, culminando no que os pesquisadores descrevem como uma “perda de informação” em estágios iniciais e uma “convergência que pouco se assemelha à original” em estágios mais avançados.

Regurgitação de dados no treinamento de IAs

A prática de treinar modelos de IA com dados gerados por outros modelos também é discutida em outro artigo científico: “Regurgitative Training” (ou “Treinamento Regurgitativo”, em tradução direta), de Jinghui Zhang, Dandan Qiao, Mochen Yang e Qiang Wei, também publicado em julho.

Nesse estudo, os autores exploram os efeitos do que chamam de “regurgitação de dados no treinamento de IAs” e concluem que esse processo resulta em uma perda de desempenho dos modelos.

Pesquisadores dizem que IAs treinadas com dados gerados por outros modelos apresentam queda de desempenho (Imagem: Reprodução/Freepik)
Pesquisadores dizem que IAs treinadas com dados gerados por outros modelos apresentam queda de desempenho

Segundo os pesquisadores, “o sucesso explosivo de LLMs, como ChatGPT e Llama, significa que uma quantidade substancial de conteúdo online será gerada por LLMs em vez de humanos, o que inevitavelmente entrará nos conjuntos de dados de treinamento de LLMs de próxima geração”.

O “treinamento regurgitado” é visto pelos autores como algo inevitável, devido à proliferação de conteúdo gerado por IA. “Há evidências que sugerem que uma grande parte da web já é gerada por modelos de tradução automática”, destaca a equipe no artigo.

Porém, os pesquisadores concluem em suas análises que “treinar um novo LLM usando dados gerados (menos que parcialmente) por ele mesmo ou por outros LLMs geralmente resulta em desempenho inferior em relação ao treinamento com dados reais”.

Fim dos dados gerados por humanos

Os dois artigos publicados em julho também se relacionam com outro ponto crítico sobre o treinamento de modelos de IA: a perspectiva de que os dados disponíveis gerados por humanos podem acabar em breve.

Com a popularização das soluções de inteligência artificial, a demanda por banco de dados de alta qualidade para treinar as IAs cresceu exponencialmente. Para obter esses dados, grandes empresas de tecnologia, como OpenAI, Meta e Google, realizam a chamada “raspagem” de conteúdos da web, coletando terabytes de dados para alimentar seus modelos.

Modelos podem ficar sem dados de qualidade produzidos por humanos na web a partir de 2026, alertam pesquisadores (Imagem: Kjpargeter/Freepik)
Modelos podem ficar sem dados de qualidade produzidos por humanos na web a partir de 2026, alertam pesquisadores

No entanto, um artigo publicado em 2023 alerta que o estoque de dados de texto gerados por humanos pode se esgotar até 2026, caso a velocidade da coleta de dados continue no ritmo atual.

Para chegar a essa conclusão, os autores de “Ficaremos sem dados? Limites da escalabilidade do LLM com base em dados gerados por humanos” desenvolveram um modelo preditivo sobre a demanda por dados e a produção humana de texto com disponibilidade pública na web.

“Nossa análise revela uma conjuntura crítica se aproximando até o final desta década, onde a dependência atual de dados de texto humano público para treinamento de LLMs pode se tornar insustentável”, conclui o time de pesquisadores.

Sem dados humanos de alta qualidade, os modelos de IA podem enfrentar um declínio acentuado em sua capacidade de aprendizado e apresentar uma queda de desempenho.

Com a perspectiva de que os futuros LLMs serão inevitavelmente treinados com dados gerados por IA, os pesquisadores temem um processo degenerativo que tornará as IAs cada vez mais “burras”, podendo levar ao colapso dos modelos de inteligência artificial.

Continue Reading
Advertisement

Relógio

Instagram Portal Informa Paraíba

Advertisement

Grupo do Portal Informa Paraíba (Facebook)

TWITTER DO PORTAL INFORMA PARAÍBA

Página do Portal Informa Paraíba (Facebook)

Judiciário7 horas ago

Fome e pobreza: graves violações de direitos humanos. Aporofobia é crime?

CIDADE7 horas ago

Funjope reúne instituições para discutir ações durante festas de fim de ano

CIDADE7 horas ago

Prefeitura realiza programação de Natal pela primeira vez no Parque das Três Ruas

CIDADE7 horas ago

João Pessoa lidera ranking dos destinos mais desejados do mundo para 2025

Saúde7 horas ago

Maternidade Frei Damião celebra Novembro Roxo com homenagem a mães e bebês prematuros

Saúde7 horas ago

Experiência exitosa da odontologia do Edson Ramalho é apresentada na 1ª Mostra Nacional de Saúde Bucal, em Brasília

Saúde7 horas ago

Hemodinâmica de Patos ultrapassa meta e alcança 3 mil procedimentos realizados em 2024

Educação & Cultura7 horas ago

Governo homologa inscrições finais dos prêmios Mestres da Educação e Escola de Valor

ESTADO7 horas ago

João Azevêdo prestigia inauguração da usina Giasa e destaca capacidade da Paraíba de atrair novos empreendimentos

Segurança Pública8 horas ago

16+5 Dias de Ativismo 2024: Feminicídio Zero é o foco das ações na Paraíba

ESTADO8 horas ago

Comitiva de engenheiros e autoridades visita obras de ampliação do sistema de esgotos Usina II

CIDADE8 horas ago

Cabedelo vai realizar Semana do Empreendedor com alunos da rede municipal e debater importância da educação financeira

ESTADO8 horas ago

Na Paraíba, quatro cidades obtêm o reconhecimento federal de situação de emergência devido à estiagem

Esporte8 horas ago

Jogos da Juventude iniciam nova etapa a partir deste domingo

ESTADO8 horas ago

Natal da Usina é declarado Patrimônio Cultural e Imaterial da Paraíba

ENTRETENIMENTO9 horas ago

‘Tardezinha do Abraço’ reúne crianças autistas e familiares neste domingo

Educação & Cultura9 horas ago

Encontro Unificado da UFPB começa nesta segunda (25) com apresentação de mais de 3.600 trabalhos

Educação & Cultura9 horas ago

Pagamento do Pé-de-Meia começa na próxima segunda (25/11). Confira calendário

Esporte9 horas ago

Prefeito recebe atletas que vão disputar Paralimpíadas Escolares e projeta construção de uma Vila Olímpica em parceria com o Governo do Estado

Judiciário9 horas ago

Câmara do TCE aprova as contas do Consórcio de Saúde do Sertão e de duas Câmaras de Vereadores

CIDADE9 horas ago

Feira Móvel do Produtor estaciona no Busto de Tamandaré neste final de semana

CIDADE9 horas ago

BOMBA EM CG: ex-candidatos a vereadores denunciam esquema de rachadinha com dinheiro do fundo partidário; Veja os prints

Saúde9 horas ago

Ambulatório de Traumatologia da Paraíba realizou evento em alusão ao Novembro Azul

ESTADO9 horas ago

Atualização do Cartão Alimentação continua em outros cinco municípios na próxima semana

ECONOMIA9 horas ago

Procon-JP divulga pesquisa de cestas prontas para as festas de final de ano

Segurança Pública9 horas ago

Energisa e polícia realizam ação integrada de combate ao furto de energia e 8 pessoas são presas

Politíca10 horas ago

Ruy celebra tradição da Romaria da Penha e destaca recurso que destinou para restruturação da praça no Santuário

Politíca10 horas ago

NA ALPB: deputado Júnior Araújo destaca a importância do Novembro Azul e cobra ações para saúde masculina na Paraíba

Politíca10 horas ago

Tovar defende desburocratização para fortalecer empreendedorismo durante workshop promovido pelo Sinduscon e Energisa

Politíca10 horas ago

Veneziano se reúne com ministro das Cidades em Brasília e trata da construção de moradias em cidades da Paraíba

ENTRETENIMENTO8 meses ago

Estes SINAIS mostram que a pessoa te quer, mas FINGE que não está a fim!

ECONOMIA11 meses ago

Calendário do Bolsa Família 2024: saiba quando você vai receber

AGRICULTURA & PECUÁRIA11 meses ago

Com produtor revisando tamanho da safra, 2024 inicia cercado de incertezas para a soja

Internacional11 meses ago

Secretário-geral da ONU condena atos criminosos no Equador

CONCURSO E EMPREGO11 meses ago

Carreiras em Extinção? Veja Quais Podem Sumir

Internacional11 meses ago

Fome já é generalizada em Gaza, alerta ONU

CIDADE11 meses ago

Polêmica em Princesa Isabel: Vereadores aprovam aumento salarial próprio e do Executivo

AGRICULTURA & PECUÁRIA11 meses ago

Número de IGs cresceu 60% em quatro anos no Brasil

Saúde11 meses ago

OS PRINCIPAIS LEGUMES E VERDURAS QUE AJUDAM A PREVENIR DOENÇAS CRÔNICAS

Internacional11 meses ago

Israel quer controlar e fechar fronteira entre Gaza e Egito

Educação & Cultura11 meses ago

Campina Grande entra na disputa e poderá ser escolhida para receber nova Escola de Sargentos do Exército após impasse em Pernambuco

Internacional4 meses ago

Rússia ameaça atacar capitais europeias em retaliação

Internacional11 meses ago

“Perdas, dor e angústia” após ataques aéreos marcam o início do ano na Ucrânia

CIÊNCIA & TECNOLOGIA11 meses ago

Vale a pena usar um gerador de conteúdo para redes sociais?

Nacional11 meses ago

TCU pede que ministra da Saúde pague R$ 11 milhões a cofres públicos

Judiciário6 meses ago

Juízes comemoram inclusão do Judiciário entre atividades de risco

ENTRETENIMENTO11 meses ago

PASSEIO MOSTRA COMO É UM BORBOLETÁRIO

ENTRETENIMENTO6 meses ago

4 sinais que ela não te quer mais (e o que fazer para ter certeza)

ENTRETENIMENTO9 meses ago

1º Cabedelo MotoFest: prepare-se para uma explosão de emoções na praia do Jacaré!

ESTADO12 meses ago

Energisa reúne empresas de telecomunicações para tratar sobre segurança na disposição de cabos em postes 

ENTRETENIMENTO11 meses ago

HORTÊNSIAS

CIÊNCIA & TECNOLOGIA2 semanas ago

ROVER CHINÊS ENCONTRA VESTÍGIOS DE OCEANO EXTINTO EM MARTE

Esporte6 meses ago

Viviane Pereira vence luta de estreia no último Pré-Olímpico de Boxe

ENTRETENIMENTO6 meses ago

CRIANDO LAGARTOS EXÓTICOS LEGALMENTE

ENTRETENIMENTO12 meses ago

DEZ FLORES PARA LOCAIS ENSOLARADOS

ENTRETENIMENTO12 meses ago

5 DICAS PARA SEU PINHEIRO DE NATAL DURAR MUITO MAIS

ENTRETENIMENTO5 meses ago

CHICO BUARQUE: 80 ANOS DE CRIATIVIDADE

ECONOMIA5 meses ago

PIX TERÁ OPÇÃO DE PAGAMENTO POR APROXIMAÇÃO

Nacional4 meses ago

Manifestação em São Paulo Clama por Liberdade aos Presos Políticos e Impeachment de Alexandre de Moraes

Segurança Pública4 semanas ago

Policiais ganham direito após anos de luta: já é possível escolher outro estado para trabalhar

Saúde4 dias ago

BRASILEIROS CRIAM VACINA CONTRA O CÂNCER DE PRÓSTATA

Saúde4 dias ago

SISTEMA IMUNE, MAGIA DA NATUREZA

Educação & Cultura4 dias ago

A ERA DA IA NA EDUCAÇÃO

CONCURSO E EMPREGO4 dias ago

PEC QUE ALTERA JORNADA 6X1 LEVANTA DISCUSSÃO SOBRE TEMPO DEDICADO AO TRABALHO

ENTRETENIMENTO4 dias ago

DOGUE ALEMÃO: TUDO QUE VOCÊ PRECISA SABER ANTES DE ADOTAR UM

Educação & Cultura1 semana ago

CELULAR PODE IMPACTAR EM ATÉ 40% NO DESEMPENHO ESCOLAR DAS CRIANÇAS

CONCURSO E EMPREGO1 semana ago

ESCALA 6X1: DO TIKTOK AO CONGRESSO

Saúde1 semana ago

QUANDO SUSPEITAR DE UMA INSUFICIÊNCIA CARDÍACA?

CIÊNCIA & TECNOLOGIA1 semana ago

TECIDO HUMANO NO ESPAÇO: PESQUISA DESVENDA O ENVELHECIMENTO

ENTRETENIMENTO1 semana ago

COMO REPLANTAR SAMAMBAIA EM VASO PARA TER PLANTA SAUDÁVEL

CONCURSO E EMPREGO1 semana ago

O que é CLT?

Saúde1 semana ago

DIABETES: TUDO O QUE VOCÊ PRECISA SABER SOBRE A CONDIÇÃO

Internacional1 semana ago

COMO FAZER PARA TRABALHAR NA ALEMANHA?

ENTRETENIMENTO1 semana ago

COMO TRANSPLANTAR ORQUÍDEAS DO VASO PARA A ÁRVORE?

Educação & Cultura1 semana ago

‘IDIOMA QUE FALAMOS DETERMINA COMO PENSAMOS’

ENTRETENIMENTO1 semana ago

AS 9 RARIDADES DO CERRADO

Educação & Cultura2 semanas ago

O FUTURO DA EDUCAÇÃO (PARTE II)

Saúde2 semanas ago

NARCISISTAS, LIVRE-SE DELES

ENTRETENIMENTO2 semanas ago

PEQUENOS, COLORIDOS E MORTAIS

CIÊNCIA & TECNOLOGIA2 semanas ago

ROBÔ INTELIGENTE DESMONTA PEÇAS DE LIXO ELETRÔNICO

ECONOMIA2 semanas ago

STARTUP NO NORDESTE POTENCIALIZA ECONOMIA CIRCULAR

Saúde2 semanas ago

UTENSÍLIOS FEITOS DE PLÁSTICO PRETO PODEM TER SUBSTÂNCIAS CANCERÍGENAS

Educação & Cultura2 semanas ago

O FUTURO DA EDUCAÇÃO (PARTE I)

CIÊNCIA & TECNOLOGIA2 semanas ago

ROVER CHINÊS ENCONTRA VESTÍGIOS DE OCEANO EXTINTO EM MARTE

ENTRETENIMENTO2 semanas ago

TORTA DE MAMONA: UM SUPER ADUBO

Internacional2 semanas ago

MUNDO DEVE SUPERAR META DE 1,5°C DE AQUECIMENTO EM 2024

Internacional2 semanas ago

A verdadeira história de Donald Trump

Politíca2 semanas ago

Veneziano: Cúpula dos Parlamentos do G20 contribui para eficiência legislativa

Nacional2 semanas ago

Saiba o que é o encontro do G20, que acontece após a Cúpula dos Parlamento

ENTRETENIMENTO2 semanas ago

CRIAÇÃO DE COBRAS RARAS

Advertisement
Advertisement

Vejam também

Somos o Portal Informa Paraíba, uma empresa de marketing e portal de informações que oferece um noticioso com assuntos diversos. Nosso objetivo é fornecer conteúdo relevante e atualizado para nossos leitores, mantendo-os informados sobre os acontecimentos mais importantes. Nossa equipe é composta por profissionais experientes e apaixonados por comunicação, que trabalham incansavelmente para oferecer um serviço de qualidade. Além disso, estamos sempre em busca de novas formas de melhorar e inovar, para podermos atender às necessidades e expectativas de nossos clientes. Seja bem-vindo ao nosso mundo de informações e descubra tudo o que o Portal Informa Paraíba tem a oferecer. Fiquem bem informados acessando o Portal Informa Paraíba: www.informaparaiba.com.br