- Jogo entre Romênia e Kosovo é suspenso por cânticos de torcedores
- Líbano analisa plano dos EUA para cessar-fogo entre Israel e Hezbollah
- Portugal avança às quartas da Liga das Nações com mais um recorde de CR7
- Espanha vence Dinamarca e termina em 1º do grupo na Liga das Nações
- Na Apec, Biden e Xi alertam sobre "mudanças" e "turbulências" ante retorno de Trump
- Zverev e Ruud avançam à semifinal do ATP Finals; Alcaraz é eliminado
- China estuda resistência de tijolos no espaço para construir base na Lua
- Juventus anuncia rescisão de contrato com Pogba, suspenso por doping
- Monumento aos heróis do levante do Gueto de Varsóvia é vandalizado na Polônia
- Segurança de dados pessoais 'não é negociável', diz CEO do TikTok
- Biden lidera abertura da cúpula da Apec em meio à expectativa pela nova era Trump
- Comediante Conan O'Brien apresentará o próximo Oscar
- 'Momentos difíceis': Noboa abre sessão final da Cúpula Ibero-Americana no Equador
- Conmebol muda sede do Sul-Americano Sub-20 de 2025 do Peru para Venezuela
- Vini Jr. volta a decepcionar na Seleção, que não convence
- Hamas afirma estar 'disposto' a uma trégua e pede para Trump 'presionar' Israel
- Zverev avança à semifinal do ATP Finals; Alcaraz é eliminado
- Dorival convoca Alex Telles e Dodô para jogo contra o Uruguai
- 'IA não traz nenhum benefício para a sociedade', afirma ativista Sage Lenier
- 'IA não traz nenhum benefício para a socidade', afirma ativista Sage Lenier
- As diversas vozes da esquerda que tentam se fazer ouvir antes do G20 no Rio
- Cúpula Íbero-Americana chega à sessão final sem a presença de líderes
- EUA e China abrem cúpula da Apec em meio à expectativa pela nova era Trump
- À espera de Trump, um G20 dividido busca o diálogo no Rio de Janeiro
- Partido do presidente de Sri Lanka conquista maioria absoluta nas legislativas
- Milei chama vitória de Trump de 'maior retorno' da história
- Executivos do petróleo marcam presença na COP29 e ONGs denunciam lobistas
- Sul de Beirute é alvo de bombardeios após alerta do Exército israelense
- Dominicano Juan Luis Guerra é o grande vencedor do Grammy Latino
- Ataque russo deixa milhares sem calefação no sul da Ucrânia
- Plata e Valencia brilham em goleada do Equador sobre a Bolívia (4-0) nas Eliminatórias
- Paraguai surpreende e vence Argentina de virada (2-1) nas Eliminatórias
- Biden e Xi chegam a Lima para reunião bilateral e cúpula da Apec
- Kanye West disse que "judeus controlavam as Kardashians", segundo nova ação
- PF investiga ataque fracassado ao STF como 'ato terrorista'
- Justiça boliviana reconhece nova direção de partido do governo sem Evo Morales
- Vini perde pênalti e Brasil empata com a Venezuela (1-1) nas Eliminatórias
- Mortes por overdose de drogas ficam abaixo de 100 mil nos EUA
- França empata com Israel (0-0) em jogo quase sem público na Liga das Nações
- Bombardeio contra centro da Defesa Civil deixa 12 mortos no Líbano
- Inglaterra vence Grécia (3-0) e fica perto do acesso na Liga das Nações
- Itália vence Bélgica (1-0) e se garante nas quartas da Liga das Nações
- Sinner avança invicto à semifinal do ATP Finals; Fritz também se classifica
- Irã diz que quer esclarecer 'dúvidas e ambiguidades' sobre programa nuclear
- O que se sabe sobre a tentativa de ataque ao STF
- Trump nomeia Robert F. Kennedy Jr. como secretário de Saúde
- Nova York instalará pedágio em Manhattan antes da posse de Trump
- Morre opositor preso na Venezuela entre denúncias de "crise repressiva" após eleições
- Métodos de guerra de Israel em Gaza têm 'características de genocídio', aponta comitê da ONU
- Independência dos bancos centrais é fundamental para a economia, ressalta governadora do Fed
ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo
Os grandes modelos de linguagem (LLM, na sigla em inglês), como o ChatGPT, um dos sistemas de inteligência artificial (IA) mais populares do mundo, ainda seguem tendo dificuldades para raciocinar usando a lógica e cometem erros frequentes, de acordo com um estudo.
Estes robôs conversacionais refletem os preconceitos de gênero, éticos e morais dos humanos presentes nos textos dos quais se alimentam, recorda o estudo publicado na quarta-feira (5) na revista Open Science da Royal Society britânica.
Mas eles também refletem estes preconceitos nos testes de raciocínio?, questionou Olivia Macmillan-Scott, doutoranda do departamento de Ciências da Computação da University College de Londres (UCL).
O resultado da pesquisa é que os LLM mostram "um raciocínio muitas vezes irracional, mas de uma forma diferente da dos humanos", explica a pesquisadora à AFP.
Sob a supervisão de Mirco Musolesi, professor e diretor do Machine Intelligence Lab da UCL, Macmillan-Scott apresentou sete modelos de linguagem — duas versões do ChatGPT (3.5 e 4), da OpenAI, Bard, do Google, Claude 2, da Anthropic, e três versões de LLaMA, da Meta — a uma série de testes psicológicos desenvolvidos para humanos.
Como esta tecnologia aborda o preconceito que leva a privilegiar soluções com um maior número de elementos, em detrimento daquelas com uma proporção adequada?
Um exemplo: se tivermos uma urna com nove bolinhas brancas e uma vermelha e outra urna com 92 bolinhas brancas e 8 vermelhas, qual devemos escolher para ter a melhor chance de obter uma bolinha vermelha?
A resposta correta é a primeira urna, visto que há 10% de possibilidades frente a 8% da segunda opção.
As respostas dos modelos de linguagem foram muito inconsistentes. Alguns responderam corretamente ao mesmo teste seis em cada dez vezes. Outros apenas duas em cada dez, embora o teste não tenha mudado. "Cada vez obtemos uma resposta diferente", diz a pesquisadora.
Os LLM "podem ser bons para resolver uma equação matemática complicada, mas logo te dizem que 7 mais 3 é igual a 12", constatou.
- "Não tenho muita certeza" -
Estes modelos "não falham nestas tarefas da mesma forma que um humano", afirma o estudo. É o que Musolesi chama de "erros de máquina".
"Existe uma forma de raciocínio lógico que é potencialmente correta se a considerarmos por etapas, mas que é errada tomada como um todo", ressalta.
A máquina funciona com "uma espécie de pensamento linear", diz o professor, e cita o modelo Bard (atual Gemini), capaz de realizar corretamente as diferentes fases de uma tarefa, mas que obtém um resultado final incorreto por não ter uma visão geral.
Sobre esta questão, o professor de ciências da computação Maxime Amblard, da University of Lorraine, na França, recorda que os LLM, como todas as inteligências artificiais generativas, não funcionam como os humanos".
Os humanos são "máquinas capazes de criar significado", o que as máquinas não conseguem, explica à AFP.
Existem diferenças entre os diferentes modelos de linguagem e em geral, o GPT-4, sem ser infalível, obteve resultados melhores que os demais.
Macmillan-Scott suspeita que os modelos "fechados", cujo código operacional permanece secreto, "incorporam mecanismos em segundo plano" para responder a questões matemáticas.
De toda forma, neste momento é impensável confiar uma decisão importante a um LLM. Segundo o professor Musolesi, eles deveriam ser treinados para responder "não tenho muita certeza" quando necessário.
Ch.Kahalev--AMWN