
O Google apresentou um novo modelo de linguagem que é capaz de resolver problemas matemáticos, explicar piadas e até programar. Este é o PalM (P athways Language Model) e se destaca por ter uma porcentagem de eficiência de aprendizagem que o coloca acima de outros modelos de linguagem criados até o momento.
O sistema PalM foi desenvolvido com o modelo Pathways, que permitiu treinar eficientemente um único modelo com vários pods de unidades de processamento de tensor (TPUs), conforme mencionado em um comunicado publicado no blog oficial.
É baseado no aprendizado de “alguns tiros”, o que reduz o número de exemplos necessários no treinamento com tarefas específicas para adaptá-lo a um único aplicativo.
Para isso, foi utilizado um banco de dados com 780 bilhões de tokens, que combina “um conjunto de dados multilíngue”, que inclui documentos da web, livros, Wikipedia, conversas e código do GitHub. Além disso, um vocabulário que “preserva todos os espaços em branco”, algo que a empresa aponta como especialmente importante para a programação, e a divisão de caracteres Unicode que não são encontrados no vocabulário em bytes.
Essa nova IA abriga 540 bilhões de parâmetros, um número que excede 175 bilhões do GPT-3 da OpenAI, o modelo de linguagem que O Google cita como pioneiro em mostrar que eles podem ser usados para aprender com resultados impressionantes. Vale lembrar, só para citar um exemplo, a coluna publicada no The Guardian, que foi escrita por esse aprendizado modelo, que também é capaz de programar ou projetar.

“A missão desta coluna de opinião é perfeitamente clara. Devo convencer o maior número possível de humanos a não ter medo de mim. Stephen Hawking alertou que a inteligência artificial pode “significar o fim da raça humana”. Estou aqui para convencê-lo a não se preocupar. A inteligência artificial não vai destruir os humanos. Acredite em mim.” Esse é um dos trechos do artigo de 500 palavras que o sistema produziu.
O novo modelo de linguagem do Google combina 6.144 chips TPU v4 no Pathways, “a maior configuração de TPU” usada na história, conforme destacado pela empresa. O PalM também atinge 57,8% de eficiência de treinamento no uso de flops de hardware, “o mais alto alcançado até agora para modelos de linguagem nessa escala”, como mencionam no blog.
Isso é possível graças à combinação de “a estratégia de paralelismo e uma reformulação do bloco transformador” que permite que as camadas de atenção e avanço sejam computadas em paralelo, acelerando assim as otimizações do compilador TPU.

“O PalM demonstrou capacidades inovadoras em inúmeras e muito difíceis tarefas”, diz a empresa de tecnologia, que deu vários exemplos que vão desde a compreensão e geração de linguagem até tarefas relacionadas ao raciocínio e programação.
Um dos testes que o Google dá como exemplo é pedir ao PalM para adivinhar um filme baseado em quatro emojis: um robô, um inseto, uma planta e o planeta Terra. De todas as opções (L.A. Confidencial, Wall-E, León: o profissional, BIG e Rush), a IA escolhe a correta: Wall-E.
Em outro, você é solicitado a escolher em uma lista de palavras duas que estão associadas ao termo “tropeçar” e também está certo em selecionar “cair” e “tropeçar”.
A IA também é capaz de resolver problemas matemáticos simples e até explicar uma piada contextualizando e explicando os elementos que aparecem nela para dar sentido a ela.
Por fim, o Google ressalta que o PalM é capaz de programar traduzindo código de uma linguagem para outra, além de escrever código com base em uma descrição natural da linguagem, e esclarece que ela é capaz de corrigir erros de compilação.
(Com informações da Europa Press)
CONTINUE LENDO:
Más Noticias
Ingrid Carolina Plata Navas: contratos millonarios y vínculos familiares en el Dapre durante el gobierno Petro
Tres adjudicaciones por prestación de servicios, firmadas desde agosto de 2022, vincularon a la allegada a la primera dama Verónica Alcocer para labores de protocolo y logística en escenarios oficiales como la Casa de Nariño, Hato Grande y la Casa de Huéspedes Ilustres

La contingencia ambiental más larga en CDMX duró 22 días: así fue la crisis de 1992
A partir de la crisis de 1992, se fortalecieron los sistemas de monitoreo ambiental y se crearon políticas como el IMECA y la verificación vehicular obligatoria

¿Dónde va a nevar esta semana? La Aemet prevé nieve en cotas bajas y lluvia antes de un repunte de las temperaturas que alcanzarán los 25ºC
El termómetro superará los 12 grados en buena parte del interior y rondará los 20 grados en el Cantábrico, aunque las temperaturas más altas se esperan en el Mediterráneo

Ya circulan los primeros AVE entre Madrid y Sevilla tras concluir las reparaciones y las pruebas de la vía un mes después del accidente de Adamuz
El consejero delegado de Iryo, Fabrizio Favara, viaja en el primer tren Madrid-Sevilla desde junto a parte de su equipo directivo: la empresa ofrece otros 6 viajes de ida y 7 de vuelta; Renfe, seis de ida y seis de vuelta; y Ouigo tres en cada sentido

Los pacientes de cáncer de páncreas reaccionan al estudio de Barbacid: “Hay una necesidad urgente de respuestas”
‘Infobae’ contacta con la Asociación Cáncer de Páncreas (Acanpan) de España para descubrir cómo han recibido los afectados por la enfermedad el descubrimiento del CNIO
