Qwen lança modelo para treinar agentes em 'múltiplos mundos'

A Qwen (Android, iOS) apresentou nesta quarta-feira, 24, o seu ecossistema de treinamento de agentes com inteligência artificial generativa. Batizado como Qwen AgentWorld, a proposta da plataforma de IA do Alibaba é simular em um único modelo de linguagem (LLM) sete ambientes de texto ou gráfico para agentes.

São eles:

Servidor de Model Context Protocol (MCP);
Motor de busca;
Navegação web;
Terminal;
Engenharia de software;
Sistema Android;
Sistema operacional.

De acordo com a companhia, os modelos criados têm como objetivo simular, treinar e prever como ambientes reagem às atividades de um agente e, com isso, reduzir custo e tempo de implementação e evolução de agentes. Ou seja, o AgentWorld é um simulador universal para agentes nesses sete mundos ou ‘Language World Model’ (LWM), uma evolução do LLM.

Isto foi feito por meio de três etapas:

Pré-treino contínuo com incorporação de conhecimento do ambiente;
Ajuste fino supervisionado para ativar o raciocínio de previsão;
Reforço de aprendizado para refinar a fidelidade de simulação.

Benchmark e disponibilidade do LWM da Qwen

Qwen, Alibaba, LLM, LWM, AgentWorld, agentes, IA, inteligência, artificial, AgentWorldBench

Fluxo de trabalho detalhado do Qwen Agent World em inglês (divulgação)

Junto com o seu simulador, a Qwen disponibilizou um comparativo para avaliar os modelos de mundo ante o seu LWM, o AgentWorldBench. Seu uso é para avaliar a qualidade da modelagem de mundo por meio de julgamento baseado em critérios qualitativos que analisam as capacidades de raciocínio, conhecimento e processamento de contextos longos.

A partir desta quarta-feira, o Qwen AgentWorld e o AgentWorldBench estão disponíveis como open source no Hugging Face e no ModelScope.

Imagem principal: divulgação

Qwen do Alibaba lança plataforma para treinar agentes em múltiplos ambientes

Benchmark e disponibilidade do LWM da Qwen

Henrique Medeiros

Assine nossa newsletter

Email cadastrado com sucesso.

Qwen do Alibaba lança plataforma para treinar agentes em múltiplos ambientes

Benchmark e disponibilidade do LWM da Qwen

Henrique Medeiros

Notícias Relacionadas

Assine nossa newsletter

Email cadastrado com sucesso.