A Qwen (Android, iOS) apresentou nesta quarta-feira, 24, o seu ecossistema de treinamento de agentes com inteligência artificial generativa. Batizado como Qwen AgentWorld, a proposta da plataforma de IA do Alibaba é simular em um único modelo de linguagem (LLM) sete ambientes de texto ou gráfico para agentes.
São eles:
- Servidor de Model Context Protocol (MCP);
- Motor de busca;
- Navegação web;
- Terminal;
- Engenharia de software;
- Sistema Android;
- Sistema operacional.
De acordo com a companhia, os modelos criados têm como objetivo simular, treinar e prever como ambientes reagem às atividades de um agente e, com isso, reduzir custo e tempo de implementação e evolução de agentes. Ou seja, o AgentWorld é um simulador universal para agentes nesses sete mundos ou ‘Language World Model’ (LWM), uma evolução do LLM.
Isto foi feito por meio de três etapas:
- Pré-treino contínuo com incorporação de conhecimento do ambiente;
- Ajuste fino supervisionado para ativar o raciocínio de previsão;
- Reforço de aprendizado para refinar a fidelidade de simulação.
Benchmark e disponibilidade do LWM da Qwen

Fluxo de trabalho detalhado do Qwen Agent World em inglês (divulgação)
Junto com o seu simulador, a Qwen disponibilizou um comparativo para avaliar os modelos de mundo ante o seu LWM, o AgentWorldBench. Seu uso é para avaliar a qualidade da modelagem de mundo por meio de julgamento baseado em critérios qualitativos que analisam as capacidades de raciocínio, conhecimento e processamento de contextos longos.
A partir desta quarta-feira, o Qwen AgentWorld e o AgentWorldBench estão disponíveis como open source no Hugging Face e no ModelScope.
Imagem principal: divulgação

