A Qwen (Android, iOS) apresentou nesta quarta-feira, 24, o seu ecossistema de treinamento de agentes com inteligência artificial generativa. Batizado como Qwen AgentWorld, a proposta da plataforma de IA do Alibaba é simular em um único modelo de linguagem (LLM) sete ambientes de texto ou gráfico para agentes. 

São eles:

  1. Servidor de Model Context Protocol (MCP);
  2. Motor de busca;
  3. Navegação web;
  4. Terminal;
  5. Engenharia de software;
  6. Sistema Android;
  7. Sistema operacional.  

De acordo com a companhia, os modelos criados têm como objetivo simular, treinar e prever como ambientes reagem às atividades de um agente e, com isso, reduzir custo e tempo de implementação e evolução de agentes. Ou seja, o AgentWorld é um simulador universal para agentes nesses sete mundos ou ‘Language World Model’ (LWM), uma evolução do LLM. 

Isto foi feito por meio de três etapas:

  1. Pré-treino contínuo com incorporação de conhecimento do ambiente;
  2. Ajuste fino supervisionado para ativar o raciocínio de previsão;
  3. Reforço de aprendizado para refinar a fidelidade de simulação.

Benchmark e disponibilidade do LWM da Qwen

Qwen, Alibaba, LLM, LWM, AgentWorld, agentes, IA, inteligência, artificial, AgentWorldBench

Fluxo de trabalho detalhado do Qwen Agent World em inglês (divulgação)

Junto com o seu simulador, a Qwen disponibilizou um comparativo para avaliar os modelos de mundo ante o seu LWM, o AgentWorldBench. Seu uso é para avaliar a qualidade da modelagem de mundo por meio de julgamento baseado em critérios qualitativos que analisam as capacidades de raciocínio, conhecimento e processamento de contextos longos.

A partir desta quarta-feira, o Qwen AgentWorld e o AgentWorldBench estão disponíveis como open source no Hugging Face e no ModelScope

Imagem principal: divulgação

 

*********************************

Receba gratuitamente a newsletter do Mobile Time e fique bem informado sobre tecnologia móvel e negócios. Cadastre-se aqui!

Siga o canal do Mobile Time no WhatsApp!

As ilustrações das matérias são produzidas por Mobile Time com IA