Além da apresentação das empresas do III Ciclo do Sandbox.Rio, a prefeitura do Rio de Janeiro anunciou o lançamento da plataforma Rio 3 Open, uma família de seis LLMs (grandes modelos de linguagem desenvolvida a partir do chinês Qwen. Com isso, o custo foi 30 vezes menor se comparado com o desenvolvimento de um sistema de IA de prateleira. Em conversa com Mobile Time, João Cabaretta, diretor-presidente da IplanRio confirmou que a empresa de tecnologia da prefeitura, responsável pelo seu desenvolvimento, gastou R$ 500 mil.
“Antes, os desenvolvimentos das IAs se baseavam simplesmente em adicionar computação (como as GPUs) e o modelo melhorava. Só que a gente começou a bater num platô e as pessoas voltaram a pensar para elaborar novas alternativas, novas ideias de como arquitetar. O que fizemos foi pegar o modelo Qwen, já pronto, e a partir dele modificamos o modelo. Atualmente, o modelo não tem nada a ver com o Qwen original, mas usamos a estrutura e o treinamento. A falta de verba estimula a criatividade”, explica Cabaretta.
A inspiração da IplanRio veio da DeepSeek que nasceu de forma semelhante.

Rafael Coelho, cientista-chefe do projeto. Crédito: Isabel Butcher/Mobile Time
Durante a apresentação do Rio 3, Rafael Coelho, cientista-chefe do projeto, explicou que a equipe precisou fazer propostas de arquiteturas diferentes para que os modelos se tornassem verdadeiramente excepcionais. Uma das principais inovações foi o uso de “modelos de conceitos”, que fazem a IA processar informações em espaços conceituais (como áudio, imagens e vídeos) em vez de ficar limitada a palavras isoladas. Isso tornou o Rio 3 cerca de oito vezes mais rápido que modelos tradicionais de tamanho equivalente.
A equipe também conseguiu implementar uma janela de contexto capaz de ingerir até 1 bilhão de tokens, o que confere ao modelo uma memória maior do que os outros LLMs.
Rio 3: usos na prefeitura
E, para o cidadão carioca, o desenvolvimento da tecnologia gera soluções. Ela está sendo usada, por exemplo, para a prefeitura ler câmeras de segurança em busca de atividades suspeitas, ler documentos para prestação de contas, gerar imagens e vídeos institucionais e no atendimento ao cidadão, para tirar dúvidas.
“Hoje, o Rio 3 é tão bom quanto os principais modelos do mercado e é mais barato. Estamos fazendo algumas aplicações para a prefeitura e ele chegou a ser até 30 vezes mais barato do que um modelo como o Gemini, ChatGPT etc. E, além disso, ele é o começo de um modelo de mundo porque esse modelo não pensa em palavras, mas em conceitos, que depois, se traslada para imagens, palavras, vídeos. É o que a academia está tentando fazer no momento e que a gente está sendo orientado para isso. É o primeiro lançamento e um convite para dar o pontapé inicial para a construção desse foguete”, resumiu Cabaretta durante sua apresentação.

Benchmark matemáticos. Crédito: divulgação
Os modelos
Esses são os seis modelos open source:
Rio 3.0 Open: É o maior e com mais capacidade, ou Open Source flagship, com 235 bilhões de parâmetros e com performance semelhante aos melhores modelos abertos que existem.
Rio 3.0 Open Mini: Uma versão mais compacta, com 44 bilhões de parâmetros. Apesar do tamanho reduzido, ele alcança em testes matemáticos uma performance equivalente à de modelos abertos até 10 vezes maiores. Ideal para desenvolvimento em celulares.
Rio 3.0 Open Nano: modelo mais compacto capaz de rodar 10 mil perguntas por R$ 1.
Rio 3.0 Search: modelo desenvolvido para pesquisar na internet
Rio 2.5 Open: modelo voltado para a criatividade e feito para rodar localmente nos computadores.
Rio 2.5 Open VL: modelo de visão computacional capaz de fazer vídeos, QA, OCR e Grounding.

