Não é necessário ter uma unidade de processamento gráfico (GPU) “poderosa” em um dispositivo móvel para que a utilização e o avanço da inteligência artificial generativa aconteçam, explicou o vice-presidente de computação empresarial da NVIDIA, Manuvir Das. Durante a prévia de lançamentos da parceria entre Microsoft e NVIDIA na última terça-feira, 14, o executivo deu destaque ao papel da nuvem e das lojas de apps na emancipação dessa tecnologia, ou seja, o hardware pesado na mão do usuário fica em segundo plano.

“O celular é uma plataforma fantástica para o consumo de IA generativa e essa miríade de aplicativos pode ser obtida pelo usuário nas lojas de apps. O dispositivo móvel está conectado à nuvem e, assim, todo o trabalho para a IA generativa e a execução da modal (da aplicação) pode acontecer em um serviço de nuvem que o dispositivo móvel está acessando”, disse Das, em resposta para esta publicação sobre o possível avanço da IA generativa no mobile.

“Não é necessário ter uma GPU poderosa em um dispositivo móvel para que a inferência (com IA) realmente aconteça. Portanto, o celular é um formato fantástico (para uso da IA generativa). E, de fato, existem muitos aplicativos para a criatividade que as pessoas usam em dispositivos móveis, como editar imagens e gerar textos. Mobile é uma ótima plataforma para o consumo de IA generativa e para criação de conteúdo”, completou.

Aplicações

Durante o evento sobre a parceria entre as duas empresas – com a Microsoft colocando a sua nuvem Azure como acelerador da IA generativa, em especial em copiloto –, na última quarta-feira, 15, a NVIDIA apresentou lançamentos de dois serviços para o avanço das empresas e de aplicações na tecnologia, tais como:

  • Fundação de IA generativa para empresas, NVIDIA AI Foundry Services, que permite a criação de modelos de IA generativa para gerar diversas aplicações, como chatbots, geradores de imagens e otimização de grandes modelos de linguagem. Aqui, a Getty Images e a Amdocs estão usando esta solução;
  • A arquitetura (conjuntos de unidades gráficas) NVIDIA Hopper e a plataforma de training-as-a-service de aplicações de IA, NVIDIA DGX Cloud, chegando ao Microsoft Azure para acelerar a criação de aplicações de IA generativa empresariais.

Modelos de IA em Hubs

Outro destaque é a NVIDIA AI Foundations Models, um hub com uma série de aplicações e LLMs prontas para rápido desenvolvimento de modelos de IA generativa voltados para os negócios. Com modelos como LLama da Meta AI, Stable Diffusion XL da Stability.ai e os Nemontrons da NVIDIA, a plataforma tem como contrapartida dois modelos de negócios: um gratuito e outro na nuvem da Microsoft.

“O nosso modelo de negócios tem duas partes. Uma delas é de ‘comunidade’. Nele, o desenvolvedor pega o modelo, coloca em seu portfólio como o Runtime da NVIDIA e quando você aplica para a empresa, nós monetizamos pelo tempo de execução nas nossas placas de vídeo, independentemente se estiver na nuvem ou localmente (on premisses)”, explicou Das, sobre o modelo mais flexível criado pelo fato de a IA generativa ainda estar em seus primeiros estágios de vida.

“Hoje, várias companhias estão experimentando e nós queremos crescer com o consumidor. Portanto, quanto mais casos de uso de IA forem implementados, mais licenças a empresa consumirá da NVIDIA. E se esses casos de uso não crescerem, as companhias não vão consumir nossas licenças”.

Na segunda parte do modelo de negócios da NVIDIA, o VP explicou que é destinado para quando a empresa está na fase inicial de um trabalho mais robusto em IA generativa, como ajuste fino (fine-tuning, no original em inglês), customização dos modelos ou até construção dos modelos de IA do zero. As companhias podem treinar esses modelos com APIs disponíveis no DGX Cloud que chegou à Azure na última quarta-feira.

Metaverso

Duas outras aplicações demonstradas no evento são voltadas para o metaverso industrial, ou seja, um outro campo de aposta da NVIDIA. Por meio da Omniverse Cloud da NVIDIA e ligada à Microsoft Azure, as montadoras terão acesso a API de simulação virtual de chão de fábrica e um motor de simulação com sensores automotivos (câmera, LIDAR e Radar).