DeepSeek apresenta LLM focado na construção de agentes

O novo modelo da empresa chinesa recebe ainda uma estrutura de aprendizagem por reforço escalável para aumentar o poder computacional no pós-treino