O Santander tem 5 mil tabelas em um modelo de marketplace de dados, um espaço para gestores de dados do banco acessarem informações estruturadas da instituição financeira. De acordo com Laila Kurati, head de data strategy e management da instituição, este é apenas o começo da jornada.

Durante o Databricks Industry Fórum, evento organizado pela companhia de IA e dados nesta terça-feira, 16, a executiva do banco afirmou que espera ter toda sua jornada de dados no espaço compartilhado até o final de 2024.

Batizado como Oxygen, o marketplace interno é um catálogo de dados do Santander e funciona como “uma grande vitrine” para produtos de dados que são disponibilizados para consumo. Seu objetivo é reduzir as duplicidades de informações, baixar o tempo de descoberta dos dados,  oferecer jornada simples aos usuários do banco e democratizar o consumo no ecossistema do banco.

Estruturação de dados

Para chegar até o Oxygen, o banco organizou o consumo de dados por contexto de negócios. Para isso, as áreas de negócios do Santander saíram de um modelo antigo baseado em silos de dados – com fontes de dados específicas – para um formato de dados democratizados com domínios de dados e ativos reutilizáveis.

Kurati afirmou que o foco da estruturação da governança de dados foi na geração de valor: “Elencamos casos de uso de dados focados em negócio, receita ou eficiência. Hoje, dentro do Santander, temos escopo e domínio de dados em quase todas as 35 áreas. Risco de crédito bebe disso, CRM também”, completou. Há também há RH, canais, riscos, clientes PF e finanças. A partir desses domínios de dados, os ativos de dados alimentam o open banking e podem ser usados para gerar produtos e serviços em cartões, retenção de clientes, oferta de crédito e aquisição de consumidores.

Em sua estrutura de dados, a executiva explicou que também foram definidas três novos cargos com suas devidas responsabilidades. São eles:

  1. Data Owner – executivo responsável pela visão estratégica do domínio, alocação de orçamento e time;
  2. Data Stewards – profissional que faz a catalogação de dados, avaliação de pedidos de acesso e priorização das demandas;
  3. Data Custodian – responsável de tecnologia que atua com o mapeamento da origem, linhagem e construção dos dados.

Com esta nova jornada, o Chief Data Officer (CDO) passa a atuar como facilitador para oferecer políticas, processo e ferramentas. Por sua vez, a gestão dos dados fica para as áreas de negócios. Nesta nova estrutura, o banco reduziu em 50% a criação de modelo analíticos.

IA

No futuro, o Oxygen também deve ter mais dados disponibilizados, como datasets e modelo de machine learning. Atualmente, o Santander tem mais de 200 ML no banco. A companhia também considera a utilização de inteligência artificial generativa com governança ética. Mas seria com um LLM supervisionando e outro LLM de governança.