O treinamento de um sistema de inteligência artificial requer uma grande quantidade de dados para ser bem sucedido. O problema é que, dependendo da fonte das informações, determinados grupos sociais podem estar sub-representados ou representados em excesso, o que levaria o sistema a tomar decisões pouco eficientes ou mesmo injustas. Portanto, um dos maiores desafios é a escolha de fontes de dados que representem de maneira estatisticamente adequada quem ou o que se deseja atender. Nesse contexto, as operadoras de telefonia podem exercer um papel crucial: graças à universalização de seus serviços, seus dados compreendem toda a nossa sociedade, independentemente da idade, da classe social ou da etnia. O tema foi abordado por George Polzer, chairman e cofundador Teralytics, uma empresa austríaca que usa big data das teles para o planejamento de transporte público.

“É necessário refletir sobre quais dados usamos para treinar um sistema. A fonte precisa conter diversidade, ser inclusiva. Usamos dados de operadoras porque eles são inclusivos, não discriminam ninguém”, disse Polzer. “Se usássemos apenas dados de pessoas ricas para treinar um sistema e perguntássemos onde deveria ser construído o próximo ponto de ônibus provavelmente a máquina responderia que não há necessidade de construir nenhum ponto de ônibus novo, pois as pessoas preferem andar de carro”, exemplificou.

Tradicionalmente o planejamento de transporte urbano é feito por seres humanos nas grandes cidades. Às vezes, esse trabalho conta com o apoio de pesquisas junto aos cidadãos. Polzer defende um aprimoramento dessa tarefa, usando sistemas de inteligência artificial a partir de dados coletados das operadoras móveis. A parceria com uma única operadora de um país já é suficiente para prover uma amostra de alta qualidade para o treinamento de um sistema de IA. Obviamente, os dados são tratados de forma coletiva e anônima, sem prejuízo da privacidade dos cidadãos.