Jogadores de Pokémon Go estão, sem saber, a treinar robôs de IA

Quase uma década após o seu lançamento, Pokémon Go está a influenciar a inteligência artificial de uma forma inesperada.

De acordo com uma reportagem da MIT Technology Review(nova janela), a Niantic Spatial, uma empresa de IA criada a partir do programador original do jogo, está a usar mais de 30 mil milhões de imagens(nova janela) de marcos urbanos captadas por jogadores de Pokémon Go para treinar sistemas de IA que ajudam robôs a compreender onde estão no mundo real.

Quando Pokémon Go foi lançado em 2016, milhões de jogadores andaram pelas suas cidades a apontar telemóveis a edifícios, parques e pontos de referência enquanto procuravam criaturas digitais. Ao fazê-lo, criaram um dos maiores conjuntos de dados de imagens do mundo real alguma vez recolhidos. A Niantic Spatial treinou o seu modelo com 30 mil milhões de imagens captadas em ambientes urbanos, muitas agrupadas em torno de locais que os jogadores visitavam frequentemente no jogo. Por vezes, criaturas digitais apareciam em ou perto de espaços privados, como prédios de apartamentos ou pátios residenciais, o que significa que esses momentos podem ter passado a fazer parte de conjuntos de dados de IA.

Esses dados estão agora a ser usados para construir o que os investigadores chamam de “modelo do mundo” — um sistema de IA concebido para ajudar máquinas a interpretar e navegar em ambientes físicos.

Também destaca algo fácil de ignorar na tecnologia moderna: a atividade quotidiana em aplicações pode silenciosamente tornar-se dados de treino valiosos para sistemas de IA anos mais tarde — algo que os jogadores de Pokémon Go dificilmente poderiam ter antecipado em 2016, quanto mais consentido de forma significativa.

Porque é que o GPS tem dificuldades nas cidades

Os sinais de GPS refletem-se frequentemente em edifícios altos, desviam-se significativamente ou desaparecem por completo em ambientes urbanos densos, um problema por vezes chamado efeito de “canhão urbano”. Como a MIT Technology Review explica na sua reportagem sobre a tecnologia, até os indicadores de localização dos smartphones podem desviar-se dezenas de metros nas cidades, muitas vezes colocando um dispositivo no quarteirão errado ou no lado errado da rua.

A solução da Niantic Spatial baseia-se num sistema de posicionamento visual(nova janela), que determina a localização analisando o que uma câmara vê. Ao comparar instantâneos de edifícios e pontos de referência próximos com o seu enorme conjunto de dados, o sistema consegue, alegadamente, localizar uma posição com precisão de poucos centímetros.

Da realidade aumentada aos robôs de entrega

Um dos primeiros testes no mundo real da tecnologia da Niantic Spatial está a acontecer através de uma parceria com a Coco Robotics, uma empresa em fase de arranque que opera robôs de entrega em passeios em várias cidades.

Os robôs da empresa transportam compras de supermercado e pedidos de restaurantes em locais como Los Angeles, Chicago, Miami e Helsínquia. Segundo a reportagem da MIT Technology Review, os robôs da Coco já concluíram mais de meio milhão de entregas, percorrendo milhões de milhas.

Navegar de forma fiável em cidades densas continua a ser um grande desafio para as máquinas autónomas. Ao combinar câmaras nos robôs com o sistema de posicionamento visual da Niantic Spatial, as máquinas conseguem determinar melhor onde estão exatamente, permitindo-lhes parar com precisão nos pontos de recolha ou à porta do cliente.

A ascensão dos “modelos do mundo”

O projeto reflete uma tendência mais ampla no desenvolvimento da IA.

Os modelos de linguagem de grande dimensão são treinados com imagens e texto da internet. Já os modelos do mundo procuram ajudar as máquinas a compreender como o próprio mundo físico está estruturado — onde os objetos estão localizados, como os espaços se ligam e como se mover por eles em segurança.

A Niantic Spatial afirma que o seu objetivo a longo prazo é criar um “mapa vivo” do mundo, constantemente atualizado, que robôs e outros sistemas de IA possam usar para navegar.

O que isto significa para a privacidade

Esta história também ilustra uma mudança mais ampla na forma como os dados criados por pessoas comuns ao usarem aplicações comuns estão a ser reutilizados.

Milhões de pessoas transferiram Pokémon Go para jogar. Mas, ao longo do caminho, também geraram milhares de milhões de imagens e sinais de localização precisos ligados a locais do mundo real. Estes dados estão agora a ajudar a treinar sistemas de IA concebidos para mapear e navegar no mundo físico. Isso está muito longe da intenção do jogador ao pegar no jogo em busca do Pikachu.

Isto está a tornar-se um padrão familiar na economia da IA. Atividades que parecem não estar relacionadas com a inteligência artificial — tirar fotos, navegar na web, usar aplicações — acabam muitas vezes por produzir os conjuntos de dados usados para treinar novos sistemas poderosos. Os modelos modernos de IA são frequentemente construídos com grandes coleções de dados extraídos da internet e de outras fontes digitais, que, segundo os investigadores, por vezes podem incluir informações pessoais ou dados sensíveis.

À medida que as empresas correm para construir modelos do mundo e outras formas de IA, a questão passa a ser exatamente de onde vêm os dados de treino — e se as pessoas que os geraram alguma vez perceberam como esses dados seriam usados, ou se ainda concordariam em usar essas aplicações se soubessem as consequências. Responsáveis políticos e investigadores têm defendido cada vez mais normas de consentimento mais claras(nova janela) para os dados usados no treino de IA, argumentando que os criadores e utilizadores devem ter mais controlo sobre a forma como os seus dados são reutilizados.

Estas preocupações com a privacidade na IA já estão a ser debatidas em tribunal. Editoras, autores e empresas de media intentaram ações judiciais alegando que o seu trabalho foi usado para treinar sistemas de IA sem autorização, incluindo um caso de grande destaque em que The New York Times processou a OpenAI e a Microsoft(nova janela) pelo alegado uso do seu jornalismo em conjuntos de dados de treino de IA.

Para as empresas que estão a desenvolver IA capaz de navegar no mundo físico, os conjuntos de dados criados através de jogos, aplicações e plataformas digitais estão rapidamente a tornar-se alguns dos ativos mais valiosos da indústria tecnológica. À medida que isso acontece, as questões sobre transparência, consentimento e a forma como os dados gerados pelos utilizadores são reutilizados tornam-se cada vez mais difíceis de ignorar.

Nem toda a gente está a seguir este modelo faminto por dados. Na Proton, acreditamos numa IA privada e transparente que lhe dá os benefícios de um assistente de IA(nova janela) sem os custos para a privacidade. O Lumo nunca regista os seus dados, não treina com as suas conversas sensíveis, nem partilha as suas informações com ninguém. Isso significa usar IA sem ficar a pensar se as interações de hoje podem silenciosamente tornar-se os conjuntos de dados de amanhã.

Jogadores de Pokémon Go ajudaram a treinar robôs para navegar nas cidades

Porque é que o GPS tem dificuldades nas cidades

Da realidade aumentada aos robôs de entrega

A ascensão dos “modelos do mundo”

O que isto significa para a privacidade

Artigos relacionados