출시된 지 거의 10년이 지난 지금, Pokémon Go는 예상치 못한 방식으로 인공 지능에 영향을 미치고 있습니다.

MIT Technology Review의 보고서(새 창)에 따르면, 게임의 원래 개발사에서 분사한 AI 기업인 Niantic Spatial은 로봇이 현실 세계에서 자신의 위치를 이해하도록 돕는 AI 시스템을 훈련하기 위해 Pokémon Go 플레이어들이 캡처한 300억 개 이상의 도시 랜드마크 이미지(새 창)를 사용하고 있습니다.

2016년 Pokémon Go가 출시되었을 때 수백만 명의 플레이어들이 디지털 생명체를 검색하기 위해 건물, 공원, 랜드마크에 전화를 겨냥하며 도시를 걸어 다녔습니다. 그렇게 함으로써 그들은 지금까지 수집된 실제 이미지 중 가장 큰 데이터 세트 중 하나를 만들었습니다. Niantic Spatial은 플레이어들이 게임에서 자주 방문한 국가 주변에 군집된 많은 도시 환경에서 캡처된 300억 개의 이미지로 모델을 훈련했습니다. 때때로 아파트나 주거용 안뜰과 같은 개인 공간 안이나 근처에 디지털 생명체가 나타났으며, 이는 그 순간들이 AI 데이터 세트의 일부가 되었을 수 있음을 의미합니다.

그 데이터는 이제 연구자들이 “세계 모델”이라고 부르는 것, 즉 기계가 물리적 환경을 해석하고 탐색하는 데 도움이 되도록 설계된 AI 시스템을 구축하는 데 사용되고 있습니다.

이는 또한 현대 기술에 대해 간과하기 쉬운 점을 강조합니다. 즉, 일상적인 앱 활동이 수년 후 AI 시스템을 위한 귀중한 훈련 데이터가 될 수 있다는 사실입니다. 이는 Pokémon Go 플레이어들이 2016년 당시 의미 있게 동의하기는커녕 전혀 예상하지 못했을 일입니다.

GPS가 도시에서 작동하기 어려운 이유

GPS 신호는 밀집된 도시 환경에서 종종 고층 건물에 부딪혀 튕겨 나가거나 크게 표류하거나 완전히 사라지기도 하는데, 이 문제는 때때로 “도심 협곡” 효과라고도 불립니다. MIT Technology Review가 해당 기술에 대한 보고서에서 설명하듯, 스마트폰 국가 표시기조차 도시에서 수십 미터 표류하여 기기를 잘못된 블록이나 길 반대편에 위치시키는 경우가 많습니다.

Niantic Spatial의 솔루션은 카메라가 보는 것을 분석하여 국가를 결정하는 시각적 포지셔닝 시스템(새 창)에 의존합니다. 시스템은 주변 건물과 랜드마크의 스냅샷을 방대한 데이터 세트와 비교함으로써 몇 센티미터 내의 국가를 정확히 찾아낼 수 있다고 합니다.

증강 현실부터 배달 로봇까지

Niantic Spatial 기술의 첫 번째 실제 테스트 중 하나는 여러 도시에서 인도 배달 로봇을 운영하는 전원이 켜질 때인 Coco Robotics와의 파트너십을 통해 이루어지고 있습니다.

이 회사의 로봇은 로스앤젤레스, 시카고, 마이애미, 헬싱키와 같은 곳에서 식료품과 레스토랑 주문품을 나릅니다. MIT Technology Review 보고서에 따르면, Coco의 로봇은 수백만 마일을 이동하며 이미 50만 건 이상의 배달을 완료했습니다.

밀집된 도시를 안정적으로 탐색하는 것은 자율 기계의 주요 과제로 남아 있습니다. 로봇의 카메라와 Niantic Spatial의 시각적 포지셔닝 시스템을 결합함으로써 기계는 자신의 위치를 더 정확하게 파악할 수 있으며, 픽업 국가나 고객의 문 앞을 정확하게 멈출 수 있습니다.

“세계 모델”의 부상

이 프로젝트는 AI 개발의 광범위한 추세를 반영합니다.

대규모 언어 모델은 인터넷의 이미지와 텍스트로 훈련됩니다. 반면에 세계 모델은 기계가 객체의 위치, 공간이 연결되는 방식, 안전하게 이동하는 방법 등 물리적 세계 자체가 어떻게 구성되어 있는지 이해하도록 돕는 것을 목표로 합니다.

Niantic Spatial은 장기적인 목표가 로봇과 기타 AI 시스템이 탐색하는 데 사용할 수 있는 세계의 지속적으로 업데이트됨 “살아있는 지도”를 구축하는 것이라고 말합니다.

이것이 개인정보 보호에 의미하는 바

이 이야기는 또한 일상적인 앱을 사용하는 일반 사람들이 만든 데이터가 재사용되는 방식에 대한 광범위한 변화를 보여줍니다.

수백만 명의 사람들이 게임을 즐기기 위해 Pokémon Go를 다운로드했습니다. 그러나 그 과정에서 그들은 또한 수십억 개의 이미지와 현실 세계의 장소와 연결된 정밀한 국가 신호를 생성했습니다. 이 데이터는 이제 물리적 세계를 매핑하고 탐색하도록 설계된 AI 시스템을 훈련하는 데 도움이 되고 있습니다. 이는 피카츄를 검색하기 위해 게임을 시작한 플레이어의 의도와는 거리가 멉니다.

이는 AI 경제에서 익숙한 패턴이 되고 있습니다. 사진 촬영, 웹 브라우징, 앱 사용 등 인공 지능과 무관해 보이는 활동이 종종 강력한 새 시스템을 훈련하는 데 사용되는 데이터 세트를 생성하는 결과로 이어집니다. 현대의 AI 모델은 자주 인터넷 및 기타 디지털 소스에서 스크랩한 대량의 데이터 모음을 사용하여 구축되며, 연구자들은 여기에 개인 정보나 민감한 데이터가 포함될 수 있다고 말합니다.

기업들이 월드 모델과 기타 형태의 AI를 구축하기 위해 경쟁하는 가운데, 문제는 학습 데이터가 정확히 어디에서 오는지, 그리고 그 데이터를 생성한 사람들이 그 데이터가 어떻게 사용될지 실제로 알고 있었는지, 또는 결과를 알았다면 여전히 그 앱을 사용하는 데 동의했을지에 대한 것으로 바뀝니다. 정책 입안자와 연구자들은 AI 학습에 사용되는 데이터에 대해 더 명확한 동의 기준(새 창)을 점점 더 요구하고 있으며, 제작자와 사용자가 자신의 데이터가 어떻게 재사용되는지에 대해 더 많은 통제권을 가져야 한다고 주장합니다.

이러한 AI 개인정보 우려 사항은 이미 법정에서 다뤄지고 있습니다. 출판사, 저자 및 미디어 회사는 허가 없이 AI 시스템 훈련에 자신들의 저작물이 사용되었다고 주장하며 파일 소송을 제기했으며, 이 중에는 AI 훈련 데이터 세트에 자사의 저널리즘이 사용되었다는 혐의로 The New York Times가 OpenAI와 Microsoft를 고소한(새 창) 세간의 이목을 끄는 사건도 포함됩니다.

물리적 세계를 탐색하는 AI를 구축하는 기업에게 게임, 앱, 디지털 플랫폼을 통해 생성된 데이터 세트는 빠르게 기술 산업에서 가장 귀중한 자산 중 하나가 되고 있습니다. 그에 따라 투명성, 동의 및 사용자 생성 데이터가 재사용되는 방식에 대한 의문을 무시하기가 점점 더 어려워지고 있습니다.

모든 사람이 이러한 데이터를 많이 요구하는 모델을 추구하는 것은 아닙니다. Proton에서는 개인정보 비용 없이 AI 어시스턴트(새 창)의 이점을 귀하에게 제공하는 개인적이고 투명한 AI를 믿습니다. Lumo는 귀하의 데이터를 로그하지 않으며, 귀하의 민감한 대화를 훈련에 사용하거나, 귀하의 정보를 누구와도 공유하지 않습니다. 이는 오늘의 상호 작용이 조용히 내일의 데이터 세트가 될지 걱정하지 않고 AI를 사용한다는 것을 의미합니다.