リリースから約10年後、Pokémon Goは予期せぬ形で人工知能に影響を与えています。
MIT Technology Reviewのレポート(新しいウィンドウ)によると、同ゲームの元々の開発元からスピンアウトしたAI企業であるNiantic Spatialは、ロボットが現実世界での自分の位置を理解するのを支援するAIシステムのトレーニングに、Pokémon Goのプレイヤーがキャプチャした300億枚以上の画像(新しいウィンドウ)の都市のランドマークを使用しています。
2016年にPokémon Goがリリースされたとき、何百万人ものプレイヤーがデジタルの生き物を検索しながら、建物、公園、ランドマークにスマートフォンを向けて都市を歩き回りました。そうすることで、彼らはこれまでに収集された中で最大級の現実世界の画像のデータセットの1つを作成しました。Niantic Spatialは、都市環境全体でキャプチャされた300億枚の画像でモデルをトレーニングしましたが、その多くはプレイヤーがゲーム内で頻繁に訪れた位置の周辺に集中していました。時々、デジタルの生き物がマンションや住宅の中庭などのプライベートなスペースやその近くに表示されることがありましたが、これはそれらの瞬間がAIデータセットの一部になった可能性があることを意味します。
そのデータは現在、研究者が「ワールドモデル」と呼ぶもの、つまり機械が物理的環境を解釈してナビゲートするのを支援するために設計されたAIシステムを構築するために使用されています。
これはまた、現代のテクノロジーについて見過ごされがちなことを浮き彫りにしています。日常のアプリでの活動は、何年か後に静かにAIシステムにとっての貴重なトレーニングデータになる可能性があるということです。これは、Pokémon Goのプレイヤーが意味のある同意をしたことはもちろん、2016年には予想すらできなかったことでしょう。
GPSが都市で苦戦する理由
GPS信号は、密集した都市環境では高い建物で跳ね返ったり、大きくドリフトしたり、完全に消失したりすることがよくあります。これは「アーバンキャニオン(都市の谷)」効果と呼ばれることもある問題です。MIT Technology Reviewがこの技術に関するレポートで説明しているように、スマートフォンの位置の指標でさえ、都市部では数十メートルもドリフトする可能性があり、デバイスが間違ったブロックや通りの反対側に配置されることがよくあります。
Niantic Spatialのソリューションは、カメラが見ているものを分析することによって位置を決定する視覚的測位システム(新しいウィンドウ)に依存しています。近くの建物やランドマークのスナップショットをその膨大なデータセットと比較することにより、システムは数センチメートル以内で位置を特定できると報告されています。
拡張現実から配達ロボットへ
Niantic Spatialの技術の最初の現実世界でのテストの1つは、いくつかの都市で歩道での配達ロボットを運用しているスタートアップであるCoco Roboticsとのパートナーシップを通じて行われています。
同社のロボットは、ロサンゼルス、シカゴ、マイアミ、ヘルシンキなどの場所で食料品やレストランの注文を運んでいます。MIT Technology Reviewのレポートによると、Cocoのロボットはすでに50万回以上の配達を完了し、数百万マイルをカバーしています。
密集した都市を確実にナビゲートすることは、依然として自律型機械にとって大きな課題です。ロボットのカメラとNiantic Spatialの視覚的測位システムを組み合わせることで、機械は自分の位置をより正確に判断できるようになり、集荷位置やお客様のドアの外に正確に停止することができます。
「ワールドモデル」の台頭
このプロジェクトは、AI開発におけるより広範なトレンドを反映しています。
大規模言語モデルは、インターネット上の画像とテキストでトレーニングされます。対照的に、ワールドモデルは、オブジェクトがどこに配置され、空間がどのように接続し、それらをどのように安全に移動するかなど、物理世界自体がどのように構造化されているかを機械が理解するのを支援することを目指しています。
Niantic Spatialによると、同社の長期的な目標は、ロボットやその他のAIシステムがナビゲートに使用できる、常に更新される世界の「生きた地図」を構築することです。
これがプライバシーにとって意味すること
この話はまた、一般の人々が日常的なアプリを使用することで作成されたデータがどのように再利用されているかについての、より広範な変化を示しています。
何百万人もの人々がゲームをプレイするためにPokémon Goをダウンロードしました。しかしその過程で、彼らは現実世界の場所と結びついた数十億枚の画像と正確な位置の信号も生成しました。このデータは現在、物理世界をマッピングしてナビゲートするように設計されたAIシステムのトレーニングに役立っています。それは、ピカチュウを検索するためにゲームを手に取ったプレイヤーの意図からは遠く離れたものです。
これは、AI経済においておなじみのパターンになりつつあります。写真の撮影、ウェブの閲覧、アプリの使用など、人工知能とは無関係に思われる活動が、多くの場合、強力な新しいシステムをトレーニングするために使用されるデータセットの作成に行き着きます。最新のAIモデルは、インターネットやその他のデジタルソースからスクレイピングされたデータの膨大なコレクションを使用して構築されることが多く、研究者によると、そこには個人情報や機密データが含まれることがあるといいます。
企業がワールドモデルやその他の形式のAIを構築しようと競い合う中で、そのトレーニングデータがどこから来たのか、そしてそれを生成した人々が、そのデータがどのように使用されるかを認識していたのか、あるいは結果を知っていたとしてもそれらのアプリを使用することに同意しただろうかという疑問が生じます。政策立案者や研究者は、クリエイターやユーザーが自分のデータがどのように再利用されるかについてより多くのコントロールを持つべきだと主張し、AIトレーニングに使用されるデータについてよりクリアな同意の基準(新しいウィンドウ)を求める声が高まっています。
これらのAIプライバシーへの懸念は、すでに法廷で争われています。出版社、作家、メディア企業は、AIトレーニングデータセットでの自社のジャーナリズムの不正使用をめぐってThe New York TimesがOpenAIとMicrosoftを提訴した(新しいウィンドウ)注目度の高い裁判を含め、自社の作品が許可なくAIシステムのトレーニングに使用されたと主張して訴訟を起こしています。
物理世界をナビゲートするAIを構築している企業にとって、ゲーム、アプリ、デジタルプラットフォームを通じて作成されたデータセットは、テクノロジー業界で最も価値のある資産の1つに急速になりつつあります。そうなるにつれて、透明性、同意、およびユーザーが生成したデータがどのように再利用されるかについての疑問は無視しにくくなっています。
誰もがこのデータを渇望するモデルを追求しているわけではありません。Protonでは、プライバシーの代償なしにAIアシスタント(新しいウィンドウ)のメリットをお客様に提供する、プライベートで透明性のあるAIを信じています。Lumoは、お客様のデータのログを記録したり、機密の会話でトレーニングしたり、お客様の情報を誰かと共有したりすることは決してありません。つまり、今日のやり取りが静かに明日のデータセットになるのではないかと心配することなくAIを使用できるということです。






