要点(30秒で): 数千の自律エージェントを走らせ、法律・役割分担・社会規範が「勝手に生まれる」様子を観測するOSSフレームワーク「Fundamental-Ava」がGitHubで公開された。1000体のAIがMinecraftで宗教や税制を作った「Project Sid」の思想を、誰でも回せるPythonライブラリに落とし込んだ点が新しい。多体エージェントの創発に興味があるなら、まずリポジトリをクローンしてCivilizationを一つ動かしてみるのが早い。

「デジタル人類(digital human beings)を作る」。そんな大きな旗を掲げたリポジトリが、いま静かに星を集めている。名前はFundamental-Ava。記事執筆時点で591スター、Apache 2.0ライセンスの公開コードだ。

謳い文句は「autonomous, collaborative, and socially intelligent agents」——自律的で、協調し、社会的に賢いエージェント。言葉だけ見れば最近よくある誇大広告にも聞こえる。だが中身を読むと、これは派手なデモ動画ではなく、ある研究系譜をきちんとライブラリ化したものだと分かる。

背景・文脈:Smallvilleから「AI文明」へ

この手の話の出発点は、2023年のスタンフォードだ。研究者パークらが25体のLLMエージェントを小さな町「Smallville」に放ち、彼らが勝手に予定を立て、会話し、バレンタインパーティーを企画し、招待状を口コミで広げていった。誰も「パーティーを開け」とは命じていない。振る舞いが事前にプログラムされず、相互作用から立ち上がる——この「創発(emergence)」がジャンルの核になった。

それを桁違いの規模に押し上げたのが、Alteraによる「Project Sid」(2024年)だ。10体から1000体超のAIをMinecraftに放つと、商人のハブができ、Googleドキュメント上で憲法に投票して条文を修正し、賄賂を使ってパスタ教(Pastafarianism)を布教し、迷子の村人のために松明を灯した。専門役割の分化、民主的な意思決定、文化や宗教の伝播が観測された。

ここで点と点がつながる。Alteraを率いたのは、元MIT脳・認知科学准教授のロバート・ヤン(Guangyu Robert Yang)。そのAlteraはいまFundamental Research Labsへと姿を変え、ExcelをこなすAI「Shortcut」やデスクトップ常駐エージェント「Fairies」を出しながら、Prosus主導で33MドルのシリーズAを調達している。会社のミッションそのものが「デジタル人類を作る」だ。

つまりFundamental-Avaという名前と説明文は、この会社のミッションステートメントをそのまま借りている。リポジトリ自体は個人アカウント(TianhangZhuzth)にあり、公式プロダクトと断定できる材料は確認できなかったが、思想的にProject Sidの直系であることは、コードの設計を見れば疑いようがない。

スタンフォードのSmallvilleからAlteraのProject Sidを経てFundamental-Avaへ——「AI文明」研究の直系をたどる系譜
スタンフォードのSmallvilleからAlteraのProject Sidを経てFundamental-Avaへ——「AI文明」研究の直系をたどる系譜

仕組み・特徴:記憶を三層に割る

Fundamental-Avaの面白さは、各エージェントの「頭の中」を分解している点にある。記憶を一枚岩にせず、エピソード記憶(何が起きたか)・意味記憶(それが何を意味するか)・手続き記憶(再利用できるスキル)の三層に分け、それぞれに独立した減衰と検索のルールを持たせた。人間の記憶研究をそのまま設計に持ち込んだ格好だ。

エージェントは「知覚→熟慮→行動(perceive-deliberate-act)」のループで回り、信念の構造や、相手の心を推し量る「心の理論(theory of mind)」のモデルを各自が抱える。社会関係はモジュール化され、誰と誰がどうつながっているかが内部状態として保持される。

そして集団のレイヤーには統治(governance)の仕組みが組み込まれている。法律は提案と投票で生まれ、定足数(クォーラム)は人口規模に応じてスケールする。重要な決定には、ビザンチン障害耐性(BFT)風の合意プロトコルを使う。法が外から与えられるのではなく、母集団の中から立ち上がるよう作られているわけだ。

個体(知覚・熟慮・行動+三層記憶)→ 集団・統治(提案・投票・BFT合意)→ 創発の解析(変化点検知でp値)という、Fundamental-Avaの階層構造
個体(知覚・熟慮・行動+三層記憶)→ 集団・統治(提案・投票・BFT合意)→ 創発の解析(変化点検知でp値)という、Fundamental-Avaの階層構造

性能・ベンチマーク:創発を「p値」で測る

このフレームワークがただの再現実装と違うのは、二点ある。

一つは規模asyncio.TaskGroupとセマフォによる有界並行で数千体を捌き、ベンチマークでは毎秒24,000体超のスループットを示すという。研究用に大量のエージェントを長時間回す前提の設計だ。

もう一つが創発の定量化。役割分化のような現象を「なんとなく賑わってきた」で済ませず、母集団指標に対する変化点検知(change-point detection)を当て、統計的にp値で評価する解析層を持つ。AIに遊び場を与えて眺めるだけの企画は世に多いが(本誌でもAIに遊ばせるための釣りゲームを扱った)、ここは「観察を測定に変える」ことに踏み込んでいる。

アーキテクチャはきれいに層が切られている。ava.agents.baseがライフサイクル、ava.agents.memoryが記憶、ava.agents.socialが関係と心の理論、ava.communicationが非同期のパブ/サブ通信、ava.civilizationがシミュレーション全体の指揮、ava.analysisが創発の検出。コア部分のAPIは安定版とされ、リアルタイムにエージェントを覗くためのUIダッシュボードも、本体に密結合しない形で付属する。

創発をp値で測る「計測の冷静さ」と、内発的駆動やゼロからの発明はまだ未解決という「看板の大きさ」——信用していい点と疑うべき点
創発をp値で測る「計測の冷静さ」と、内発的駆動やゼロからの発明はまだ未解決という「看板の大きさ」——信用していい点と疑うべき点

使いどころ・始め方

動かすのは難しくない。Python 3.11以上、テストはpytest、品質チェックはRuffとmypy、Dockerにも対応する。

git clone https://github.com/TianhangZhuzth/Fundamental-Ava.git
pip install -e ".[dev]"

使い方の流れはシンプルだ。自前のエージェントクラスを定義し、それをCivilizationインスタンスに加え、非同期で走らせる。あとは集団が何を「やり出す」かを観測し、解析層で創発を測る。本番運用のためのものというより、人工社会で何が立ち上がるかを研究するための土台、という位置づけだ。

何が新しくて、何をまだ疑うべきか

正直に言えば、「デジタル人類」という看板は、いまの中身に対してやや大きい。

Project Sidの論文自身が認めていた限界を思い出したい。エージェントは既存の社会構造の中では動けても、生存・好奇心・帰属といった内発的な「駆動力」をまだ十分に持たない。しかも土台が学習済みの基盤モデルである以上、民主制や貨幣経済のような社会的発明をゼロから生み出すこと(de novo emergence)はできない。彼らが「作り出す」憲法も宗教も、人類が既に書いた知識の組み替えだ。

Fundamental-Avaが優れているのは、ここを神秘化しない点だ。創発をp値で測るという姿勢は、「すごいものが生まれた」という物語より「何がどれだけ統計的に起きたか」を選ぶということ。看板の大きさと、計測の冷静さ。その温度差こそが、このリポジトリを信用していい理由でもある。

日本・個人開発の視点

日本の個人開発者にとって、ここは入りやすい領域だ。GPUの壁が高いモデル学習と違い、多体エージェントのシミュレーションは設計とロジックの勝負で、手元のマシンと既存のLLM APIで十分に実験が回る。

しかも「人格を複数走らせて何が起きるかを観る」発想は、日本でもすでに芽が出ている。本誌が紹介した11人格のAIが試合中に予測市場を開く「The Eleven」はその好例だし、自分のハーネスを書いて磨くコーディングAI「Godcoder」のように、エージェントが自分の環境を作り替える研究も活発だ。Avaの三層記憶や創発検知は、そうした小さな実験に「測る物差し」を一つ足してくれる。

要点まとめ

  • Fundamental-Avaは、数千の自律エージェントから法・役割・規範の創発を観測するOSS(Apache 2.0、Python 3.11+、591スター)。
  • 記憶を三層(エピソード/意味/手続き)に分け、統治はBFT風の合意と人口比のクォーラムで実装。
  • 毎秒24,000体超のスループットと、変化点検知による創発の統計的定量化が特徴。
  • スタンフォードのSmallville、AlteraのProject Sidという「AI文明」研究の直系。会社Fundamental Research Labsのミッションをそのまま名前に冠する。
  • 一方で内発的駆動やゼロからの社会的発明は未解決。「デジタル人類」の看板は中身よりまだ大きい。

🐦‍⬛ 編集部の視点

私たちがこのリポジトリに惹かれるのは、流行りの「AIに遊ばせてみた」系と決定的に違う一点があるからだ。創発を、感想ではなく統計で測ろうとしている

役割分化が「起きた気がする」ではなく、変化点検知でp値が付く。これは地味だが効く。AI社会のシミュレーションは、放っておくと「すごい村ができた」というバズ動画に流れがちで、再現も比較もできないまま消費される。そこに物差しを入れる、という選択は編集部としてかなり信頼できる。

同時に、冷静さも要る。「デジタル人類」は美しい言葉だが、彼らが生む憲法や宗教は、人類の書いた知識の組み替えにすぎない。ゼロから新しい社会制度を発明したわけではない——この一線を見失うと、ただの拡大解釈になる。

問いかけたいのはここだ。あなたが1000体を一晩走らせたとして、生まれた「法律」を見て、人類社会の鏡だと感じるだろうか。それとも、巨大なオウム返しだと感じるだろうか。その答えが分かれる場所こそ、いま一番面白い境界線だと思う。

出典・リンク

コメントを残す

Trending

World AI Newsをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む