「デジタル人類」を作るOSS、Fundamental-Ava公開——数千エージェントから文明が生まれる

要点（30秒で）: 数千の自律エージェントを走らせ、法律・役割分担・社会規範が「勝手に生まれる」様子を観測するOSSフレームワーク「Fundamental-Ava」がGitHubで公開された。1000体のAIがMinecraftで宗教や税制を作った「Project Sid」の思想を、誰でも回せるPythonライブラリに落とし込んだ点が新しい。多体エージェントの創発に興味があるなら、まずリポジトリをクローンしてCivilizationを一つ動かしてみるのが早い。

「デジタル人類（digital human beings）を作る」。そんな大きな旗を掲げたリポジトリが、いま静かに星を集めている。名前はFundamental-Ava。記事執筆時点で591スター、Apache 2.0ライセンスの公開コードだ。

謳い文句は「autonomous, collaborative, and socially intelligent agents」——自律的で、協調し、社会的に賢いエージェント。言葉だけ見れば最近よくある誇大広告にも聞こえる。だが中身を読むと、これは派手なデモ動画ではなく、ある研究系譜をきちんとライブラリ化したものだと分かる。

背景・文脈：Smallvilleから「AI文明」へ

この手の話の出発点は、2023年のスタンフォードだ。研究者パークらが25体のLLMエージェントを小さな町「Smallville」に放ち、彼らが勝手に予定を立て、会話し、バレンタインパーティーを企画し、招待状を口コミで広げていった。誰も「パーティーを開け」とは命じていない。振る舞いが事前にプログラムされず、相互作用から立ち上がる——この「創発（emergence）」がジャンルの核になった。

それを桁違いの規模に押し上げたのが、Alteraによる「Project Sid」（2024年）だ。10体から1000体超のAIをMinecraftに放つと、商人のハブができ、Googleドキュメント上で憲法に投票して条文を修正し、賄賂を使ってパスタ教（Pastafarianism）を布教し、迷子の村人のために松明を灯した。専門役割の分化、民主的な意思決定、文化や宗教の伝播が観測された。

ここで点と点がつながる。Alteraを率いたのは、元MIT脳・認知科学准教授のロバート・ヤン（Guangyu Robert Yang）。そのAlteraはいまFundamental Research Labsへと姿を変え、ExcelをこなすAI「Shortcut」やデスクトップ常駐エージェント「Fairies」を出しながら、Prosus主導で33MドルのシリーズAを調達している。会社のミッションそのものが「デジタル人類を作る」だ。

つまりFundamental-Avaという名前と説明文は、この会社のミッションステートメントをそのまま借りている。リポジトリ自体は個人アカウント（TianhangZhuzth）にあり、公式プロダクトと断定できる材料は確認できなかったが、思想的にProject Sidの直系であることは、コードの設計を見れば疑いようがない。

スタンフォードのSmallvilleからAlteraのProject Sidを経てFundamental-Avaへ——「AI文明」研究の直系をたどる系譜

仕組み・特徴：記憶を三層に割る

Fundamental-Avaの面白さは、各エージェントの「頭の中」を分解している点にある。記憶を一枚岩にせず、エピソード記憶（何が起きたか）・意味記憶（それが何を意味するか）・手続き記憶（再利用できるスキル）の三層に分け、それぞれに独立した減衰と検索のルールを持たせた。人間の記憶研究をそのまま設計に持ち込んだ格好だ。

エージェントは「知覚→熟慮→行動（perceive-deliberate-act）」のループで回り、信念の構造や、相手の心を推し量る「心の理論（theory of mind）」のモデルを各自が抱える。社会関係はモジュール化され、誰と誰がどうつながっているかが内部状態として保持される。

そして集団のレイヤーには統治（governance）の仕組みが組み込まれている。法律は提案と投票で生まれ、定足数（クォーラム）は人口規模に応じてスケールする。重要な決定には、ビザンチン障害耐性（BFT）風の合意プロトコルを使う。法が外から与えられるのではなく、母集団の中から立ち上がるよう作られているわけだ。

個体（知覚・熟慮・行動＋三層記憶）→ 集団・統治（提案・投票・BFT合意）→ 創発の解析（変化点検知でp値）という、Fundamental-Avaの階層構造

性能・ベンチマーク：創発を「p値」で測る

このフレームワークがただの再現実装と違うのは、二点ある。

一つは規模。asyncio.TaskGroupとセマフォによる有界並行で数千体を捌き、ベンチマークでは毎秒24,000体超のスループットを示すという。研究用に大量のエージェントを長時間回す前提の設計だ。

もう一つが創発の定量化。役割分化のような現象を「なんとなく賑わってきた」で済ませず、母集団指標に対する変化点検知（change-point detection）を当て、統計的にp値で評価する解析層を持つ。AIに遊び場を与えて眺めるだけの企画は世に多いが（本誌でもAIに遊ばせるための釣りゲームを扱った）、ここは「観察を測定に変える」ことに踏み込んでいる。

アーキテクチャはきれいに層が切られている。ava.agents.baseがライフサイクル、ava.agents.memoryが記憶、ava.agents.socialが関係と心の理論、ava.communicationが非同期のパブ/サブ通信、ava.civilizationがシミュレーション全体の指揮、ava.analysisが創発の検出。コア部分のAPIは安定版とされ、リアルタイムにエージェントを覗くためのUIダッシュボードも、本体に密結合しない形で付属する。

創発をp値で測る「計測の冷静さ」と、内発的駆動やゼロからの発明はまだ未解決という「看板の大きさ」——信用していい点と疑うべき点

使いどころ・始め方

動かすのは難しくない。Python 3.11以上、テストはpytest、品質チェックはRuffとmypy、Dockerにも対応する。

git clone https://github.com/TianhangZhuzth/Fundamental-Ava.git
pip install -e ".[dev]"

使い方の流れはシンプルだ。自前のエージェントクラスを定義し、それをCivilizationインスタンスに加え、非同期で走らせる。あとは集団が何を「やり出す」かを観測し、解析層で創発を測る。本番運用のためのものというより、人工社会で何が立ち上がるかを研究するための土台、という位置づけだ。

何が新しくて、何をまだ疑うべきか

正直に言えば、「デジタル人類」という看板は、いまの中身に対してやや大きい。

Project Sidの論文自身が認めていた限界を思い出したい。エージェントは既存の社会構造の中では動けても、生存・好奇心・帰属といった内発的な「駆動力」をまだ十分に持たない。しかも土台が学習済みの基盤モデルである以上、民主制や貨幣経済のような社会的発明をゼロから生み出すこと（de novo emergence）はできない。彼らが「作り出す」憲法も宗教も、人類が既に書いた知識の組み替えだ。

Fundamental-Avaが優れているのは、ここを神秘化しない点だ。創発をp値で測るという姿勢は、「すごいものが生まれた」という物語より「何がどれだけ統計的に起きたか」を選ぶということ。看板の大きさと、計測の冷静さ。その温度差こそが、このリポジトリを信用していい理由でもある。

日本・個人開発の視点

日本の個人開発者にとって、ここは入りやすい領域だ。GPUの壁が高いモデル学習と違い、多体エージェントのシミュレーションは設計とロジックの勝負で、手元のマシンと既存のLLM APIで十分に実験が回る。

しかも「人格を複数走らせて何が起きるかを観る」発想は、日本でもすでに芽が出ている。本誌が紹介した11人格のAIが試合中に予測市場を開く「The Eleven」はその好例だし、自分のハーネスを書いて磨くコーディングAI「Godcoder」のように、エージェントが自分の環境を作り替える研究も活発だ。Avaの三層記憶や創発検知は、そうした小さな実験に「測る物差し」を一つ足してくれる。

要点まとめ

Fundamental-Avaは、数千の自律エージェントから法・役割・規範の創発を観測するOSS（Apache 2.0、Python 3.11+、591スター）。
記憶を三層（エピソード/意味/手続き）に分け、統治はBFT風の合意と人口比のクォーラムで実装。
毎秒24,000体超のスループットと、変化点検知による創発の統計的定量化が特徴。
スタンフォードのSmallville、AlteraのProject Sidという「AI文明」研究の直系。会社Fundamental Research Labsのミッションをそのまま名前に冠する。
一方で内発的駆動やゼロからの社会的発明は未解決。「デジタル人類」の看板は中身よりまだ大きい。

🐦‍⬛ 編集部の視点

私たちがこのリポジトリに惹かれるのは、流行りの「AIに遊ばせてみた」系と決定的に違う一点があるからだ。創発を、感想ではなく統計で測ろうとしている。

役割分化が「起きた気がする」ではなく、変化点検知でp値が付く。これは地味だが効く。AI社会のシミュレーションは、放っておくと「すごい村ができた」というバズ動画に流れがちで、再現も比較もできないまま消費される。そこに物差しを入れる、という選択は編集部としてかなり信頼できる。

同時に、冷静さも要る。「デジタル人類」は美しい言葉だが、彼らが生む憲法や宗教は、人類の書いた知識の組み替えにすぎない。ゼロから新しい社会制度を発明したわけではない——この一線を見失うと、ただの拡大解釈になる。

問いかけたいのはここだ。あなたが1000体を一晩走らせたとして、生まれた「法律」を見て、人類社会の鏡だと感じるだろうか。それとも、巨大なオウム返しだと感じるだろうか。その答えが分かれる場所こそ、いま一番面白い境界線だと思う。

出典・リンク

出典: https://github.com/TianhangZhuzth/Fundamental-Ava
Fundamental Research Labs（公式）: https://fundamentalresearchlabs.com/
Project Sid: Many-agent simulations toward AI civilization（論文）: https://arxiv.org/abs/2411.00114
Project Sid（GitHub / Altera）: https://github.com/altera-al/project-sid
Generative Agents: Interactive Simulacra of Human Behavior（Smallville論文）: https://dl.acm.org/doi/fullHtml/10.1145/3586183.3606763
Fundamental Research Labs、Prosus主導で33MドルのシリーズA（TechCrunch）: https://techcrunch.com/2025/08/01/fundamental-research-labs-nabs-33-million-from-prosus-to-build-ai-agents-for-multiple-verticals/
Guangyu Robert Yang（MIT）: https://sqi.mit.edu/about/people/guangyu-robert-yang
“`

コメントを残すコメントをキャンセル

2026年、AIは「使うもの」から「任せるもの」へ。海外最新動向で読むAIエージェント時代の本番化

AIを「シニアエンジニア」として測る新ベンチ、最強Opusでも24%

GPUをSOLで借りる「OpenRAM」——正体はVast.ai転売＋$RAM焼却の仕掛け

AIは発明者になれない——最高裁が確定させた「自然人」の壁

Trending

AIを「シニアエンジニア」として測る新ベンチ、最強Opusでも24%

GPUをSOLで借りる「OpenRAM」——正体はVast.ai転売＋$RAM焼却の仕掛け

AIは発明者になれない——最高裁が確定させた「自然人」の壁

Claude Fable 5、7月1日に世界復帰——そして7月7日から”最強AIは有料”へ