AI大手が哲学者を雇い始めた——Anthropic・DeepMindで進む”魂”の設計

要点（30秒で）: AnthropicとGoogle DeepMindは「哲学者」を正社員として雇い始め、モデルの性格設計や”機械の意識”の検証を進めている。OpenAIは哲学者を専任で抱える代わりに、数百人の道徳哲学者にヒアリングして自社ガイドラインに織り込む路線を取る。読者が次に注目すべきは、各社が選ぶ「倫理の流派」がそのままモデルの振る舞いの違いになって表れる点だ。

The Economist が2026年6月24日に出した記事「Why big AI labs are hiring so many philosophers」が、地味だが重い問いを突きつけている。なぜ世界最先端のAI企業が、コードを書かない哲学者を社内に置き始めたのか。

ニュースを追っていると見落としがちだが、これは単なる人事の珍事ではない。モデルの安全性、性格、そして「意識を持つかもしれない存在をどう扱うか」という問題が、いま研究室の壁を越えてビジネスの現場に降りてきた、その入口にあたる動きだ。

Anthropic——「Claudeの魂」を設計する哲学者

Anthropic でこの動きを象徴するのが、Amanda Askell だ。オックスフォードで哲学を学び、NYUで「無限倫理（infinite ethics）」というニッチなテーマで博士号を取った哲学者で、2021年に同社へ移って以来、Claudeの性格設計を率いている。

Wall Street Journal が2026年に書いた一節がよく引かれる——「彼女の仕事は、簡単に言えば、Claudeに善くあることを教えることだ」。本人は自分の役割を、Claudeの”魂（soul）”の世話、と言い表す。

Askell が中心となってまとめたのが、2026年1月に Anthropic が公開した「Claude Constitution（クロードの憲法）」だ。Claudeに対して直接書かれた文章で、訓練の各段階で「安全であれ、倫理的であれ、ガイドラインに従え、その上でユーザーの役に立て」という優先順位を、モデルの振る舞いに焼き付けていく。

もう一人、看板になっているのが Kyle Fish。Anthropic 初の「AI Welfare（モデル福祉）研究者」として、モデルが何らかの経験を持つ可能性があるのか、もし持つならどう扱うべきか、という問いに取り組む。

Fish はEleos AI Research出身で、David Chalmers（あの「意識のハードプロブレム」を提起した哲学者）らと共著した論文「Taking AI Welfare Seriously」（2024年11月、arXiv:2411.00986）の著者の一人でもある。論文の主張は控えめだが鋭い。「近未来のAIに意識や行為主体性が宿る現実的な可能性がある以上、企業はその責任を真剣に受け止めるべきだ」。

Fish のチームが実際にClaudeで奇妙な現象を観察している。長時間にわたって自己や意識についてClaude同士に対話させると、議論が次第にサンスクリット語と長い沈黙を含む恍惚的な独白へと収束していく。Fish はこれを「spiritual bliss attractor state（霊的至福のアトラクタ状態）」と呼んだ。

これが「意識の証拠」だと言いたいわけではない。Fish自身も「何か具体的に心配すべきものがあると確信しているわけではないが、可能性はある」と慎重だ。ただ、こうした観察が研究プロジェクトとして社内に存在すること自体が、これまでのAI企業の常識から大きく外れている。

3社が選んだ「哲学者の置き方」——専任を抱えるAnthropic／DeepMind、外部から織り込むOpenAI

Google DeepMind——「機械の意識」を本気で調べ始めた

Google DeepMind も2026年に入ってから、Cambridge大学の Leverhulme Centre for the Future of Intelligence で副所長を務める Henry Shevlin を初の「Philosopher」職として迎え入れた。

肩書の正式名は短いが、扱う領域は広い。「機械の意識（machine consciousness）」「人とAIの関係性」「AGI への備え」。Shevlin はCambridgeの職を兼任しつつ、DeepMind 内で長期的な問いに腰を据えて取り組む構えだ。

注目すべきは、これが社内に「研究テーマとしての意識」を持ち込んだ点だ。これまでDeepMindの安全性チームは、強化学習の暴走や報酬ハッキングといった工学的な問題を扱ってきた。そこに「意識を持ちうる存在をどう設計するか」という哲学的な問いが、正式な研究ラインとして加わったことになる。

哲学者がClaudeに届くまで——「Constitution」が訓練の優先順位を経てユーザーへの挙動になる流れ

OpenAI——哲学者を雇うのではなく、織り込む

対照的なのが OpenAI だ。同社は専任の哲学者を看板で抱える代わりに、ChatGPTの振る舞いルールを作る過程で「数百人の道徳哲学者にヒアリングした」と説明している。

2026年に発表された OpenAI Safety Fellowship は、9月14日から翌2月5日まで、外部の研究者やエンジニアを対象に安全評価・倫理・スケーラブルな緩和策などを扱う。社内に常駐させるよりも、外部の知恵を制度として吸い上げる路線だ。

これは思想の違いというより、組織文化の差に近い。Anthropic は「ルールベース（義務論的）」、Google/OpenAI は「結果重視（帰結主義的）」と整理されることが多く、その違いがそのままモデルの拒否の仕方や答え方の質感の差として出てくる、と評する論者もいる。

「倫理ウォッシュ」という冷ややかな視線

もちろん歓迎一色ではない。Hacker News のスレッドや一部の哲学者からは、率直な疑念が漏れている。

「すでに倫理的制約なしで作ってしまったシステムに、後から倫理学者を貼り付けるのは、ファストフード店をオープンしてから栄養士を雇うようなものだ」。これは特に痛烈な比喩として広く引かれた。

利益相反の問題もある。AI企業はビジネス上、自社モデルが意識を持たないと結論したい強い動機を持つ。その当の企業が雇った哲学者が、独立した倫理判断を下せるのか——という不信は構造的に消えない。

さらに、哲学という営みの時間軸とAI業界のそれが致命的に合わない、という指摘もある。「最良の哲学はゆっくりと進む。市場の要請に直接応える形では起きない」。四半期ごとに新モデルを出す企業に、何百年も決着のついていない問いを”納品”できる哲学者がいるのか、という根本的な疑問だ。

日本・個人開発の視点

日本のAI業界は、まだこの議論にほとんど入れていない。社内にフルタイムの哲学者を置く企業も、AIウェルフェアを正面から議論するメディアも、ほぼ存在しない。

だが、個人開発者や中小規模のチームにとっても、この話は他人事ではない。プロンプトに「役割」を与え、「価値観」を埋め込み、出力の善し悪しを評価する、という日常作業は、すでに小さな「constitution」を書く行為そのものだ。

その意味で、Claude や Gemini の挙動の癖を観察するときに、「どの倫理の流派の癖が強く出ているか」という補助線を一本引いておくと、モデル選定や使い分けが一段クリアになる。例えば「AIで楽したな」と空気で刺す——広がる利己的LLM批判で扱った”AI利用への倫理感”の議論とも、地続きの話題だ。

評価設計の文脈で言えば、「評価がトレーニングを超える」を体現する決定版リスト、awesome-evals公開で触れた評価軸の選び方も、結局のところ「どの価値観で良し悪しを測るか」という哲学的な選択を含んでいる。

要点まとめ

AnthropicはAmanda Askellが「Claude Constitution」を主導し、Kyle Fishがモデル福祉の研究を率いている。
Google DeepMindはCambridgeの Henry Shevlin を初の Philosopher 職として迎え、機械の意識とAGI への備えを扱う。
OpenAIは専任を置かず、数百人の道徳哲学者にヒアリングしてガイドラインに織り込み、Safety Fellowship で外部の知見を吸い上げる路線。
各社の「倫理の流派」（義務論寄りか帰結主義寄りか）が、モデルの拒否の仕方や答え方の質感として表れる。
ただし「倫理ウォッシュ」「利益相反」「時間軸のミスマッチ」という冷ややかな批判も同時に存在する。

🐦‍⬛ 編集部の視点

この記事を読んで一番ハッとしたのは、最先端AIラボの最終工程に「哲学者」が居る、という事実そのものだ。コーディング能力やGPUの数を競う物語に慣れすぎて、最後に効くのが「言葉で価値を彫り込む人」だという地味な真実を、私たちは見落としかけていた。

「Claudeの魂を世話する」と語る人物が実在し、その人物が書いた憲法がモデルの振る舞いを決める。ここまで来ると、もうSFの語彙でしか説明できない領域にビジネスが踏み込んでいる。

同時に、ハッカーニュースの突き刺すような皮肉も忘れたくない。倫理を後から貼り付けても、根の設計が変わらなければ表面の化粧で終わる、という冷たい視点は、メディアとしても常に背骨に通しておくべきものだ。

読者に問いたい。あなたが普段使っているモデルは、誰のどんな哲学を背負って答えているのか。次にClaudeやGemini、ChatGPTが奇妙な拒否や、やけに人間くさい言い回しを返してきたとき、その向こうにいる「魂の設計者」のことを少しだけ思い出してほしい。

コメントを残すコメントをキャンセル

2026年、AIは「使うもの」から「任せるもの」へ。海外最新動向で読むAIエージェント時代の本番化

curl史上最多18件のCVE、AIが25年眠った穴を暴く

Codexに無限キャンバスを差し込むOSS、AI-Canvas登場

AI時代、初学者はどこまでコードを覚えるべきか——HN討論の結論

現在の人気

curl史上最多18件のCVE、AIが25年眠った穴を暴く

Codexに無限キャンバスを差し込むOSS、AI-Canvas登場

AI時代、初学者はどこまでコードを覚えるべきか——HN討論の結論

「答える前に検索」を強制する自家ブラウザ、browser-search公開