要点(30秒で): コーディングAIが一度苦労して掴んだ”勝ち筋”を、自動でスキル化して次回に持ち越すOSS「self-learning-skills」が公開された。失敗した手順まで記録するのが肝で、Claude Code・Cursor・Codexなど70以上のエージェントに対応する。まず npx skills add kulaxyz/self-learning-skills で自分の環境に入れて挙動を眺めてみるのがいい。

同じAIに、同じ環境で、同じ落とし穴に何度もはまらせている——。その徒労を減らすための小さなOSSが、GitHubで静かに伸びている。

Kulaxyz氏が公開した「self-learning-skills」は、コーディングAIが一度の格闘の末にたどり着いた解法を、次のセッションでも使えるスキルとして自分で書き残す仕組みだ。星はすでに800を超え、Reddit のClaude Code系・Codex系コミュニティで話題になっている。

何を解こうとしているか

いまのコーディングエージェントは、セッションが終われば学んだことをほぼ忘れる。昨日ようやく通したビルド手順も、非自明なコマンドの組み合わせも、明日にはゼロから再発見させられる。

この「毎回リセットされる」感覚こそ、AIに開発を任せたことのある人なら誰もが味わう疲労だ。self-learning-skillsは、その一回性を断ち切ろうとする。

READMEの言葉を借りれば、これは仕事そのものをやるスキルではなく、仕事のやり方を捕まえるメタスキルだ。作業を代行するのではなく、うまくいった道筋の”形”を残す。

① 処理フロー図:AIが"勝ち筋"を検知し、関所を通してスキルに昇格させるまで
① 処理フロー図:AIが”勝ち筋”を検知し、関所を通してスキルに昇格させるまで

何を”スキル”として残すか

面白いのは、残すものと残さないものをきちんと分けている点だ。多段の再利用可能な手順やワークフローは「スキル」として保存し、単なる一つの事実や一行の訂正は軽量な「メモリ」に振り分ける。

そして最大の特徴が、成功した手順だけでなく、うまくいかなかった行き止まりも一緒に記録すること。次のセッションで既知の袋小路を避けられることは、成功例そのものより価値が高い場面が多い——という割り切りがそこにある。

② チェックリスト図:スキルに"昇格"できる3条件(すべて満たしたときだけ通るANDゲート)
② チェックリスト図:スキルに”昇格”できる3条件(すべて満たしたときだけ通るANDゲート)

いつ発動するのか

スキル化のトリガーは明快だ。何度か試してようやく通ったとき、非自明なコマンドを使ったとき、事前に知らなかったプロジェクト固有の事実にぶつかったとき、あるいは今後も繰り返しそうな運用ワークフローに気づいたとき。

そうした瞬間をAIが自分で検知し、プロンプトなしで捕獲する。スコープや名前も自分で決め、事後にユーザーへ「これを覚えました」と伝える。人間が「今のを覚えておいて」と指示する必要すら省いている。

③ 時系列図:Reflexion から self-learning-skills へ——自己改善エージェントの系譜
③ 時系列図:Reflexion から self-learning-skills へ——自己改善エージェントの系譜

雑なスキルを量産させない歯止め

自動でスキルを書かせると、当然ゴミも溜まる。そこにこのプロジェクトの設計思想が出ている。スキルとして”昇格”できるのは、三つの条件をすべて満たしたときだけだ。

検証が通っていること(テストが緑になった、クリーンにビルドできた、不具合が再現できた等の裏付けがある)、失敗パターンに名前が付いていること、そして最低ひとつは行き止まりが記録されていること。この三点セットが、思いつきの一発回答をスキル置き場に紛れ込ませない関所になっている。

秘密情報の扱いも慎重だ。環境変数の値そのものは残さず、それが「どこにあるか」(変数名や取得関数)だけを記録する。ログに認証情報が漏れる典型的な事故を、設計で避けている。

どこで動くか

対応の幅が広いのも今どきだ。Claude Codeには Agent Skills 形式で、Cursorには .cursor/rules/ として、Codex・Zed・Aider・Gemini CLIなどには AGENTS.md として配置される。加えて共通CLIの skills 経由で70以上のエージェントに入る。

導入は npx skills add kulaxyz/self-learning-skills が入っているエージェントを自動判別してくれる。Claude Codeなら /plugin install self-learning@self-learning-skills でも入る。ライセンスはMITだ。

背景——”自己改善”の系譜

この発想は突然出てきたものではない。2023年にPrinceton/MITが出したReflexionが、失敗を自然言語で振り返り永続メモリに書き残すという核を提示し、多くの自己改善エージェントがその上に立っている。

HumanEvalでGPT-4の正答率を80%から91%へ、11ポイント押し上げたのがReflexionだった。以後、実務では learnings.md のような素朴なMarkdownに教訓を積む手法が定着し、2026年のいまは成功と失敗の軌跡をスキルへ蒸留する研究(SkillForge、CODESKILLなど)が続く。

self-learning-skillsは、その大きな流れを、いま普及したAgent Skillsという開いた規格に載せて誰でも使える形にした——という位置づけになる。土台のAgent Skillsは2025年12月にAnthropicが標準として公開し、Claude Code・Codex・Cursorをまたいで動く。

日本・個人開発の視点

これは個人開発者にこそ効く道具だ。チームなら手順書やREADMEを整える人手があるが、一人で回している現場では、AIが暗黙知を勝手に貯めてくれる価値は大きい。

自分のニッチな環境——独自のデプロイ手順、社内ツールの癖、ローカルLLMのつまずき——ほど、汎用スキル置き場には落ちていない。その空白を、自分のセッションから自動で埋めていける。同じ「AIが自分の足場を自分で整える」潮流は先週も相次いでいて、自分のハーネスを書いて磨くコーディングAI、Godcoder公開自分の足場を自分で書くコーディングAI、Ornith-1.0公開が同じ問いを別角度から叩いている。

要点まとめ

  • self-learning-skillsは、コーディングAIが苦労して得た解法を自動でスキル化し次回に持ち越すOSS(MIT、星800超)。
  • 成功手順だけでなく「行き止まり」も記録するのが最大の特徴。
  • 昇格には検証済み・失敗パターン命名・行き止まり記録の三条件が必要で、質を担保する。
  • Claude Code/Cursor/Codexなど70以上のエージェントに対応、npx skills add で導入。
  • 2023年のReflexion以来の自己改善エージェント研究を、Agent Skills規格で日常に落とし込んだ位置づけ。

🐦‍⬛ 編集部の視点

私たちが唸ったのは、「失敗を残す」に振り切ったところだ。多くの自己改善ツールは成功例を貯めたがるが、現場で本当に時間を溶かすのは、もう誰かが試して駄目だった道をまた歩くことだ。そこに名前を付けて残す設計は、地味だが正しい。

昇格の三条件も効いている。AIに自動でメモを書かせると、たいていノイズの山になる。「検証が通ったものだけ」という関所を一枚挟むだけで、スキル置き場が汚染されずに済む。この歯止めの有無が、使える自己学習と使えない自己学習を分ける。

一方で、貯まったスキルの棚卸しは誰がやるのか、という問いは残る。プロジェクトが変われば昨日の勝ち筋が今日の落とし穴になる。自動で貯める仕組みを入れたなら、次は自動で捨てる仕組みが要る。あなたのAIが覚えたことを、あなたは定期的に見直せているだろうか。

出典・リンク

コメントを残す

Trending

World AI Newsをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む