要点(30秒で): AIエージェント向けの自家ホスト型「検索+ブラウジング」スキルが GitHub で公開された。Cloudflareなどの自動化対策をすり抜けつつ、答える前に必ず一次ソースを引いてくる思想で実装されている。API課金もレート制限も無いので、自前エージェントを持つ読者は、まずDockerで立てて繋いでみる価値がある。
GitHub に Johell1NS/browser-search という名のスキルが現れたのは、2026年6月22日のことだ。リリースから数日で 165 スター・18 フォーク、ライセンスは MIT。AIエージェントに Web を本当の意味で使わせるための、地味だが急所を突く一手である。
肩書きは「AIエージェント向けスキル」だ。OpenCode、Claude Code、Cursor といったエージェント側に読み込ませることで、検索とブラウジングの能力をまるごと外付けする。要するに、賢いモデルは持っているけれど、Web の世界をどう歩かせるかで困っている開発者のための、薄くて頑丈な杖である。
何を解こうとしたか
AIエージェントに Web 検索を持たせる試み自体は珍しくない。むしろ、ハルシネーションを抑えるにはライブな Web 検索による Grounding が王道だとすら言われ、各社がこぞって API を売っている。問題は、その「Web」がもう素朴な HTTP リクエストでは歩けない場所になっていることだ。
READMEはそこを率直に書く。Cloudflareなどの反自動化システムは単純なリクエストをブロックし、モダンなサイトはJavaScript多用で素のクライアントには重い。検索APIを叩いても、肝心の中身は読めない——そういう詰まり方をしている開発者は多いはずだ。
仕組み・3段の自動エスカレーション
browser-search の答えは、3つのコンポーネントを役割で分担させることだった。最前線に立つのが 70以上のエンジンを束ねる自家ホスト型メタサーチ SearXNGで、Dockerの8080番ポートで待ち構える。クエリを受けてURLの束を返す担当だ。
次に、軽量ブラウザとして動く Camofox がREST API(9377番)でページを取りに行く。ここでブロックされた時に初めて、最後の砦として CloakBrowser が呼ばれる構造になっている。これはnpmパッケージで、ステルス性能はさらに一段高い。
要するに「軽い順に試して、ダメな時だけ重いブラウザに切り替える」エスカレーションを、エージェントの指示テンプレ側で書ききっているわけだ。Camofox のコールドスタートは公称で1〜3秒、温まれば実質ゼロ秒。Cloudflare標準の防御に対しては約92%を通すという数字が並ぶ。土台となる Camoufox 自体がFirefoxをC++レベルで改造して指紋を偽装する作りなので、市販のWAFを相手にしても粘りが効く。
「Anti-hallucination by design」の中身
派手な見出しに反して、ここは案外シンプルだ。SKILL.mdの中で 「Deep Research mode」 と呼ぶ振る舞いを定義し、エージェントに 「検索が先、回答は後(search first, answer second)」 を強制する。すべての事実主張をライブのWebソースに当てて裏取りし、複数の視点を相互参照し、推測はしない——という一連のワークフローを、ツールではなく指示プロンプトの形で焼き付けている。
要は、賢いモデルが暴走しないように検索→検証→回答の順番をスキル側で縛る設計だ。これは評価と検証でAIの暴走を抑える流れとも地続きで、モデルを賢くするより手綱を握る方が速い、という最近の合意がそのまま形になっている。
性能と現実的な強みの線
数字で見えるところを並べると、Camofoxの応答は通常時ほぼ即時で、Playwrightが0.5〜6秒かかるケースをずっと内側で吸収する。さらにReadability.jsでページ本文を抽出してから渡す設計により、エージェントに食わせるトークンをREADMEは 約70%圧縮 できると主張する。
セルフホストの徹底ぶりも目を引く。APIキーもサブスクもレート制限も無い——Dockerとnpmでラズパイの上にすら載るほど軽く、すべてが手元のマシンで完結する。最近では本番運用に耐えるAIエージェント基盤が次々と整いつつあるが、その一番下のレイヤーである「Webの入り口」までもがオフライン寄りに引き戻されつつあるのは興味深い動きだ。
使い始め方
導入は素直だ。git clone してきて npm install、SearXNGとCamofoxをそれぞれDockerで立ち上げ、CloakBrowserをnpmで入れる。あとはSKILL.mdをエージェントに読み込ませる。OpenCode構文で書かれているが、READMEは 「同じREADMEとpackage.jsonは全環境で動く」 と明記し、Claude CodeやCursorへは「変換方法をエージェントに聞いてくれ」と投げる、いかにも2026年らしい運用になっている。
限界と注意点
万能ではない。READMEはInstagram、Facebook、LinkedInなどの SNS には触らないと明記し、ファイルのダウンロード にも対応しない。ペイウォールも回避しない。やれることを絞り、Cloudflare系の動的サイトを横断的に読むという一点に集中している。
ベンチマーク事情も冷静に見ておきたい。2026年の独立検証では Camoufox は多くのターゲットを抜くが、CloakBrowser はヘッド表示で83.3%、ヘッドレスで50%まで通過率が落ちる。アンチボット側は常に更新されるので、自家ホストの宿命として「先週通ったやり方が今週塞がる」事態は折り込んでおく必要がある。
日本・個人開発の視点
このスキルが日本の開発者に効く理由は二つある。一つは、英語圏のように SearXNG+ローカルLLMの私的検索ワークフローを組む文化が日本ではまだ薄く、いざAIエージェントを動かそうとすると外部の有償APIに縛られがちな現状だ。手元のマシンに丸ごと載るこの構成は、その依存を一気に切れる。
もう一つは、個人開発者でも数日で165スターを集められる時代の手触りだ。少し前に話題になった176スターの個人キュレリポジトリと同じく、「思想がはっきりした小さな道具」が一番速く伝わることの実例である。
要点まとめ
- AIエージェント向けの自家ホスト型「検索+ブラウジング」スキルがMITライセンスで公開された。
- SearXNG(メタ検索)→Camofox(軽量ブラウジング)→CloakBrowser(最終手段)の3段で自動エスカレーションする。
- 「search first, answer second」をスキル側で強制し、ハルシネーション抑制を設計に組み込んでいる。
- Readability.jsでトークンを約70%削減、Camoufox公称でCloudflare 92%突破、ラズパイ稼働可。
- SNS非対応・ダウンロード不可・ペイウォール非対応の割り切りは明確。
🐦⬛ 編集部の視点
このリポジトリの面白さは、技術ではなく態度の方にあると私たちは見ている。ハルシネーション対策と聞くと、つい大規模モデルの内部やRAGのチューニングに目が行きがちだが、browser-search がやっているのは「検索を先にしろ、とSKILL.mdにそう書く」というだけの、地味で身も蓋もない解決策だ。
しかしこれが効く。エージェントの賢さに賭けるのではなく、エージェントが取れる行動の順番を外側から縛る——この発想は、AIを業務に降ろそうとしている読者にとって、明日からそのまま転用できる発想転換のはずである。Cloudflareの壁を抜くことより、自分のチームのAIが「答える前にちゃんと調べる」よう仕込むこと。そちらの方が、ずっと長く効く投資なのではないか。
ラズパイで動くという一行に、私たちはこの世代のAIツールの正気を見る。Webを歩くAIは、もう一度、自分の机の上に戻ってきた。
出典・リンク
- 出典: https://github.com/Johell1NS/browser-search
- Camoufox 公式(ステルス機構の解説): https://camoufox.com/stealth/
- SearXNG 公式: https://searxng.org/
- アンチ検出ブラウザ 2026 ベンチマーク(Ian L. Paterson): https://ianlpaterson.com/blog/anti-detect-browser-benchmark-patchright-nodriver-curl-cffi/
- Web検索でハルシネーションを減らす方法(Parallel): https://parallel.ai/articles/how-to-reduce-llm-hallucinations-by-connecting-your-app-to-real-time-web-search
- SearXNG セルフホスト解説(Medium): https://medium.com/@rosgluk/selfhosting-searxng-a3cb66a196e9




コメントを残す