Federico Viticci、MacStoriesより:
ここ一週間ほど、私の名前も、朝のルーティンへの好みも、テックニュースの要約スタイルまで把握しているデジタルアシスタントと作業してきた。それはMac miniの中に住み、ファイルシステムにアクセスし、WhatsApp・Discord・Telegramで話しかけてくる。[...]
これがClawdbotだ。「ロブスターの流儀」でAIと対話するオープンソースプロジェクト。雑然としていて、ターミナルの操作を要求する。だが間違いなく、私がこれまで使った「エージェント」の中で最も強力な実装だ。
ここ二週間のClawdbotをめぐる熱狂は、Homebrew Computer Clubの黎明期——あるいは初代LAMPスタックの登場時——以来見られなかったエネルギーを帯びている。昨春に生まれた「バイブコーディング」ムーブメントは、ついにマスコットを得た。ロブスターだ。XとBlueskyには、Mac Miniを積み上げた開発者たちの投稿が溢れている——ローカルファースト運動の新たなステータスシンボルが、この奇妙なソフトウェアを動かしている。
Clawdbotをパワーユーザー向けの玩具として切り捨てることは簡単だ。月額サブスクリプションを避けるためにDockerコンテナとAPIキーと格闘する、ニッチなツールに過ぎないと。それは間違いだ。
OpenAIとGoogleがクラウドでスケールの戦争を繰り広げ、究極のインテリジェンスのアグリゲーターを目指す一方で、Clawdbotは根本的な構造的反論を体現している。インターフェース(メッセージングアプリ)とインテリジェンス(LLM)とステート(Gateway)を切り離すことで、Clawdbotは単なるアシスタントではない——ユーザーがAI価値連鎖において主導権を取り戻すためのプロトタイプだ。
エージェントとユーザーエージェント
Clawdbotが何を意味するかを理解するには、「ユーザーエージェント」の原点に立ち返る必要がある。
初期のウェブにおいて、ブラウザ——Netscape Navigator、そのちのInternet Explorer——は文字通りユーザーエージェントだった。それはあなたのために働いた。混沌としたウェブを読める形式に変換し、ブックマークをローカルに保存し、履歴をあなた自身のディスクに管理した。ユーザーが主、ソフトウェアが代理人だった。
やがてブラウザはただのパイプになった。「エージェント」はサービス側に移行した——Facebook、Google、Amazon。これらのアグリゲーターがユーザーとの関係、データ、コンテキストを掌握した。ユーザーは主から商品へと転落した。今日のブラウザは、他社のアプリケーションを動かすランタイムに過ぎない——そしてその変化は今、AIブラウザの台頭によってさらに加速している。
現在のAIチャットボット群——ChatGPT、Claude.ai、Gemini——はサービス・アズ・エージェントのパラダイムの最終形だ。優秀だが、囲い込みされた庭園だ。彼らのウェブサイトを訪れ、彼らのインターフェースを使い、彼らの制約に従う。あなたの「メモリ」は彼らのものだ。
OpenAIのエージェント型コンピューティングへの最近の展開——Operator、ChatGPT Agent——も、ユーザーをOpenAIのエコシステム内に強く留め置く。エージェントはあなたの代わりに行動するが、コンテキスト、履歴、「魂」はOpenAIが握る。
Clawdbotはこの構造を完全に逆転させる。
Gatewayアーキテクチャ
アーキテクチャとして、ClawdbotはGatewayだ。ローカルハードウェア上に置かれる——だからこそ、Appleの2024年リデザイン以来開発者が好むサーバーとなったMac Miniが積み上げられているわけだ。
一方では、すでに使っているコミュニケーションチャネルに接続する——WhatsApp、Discord、Slack、Telegram、iMessage。もう一方では、インテリジェンスプロバイダーに接続する——Anthropic、OpenAI、Google、あるいはOllamaを通じたローカルモデル(完全にデバイス上で動作できる小規模言語モデル)。
核心的な革新はここにある:Clawdbotはチャネルもインテリジェンスも、両方を商品として扱う。
技術ドキュメントに詳述されたアーキテクチャの力は、29以上のメッセージングプラットフォームを単一の抽象化レイヤーに正規化することにある。Clawdbotにとって、WhatsAppはただのパイプだ。同時にLLMも正規化する——複雑な推論にはClaude、プライバシーに敏感なタスクにはローカルのLlamaモデルといった使い分けが可能だ。AIモデルは「製品」から特化したAPIコールへと格下げされる。
これはまさに、Ben Thompsonが昨年5月のAIの統合とモジュール化についての分析で論じたモジュラーアーキテクチャだ。Thompsonは、AIスタックはモデル層で最終的に商品化され、統合ポイントを所有する者に価値が集積すると主張した。Clawdbotはこの論理を極限まで推し進める——ユーザー自身が統合者になる。
ステートの価値
標準的なChatGPTのやり取りでは、ステートはチャット履歴であり、OpenAIのサーバーに存在します。OpenAIはこのメモリ機能を着実に拡張してきた——最近では過去の会話を参照して「パーソナライズされた」返答を行えるようにしました。ユーザーは継続性から恩恵を受けますが、代償はロックインだ。会話の履歴、好み、コンテキストがすべてOpenAIに帰属する。
Clawdbotでは、ステートはMarkdownファイル(SOUL.md、MEMORY.md)とローカルディスクに保存されたベクトル埋め込みの集合です。この格納先の違いは小さく見えて、構造的な含意は大きい。Gatewayアーキテクチャが意味するのは、ステート(コンテキスト、メモリ、エージェントの「魂」)がクラウドからエッジへと移行するということだ。ステートがローカルにあるため、次の特性が生まれる:
- ポータブル:アシスタントのパーソナリティやメモリを失わずに、OpenAIからAnthropicへ切り替えられる。
- 主権的:利用規約の更新で履歴が削除されることはない。企業買収がルールを変えることもない。
- 統合的:ステートがファイルシステムに存在するため、エージェントは実際に行動できる。
この3点目が、AIエージェントにとっての「したがって」の瞬間だ。
従来のチャットボットでは、AIが推論してテキストを出力する。Clawdbotでは、AIが推論し、そして——ローカルシェルアクセスを持つため——行動する。Pythonスクリプトを提案するだけでなく、そのスクリプトをディスクに書き込み、実行し、エラーをデバッグし、結果をTelegramで送ってくる。
Anthropicはこの能力を昨年10月のClaude 3.5 Sonnetの「computer use」機能で実証した——デスクトップ環境と対話できるものだ。だがその実装には、Anthropicのインフラが仲介として必要だった。Clawdbotは同じエージェント能力をローカルマシンに持ち込む。仲介者なしに。
「したがって」はもはや思考連鎖の中の論理的接続詞ではない——コンピュータの物理層への橋だ。
商品化された頭脳
Ben Thompsonのアグリゲーション理論はこう論じる——デジタル市場ではユーザーと直接の関係を持つ企業が勝つ、なぜならサプライヤーを商品化できるから。Facebookは出版社を商品化しました。Googleはウェブサイトを商品化しました。Amazonは商人を商品化しました。アグリゲーターは需要側を支配し、供給側から価値を抽出する。
現在、OpenAIはインテリジェンスのアグリゲーターになろうとしています。ChatGPTを通じてユーザーとの関係を握り、コンテンツ出版社を学習データの商品化されたサプライヤーとして扱っています。ClaudeはAI業界の内側にいる人々の間でもっとも好まれるチャットボットになったが、Anthropicも同じ構造的圧力に直面しています——ユーザーを持ち、コンテキストを持ち、「関係性」を持つこと。Clawdbotはこの構造への根本的な反論だ。ユーザーを——ローカルのGatewayを通じて——アグリゲーターとして位置づける。AIアグリゲーターにとっての悪夢は、ここにある。
私がClawdbotを動かしている場合:
- インターフェースは商品化される:DiscordにいようとWhatsAppにいようとSlackにいようと関係ない。エージェントはそこにいて、すべてのチャネルで待機している。
- インテリジェンスは商品化される:コーディングにはClaudeを、ビジョンタスクにはGPT-4oを、検索にはGeminiを使う。トークン単位で対価を払う——究極のコモディティ価格モデルだ。
「ロブスターの流儀」の哲学——特に「脱皮(Exfoliating)」あるいはコンテキストを剥がすという概念——は、現代のテックモートを定義するロックインへの拒否だ。クラウドにコンテキストを持たせないことで、Clawdbotはインテリジェンスプロバイダーの切り替えコストを実質ゼロに保つ。
主権のコスト
ただし、大きな留保がある。
Clawdbotを動かすには、コミュニティが「スパイシー」と呼ぶセキュリティ設定に慣れている必要がある。実質的に、AIモデルにマシンへのルートアクセスを与え、トンネル経由でウェブソケットサーバーをインターネットに公開することになる。
アグリゲーターが勝つのは、通常、摩擦を吸収するからだ。Googleが機能するのは、自分でメールサーバーを管理する必要がないからだ。OpenAIが機能するのは、Dockerコンテナを管理したりAPIキーをローテーションしたりする必要がないからだ。Clawdbotは主権と能力の名の下に、その摩擦をすべて再導入する。
さらに、エンジニアリング報告書に記されている「レーンベースの並行処理モデル」と「実行承認ゲーティング」は、ローカルエージェンシーが危険だからこそ必要だ。クラウドのチャットボットは誤ってあなたのホームディレクトリをrm -rfすることはできないが、ローカルエージェントは確実にできる。
このことが示唆するのは、Clawdbotは現在の形では「バイブコーディング」エリート——コンピュータを家電ではなく作業台として捉える開発者やパワーユーザー——向けのニッチなツールにとどまるということだ。
Gatewayを巡る競争
それでも、Clawdbotが確立するパターンは、おそらく不可避だ。
LLMが安価になり高性能になるにつれて、「モデルをホストする」ことの利幅はゼロへと圧縮されていきます。価値は文脈の統合——ユーザーが誰で、何に取り組んでいて、どんな権限を持っているかを把握すること——へとシフトする。
大手プラットフォームはこれを理解している。AppleはApple IntelligenceでSiriとOSにAIを統合し、個人コンテキストをデバイス上で処理する。MicrosoftはMicrosoft 365にCopilotを組み込み、企業生産性のエージェント層を目指す。Googleは同様のことをWorkspace上のGeminiで進めている。
AIラボも自前のGateway構築に走っている:
- OpenAIは2025年4月にCodex CLIを発表——オープンソースのターミナルエージェントだ。
- Googleは6月にGemini CLIが続いた。
- AnthropicにはClaude Codeがあり、今ではEnterpriseサブスクリプションに同梱している。
- Blockは1月にオープンソースの代替としてGooseをリリースした。
2025年2月以降に登場したターミナルベースのAIツールは今や独自のカテゴリを形成している——ブラウザではなくコマンドラインがエージェント型AIの自然な住処である可能性を認めた証拠だ。
オープンウェブの答え
Clawdbotは、プラットフォーム統合に対するオープンウェブの答えだ。
GatewayはOS の機能であってはならない(Appleのアプローチ)。クラウドの機能であってもならない(OpenAIのアプローチ)。生産性スイートの機能でもない(Microsoftのアプローチ)。Gatewayはユーザーが所有する独立したインフラであるべきだ——Clawdbotはそう主張している。
問うべきはClawdbot自身がOpenAIを倒せるかどうかではない。マス市場には複雑すぎることはほぼ確実だ。問うべきは、ステートがローカルでインテリジェンスがモジュラーな商品というGatewayアーキテクチャが、摩擦を十分に解消して意義を持てるかどうかだ。
もしそれが実現すれば、全能のAIアグリゲーターの時代は誰の予想よりも短い。ロブスターには、爪がある。
この分析は、Clawdbotに関するTEXXRのカバレッジを基にしており、X投稿44件、Bluesky投稿3件、関連記事3本を含む。Clawdbotの全カバレッジを探索し、AIエージェントというトピックの進化をたどり、あるいはNexusでターミナルのAIツールを比較しよう。