OpenClawでCAPTCHAを解く方法 – ステップバイステップガイドとCapSolver拡張機能

Sora Fujimoto
AI Solutions Architect
06-Mar-2026

AIアシスタントがウェブをブラウズする際、CAPTCHAは最大の障壁です。保護されたページがエージェントをブロックし、フォームの送信ができない、タスクが人間の介入を待って停止します。
OpenClawは、自然言語を通じてウェブをブラウズし、フォームを入力し、ボタンをクリックし、データを抽出できるパーソナルAIアシスタントです。しかし、あらゆるブラウザ自動化と同様に、CAPTCHAで詰まってしまいます。
CapSolverはこれを完全に変えるものです。OpenClawのブラウザにCapSolver Chrome拡張機能を読み込むことで、CAPTCHAは自動的かつ見えない形でバックグラウンドで解決されます。コードは必要ありません。あなたの側からのAPIコールもありません。AIアシスタントに話す方法に変更は必要ありません。
最高の点は、AIにCAPTCHAについて言及する必要がないということです。ただ、送信する前に数秒待つように指示するだけで、その間にCAPTCHAはすでに解決されています。
OpenClawとは何か?
OpenClawは、自分のデバイスで実行するパーソナルAIアシスタントです。あなたがすでに使っているチャネル—WhatsApp、Telegram、Slack、Discord、Signal、iMessage、Google Chat、Microsoft Teamsなど—で応答します。

主な特徴
- マルチチャネルインボックス: WhatsApp、Discord、Telegram、SlackなどからAIに話しかけられます
- 内蔵ブラウザ: エージェントはタブを開き、ページをナビゲートし、ボタンをクリックし、フォームを入力し、スクリーンショットを撮ることができます
- ローカルファースト: 自分のハードウェアで動作します—あなたのデータはあなたに残ります
- プラグインシステム: カスタム拡張機能と統合を拡張できます
- 音声サポート: macOS、iOS、Androidで音声でエージェントに話しかけられます
ブラウザツール
OpenClawは、専用のChromiumブラウザプロファイルを実行し、エージェントのみが制御します。これはあなたの個人ブラウザとは完全に分離されています。エージェントは以下が可能です:
- 任意のURLを開き、ナビゲートします
- ページのコンテンツを読み、スナップショットを撮ります
- ボタンをクリックし、フォームを入力し、ドロップダウンを選択します
- スクリーンショットを撮り、PDFを作成します
- 複数のタブを管理します
これは、AIアシスタントに独自のブラウザウィンドウを与えるようなものです。
CapSolverとは何か?
CapSolverは、さまざまなCAPTCHAチャレンジを回避するためのAIパワードソリューションを提供するリーディングCAPTCHA解決サービスです。複数のCAPTCHAタイプをサポートし、高速な応答時間を提供し、自動化ワークフローにシームレスに統合されます。
サポートされているCAPTCHAタイプ
- reCAPTCHA v2 (画像ベース & インビジブル)
- reCAPTCHA v3 & v3 Enterprise
- Cloudflare Turnstile
- Cloudflare 5秒チャレンジ
- AWS WAF CAPTCHA
- その他の広く使用されているCAPTCHAおよびアンチボットメカニズム
この統合が異なる理由
ほとんどのCAPTCHA解決統合では、コードを書く必要があります—APIコールを作成し、結果をポーリングし、隠しフォームフィールドにトークンをインジェクトします。Crawlee、Puppeteer、Playwrightなどのツールではこれが一般的です。
OpenClaw + CapSolverは根本的に異なります:
| 伝統的(コードベース) | OpenClaw(自然言語) |
|---|---|
CapSolverServiceクラスを書く |
設定に拡張パスを追加 |
createTask() / getTaskResult()を呼び出す |
AIに話しかけるだけで良い |
page.$eval()でトークンをインジェクト |
拡張機能がすべてを処理 |
| コードでエラー、リトライ、タイムアウトを処理 | AIに「60秒待ってから送信してください」と言う |
| 各CAPTCHAタイプごとに異なるコード | すべてのタイプを自動的に処理 |
重要な洞察: CapSolver Chrome拡張機能はエージェントのブラウザセッション内で実行されます。エージェントがCAPTCHAのあるページに移動すると、拡張機能はそれを検出し、バックグラウンドで解決し、トークンをインジェクトします—エージェントがフォームを送信しようとする前に。
ただ時間がかかるだけです。 AIに「CAPTCHAを解決してください」と言うのではなく、単に以下のように言うだけで:
「そのページに移動し、60秒待ってからSubmitをクリックしてください。」
それだけです。AIはCapSolverについて知らなくても構いません。
必要条件
統合をセットアップする前に、以下のことを確認してください:
- OpenClawがインストールされ、ゲートウェイが動作していること
- CapSolverアカウントとAPIキー(サインアップはこちら)
- ChromiumまたはChrome for Testing (以下の重要な注意点を参照)
重要な点: Google ChromeではなくChromiumを使用してください
Google Chrome 137+ (2025年半ばリリース)は、ブランド構築で
--load-extensionを静かにサポートを終了しました。 これは、標準のGoogle Chromeで自動セッションにChrome拡張機能をロードすることはできないことを意味します。エラーは表示されません—フラグは単に無視されます。
これはGoogle ChromeとMicrosoft Edgeに影響します。以下のいずれかを使用する必要があります:
| ブラウザ | 拡張機能のロード | 推奨? |
|---|---|---|
| Google Chrome 137+ | サポートされていません | いいえ |
| Microsoft Edge | サポートされていません | いいえ |
| Chrome for Testing | サポートされています | はい |
| Chromium(スタンドアロン) | サポートされています | はい |
| PlaywrightのバンドルChromium | サポートされています | はい |
Chrome for Testingのインストール方法:
bash
# オプション1: Playwright経由(推奨)
npx playwright install chromium
# バイナリのパスは以下のようになります:
# ~/.cache/ms-playwright/chromium-XXXX/chrome-linux64/chrome (Linux)
# ~/Library/Caches/ms-playwright/chromium-XXXX/chrome-mac/Chromium.app/Contents/MacOS/Chromium (macOS)
bash
# オプション2: Chrome for Testingの直接ダウンロード
# 以下にアクセス: https://googlechromelabs.github.io/chrome-for-testing/
# OSに合ったバージョンをダウンロード
インストール後、バイナリのフルパスを記録してください—設定で必要になります。
ステップバイステップのセットアップ
ステップ1: CapSolver Chrome拡張機能をダウンロード
CapSolver Chrome拡張機能をダウンロードし、~/.openclaw/capsolver-extension/に展開します:
- CapSolver拡張機能のリリースページに移動
- 最新の
CapSolver.Browser.Extension-chrome-vX.X.X.zipをダウンロード - ZIPを展開:
bash
mkdir -p ~/.openclaw/capsolver-extension
unzip CapSolver.Browser.Extension-chrome-v*.zip -d ~/.openclaw/capsolver-extension/
- 展開が成功したか確認:
bash
ls ~/.openclaw/capsolver-extension/manifest.json
manifest.jsonが表示されれば、拡張機能が正しい場所にあります。
ステップ2: CapSolver APIキーを設定
~/.openclaw/capsolver-extension/assets/config.jsの拡張機能の設定ファイルを開き、apiKeyの値を自分のものに置き換えます:
js
export const defaultConfig = {
apiKey: 'CAP-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX', // ← ここにあなたのキーを
useCapsolver: true,
// ... その他の設定
};
あなたのAPIキーはCapSolverダッシュボードから取得できます。
ステップ3: ブラウザを設定
~/.openclaw/openclaw.jsonのOpenClaw設定ファイルを編集し、ブラウザを有効にし、拡張機能をロードします:
json
{
"browser": {
"enabled": true,
"executablePath": "/path/to/chrome-for-testing/chrome",
"extensions": [
"~/.openclaw/capsolver-extension"
],
"noSandbox": true,
"defaultProfile": "openclaw"
}
}
/path/to/chrome-for-testing/chromeを、実際のChrome for TestingまたはChromiumのバイナリのパスに置き換えてください。例えば:
- Linux (Playwright):
~/.cache/ms-playwright/chromium-1200/chrome-linux64/chrome - macOS (Playwright):
~/Library/Caches/ms-playwright/chromium-1200/chrome-mac/Chromium.app/Contents/MacOS/Chromium
注意: よくあるサーバー環境、Dockerコンテナ、CIシステムでは
noSandbox: trueが必要です。適切なサンドボックスを持つデスクトップシステムでは省略できます。
ステップ4: ゲートウェイを再起動
bash
# PM2を使用している場合:
pm2 restart opencrawl --update-env
# 直接実行している場合:
openclaw gateway restart
ステップ5: 設定を確認
ゲートウェイのログを確認して、すべてが正しく読み込まれているか確認します:
bash
pm2 logs opencrawl --lines 20 --nostream
以下のキーラインが表示されるはずです:
[browser/chrome] 1つの拡張機能をロードしています
[browser/chrome] Chromeを起動中: /path/to/chrome-for-testing (引数: 15)
高度な確認—Chrome DevTools Protocolで拡張機能がアクティブか確認します:
bash
curl -s http://127.0.0.1:8091/json/list
URLにchrome-extension://が含まれるservice_workerエントリが表示されるはずです:
json
{
"title": "Service Worker chrome-extension://cnopfoopenkdblckmekkipihdnambjhf/background.js",
"type": "service_worker",
"url": "chrome-extension://cnopfoopenkdblckmekkipihdnambjhf/background.js"
}
このように表示されれば、CapSolverはロードされ、動作しています。

使い方
これは最も重要なセクションです。セットアップが完了したら、OpenClawでCapSolverを使うのは非常に簡単です。
ゴールデンルール
CAPTCHAやCapSolverについてAIに言及しないでください。 フォームの送信前に時間を確保するだけです。
AIエージェントはCAPTCHAについて知らなくても構いません。拡張機能がバックグラウンドですべてを処理します。ただ、指示に待機時間を含めれば、拡張機能がフォームを送信する前にチャレンジを解決する時間を持たせることができます。
例1:
Discord、WhatsApp、Telegram、または他のチャネルを通じてOpenClawエージェントに以下を送信:
https://example.comに移動し、60秒待ってからSubmitをクリックし、ページに表示されるテキストを教えてください。
裏で起こること:
- エージェントはreCAPTCHAデモページに移動します
- CapSolverのコンテンツスクリプトはreCAPTCHAウィジェットを検出します
- 拡張機能はCapSolver APIを呼び出し、チャレンジを解決します(通常10〜20秒)
- トークンが隠しフォームフィールドにインジェクトされます
- 60秒後にエージェントはSubmitをクリックします
- ページは「Verification Success... Hooray!」と表示されます
例2: 保護されたサイトにログイン
https://example.com/loginに移動し、メールフィールドに「me@example.com」と入力し、パスワードフィールドに「mypassword123」と入力し、30秒待ってから「Sign In」ボタンをクリックしてください。ログイン後のページを教えてください。
例3: Turnstileの後ろにあるフォームを送信
https://example.com/contactを開き、連絡フォームに入力:
- 名前: "John Doe"
- メール: "john@example.com"
- メッセージ: "こんにちは、サービスについて質問があります。"
45秒待ってから「Send Message」をクリックしてください。確認メッセージは何ですか?
推奨待機時間
| CAPTCHAタイプ | 通常の解決時間 | 推奨待機時間 |
|---|---|---|
| reCAPTCHA v2(チェックボックス) | 5-15秒 | 30-60秒 |
| reCAPTCHA v2(インビジブル) | 5-15秒 | 30秒 |
| reCAPTCHA v3 | 3-10秒 | 20-30秒 |
| Cloudflare Turnstile | 3-10秒 | 20-30秒 |
ヒント: 不明な場合は60秒を使用してください。少し長く待つのは、早すぎる送信よりも良いです。余分な待機時間は結果に影響しません。
効果的な自然言語の表現
以下は使用できる検証済みの表現です:
- "URLに移動し、60秒待ってからフォームを送信してください"
- "URLに移動し、フィールドに入力し、30秒待ってからボタンをクリックしてください"
- "URLを開き、約1分後にSubmitをクリックし、結果を教えてください"
- "URLにアクセスし、ページが完全に読み込まれるのを待ってから送信してください"
してはいけない表現
これらはAIを混乱させたり、拒否を引き起こす可能性があるため避けてください:
"CAPTCHAが解決されるのを待ってください"(AIはCAPTCHAについて知らない)"CapSolverを使って検証を解決してください"(AIは拡張機能を制御できません)"reCAPTCHAのチェックボックスをクリックしてください"(拡張機能が処理します—クリックは干渉する可能性があります)
裏側の動作
技術的な詳細を知りたい人向けに、CapSolver拡張機能がロードされたときの動作を説明します:
あなたのメッセージ OpenClawゲートウェイ
───────────────────────────────────────────────────
"ページに移動し、 ──► AIエージェントがメッセージを受け取ります
60秒待ってから送信" │
▼
ブラウザツール: URLに移動
│
▼
Chromiumがページを読み込みます
┌─────────────────────────────┐
│ reCAPTCHAウィジェットのあるページ │
│ │
│ CapSolver拡張機能: │
│ 1. コンテンツスクリプトが │
│ ページのreCAPTCHAを検出 │
│ 2. サービスワーカーが │
│ CapSolver APIを呼び出します│
│ 3. トークンが受け取られます │
│ 4. トークンが隠しフォームフィールドにインジェクトされます │
└─────────────────────────────┘
│
▼
AIエージェントが60秒待つ...
│
▼
ブラウザツール: Submitをクリック
│
▼
有効なトークンでフォームが送信されます
│
▼
"Verification Success!"
拡張機能のロード方法
OpenClawのブラウザが起動するとき、設定からextensionsリストを読み込み、各パスをChromeに--load-extensionフラグで渡します。これはChromeが開発者拡張機能に使用するメカニズムと同じです—特別なプラグインシステムは必要ありません。
- Chromeが起動し、
--load-extension=~/.openclaw/capsolver-extensionで実行されます - 拡張機能がアクティブ—そのサービスワーカーが開始され、すべてのページにコンテンツスクリプトがインジェクトされます
- CAPTCHAのあるページで—コンテンツスクリプトはウィジェットを検出し、CapSolver APIを呼び出し、ページに解決トークンをインジェクトします
完全な設定リファレンス
以下は、CapSolver拡張機能を含む~/.openclaw/openclaw.jsonの完全な設定です:
json
{
"browser": {
"enabled": true,
"executablePath": "/path/to/chrome-for-testing/chrome",
"extensions": [
"~/.openclaw/capsolver-extension"
],
"noSandbox": true,
"defaultProfile": "openclaw"
}
}
設定オプション
| オプション | 説明 |
|---|---|
browser.executablePath |
Chrome for Testing または Chromium バイナリのパス (必須) |
browser.extensions |
Chrome にロードする拡張機能ディレクトリの配列 |
browser.noSandbox |
サーバー/Docker で true に設定 (Chrome サンドボックスには特別なカーネル機能が必要) |
browser.defaultProfile |
ブラウザープロファイル名 (デフォルト: "chrome") |
CapSolver API キーは拡張機能の assets/config.js ファイルに直接設定されます (上記のステップ2を参照)。
トラブルシューティング
拡張機能がロードされない
症状: ゲートウェイログに Loading 1 extension(s) と表示されるが、CDPに chrome-extension:// ターゲットが表示されない。
原因: ブランド版 Google Chrome 137+ を使用しているため、--load-extension は無視される。
法: Chrome for Testing または Chromium に切り替える。設定ファイルの browser.executablePath を正しいバイナリに更新する。
Chromeバージョンの確認:
bash
/path/to/your/chrome --version
# Chrome for Testing: "Chromium 143.0.7499.4"
# ブランド版 Chrome: "Google Chrome 143.0.7499.109"
CAPTCHAが解決されない (フォームが失敗)
可能性のある原因:
- 待機時間が十分でない — 60秒に増やす
- 無効なAPIキー — CapSolverダッシュボードを確認
- 残高が不足 — CapSolverアカウントに残高を追加
- 拡張機能がロードされていない — 上記の「拡張機能がロードされない」を参照
ブラウザが最初のアクションでタイムアウト
症状: ゲートウェイをリスタート後の最初のブラウザアクションがタイムアウトするが、以降のアクションは動作する。
原因: Chromiumのコ動リ + + Playwright CDP接続の再試行が、最初リスタート時の20秒制限を超える。
解決法: これは既知の問題です。コマンドを再実行してください。2回目の実行ではブラウザが起動しているため成功します。
ブラウザがブラウザ切り切り替えた後にクラッシュ
症状: ブランド版 Chrome から Chrome for Testing に切り替えた後、ブラウザがディスクキャッシュエラーでクラッシュする。
原因: 別のChromeバージョンで作成されたユーザーデータディレクトリが非互換。
解決法: 古いブラウザプロファイルを削除し、再起動:
bash
rm -rf ~/.openclaw/browser/openclaw/user-data
# その後ゲートウェイを再起動
最適な実践方法
1. 常に十分な待機時間を設定する
より長い待機時間は安全安全です。CAPTCHAは通常5〜20秒で解決されますが、ネットワーク遅延、複雑なチャレンジ、またはリトライにより時間がかかるます。30〜60秒が最適です。
2. メッセージを自然に保く
以下のようにしないでください:
"URLに移動し、CAPTCHAソルバーを待ってから送信"
代わりに:
"URLに移動し、約1分待ってからフォームを送信"
自然な表現はAIに効果的で、セーフティ拒否を避します。
3. CapSolver残高を監視する
各リソルブごとにクレジットが使用われます。capsolver.com/dashboard で定期的に残高を確認してください。
4. サーバーで noSandbox を使用する
OpenClawをリモートサーバー、Dockerコンテナ、CI環境で実行する際は、ブラウザ設定で noSandbox: true を常に設定してください。Chromeのサンドボックスには特別なカーネル機能が必要で、ほとんどのサーバー環境では利用できません。
5. ヘッドレスサーバーで DISPLAY を設定する
Chrome拡張機能はディスプレイを必要とします。Xvfbで仮想ディスプレイを作起動してください:
bash
# Xvfbのインストール
sudo apt-get install xvfb
# 仮想ディスプレイの起動
Xvfb :99 -screen 0 1280x720x24 &
# OpenClaw用のDISPLAY設定
export DISPLAY=:99
結論
OpenClaw + CapSolverの統合は、CAPTCHA解決の根本的なアプローチを提供します。コードを記述してCAPTCHAを検出したり、APIを呼び出してトークンを挿入するのではなく、単に:
- 拡張機能をダウンロードし、設定に追加する
- Chromiumに接続する (ブランド版 Chrome は不可)
- AIに自然に指示を: — リソルブ前に待機時間を含める
CapSolver Chrome拡張機能がすべてを処理します — CAPTCHAの検出、CapSolver APIを通じた解決、ページへのトークンの挿入。AIアシスタントはCAPTCHAについて一切知らなくても構いません。
CAPTCHA解決がAIアシスタントとどのように見えるか — 非表示、自動的、ゼロコード。
始動準備はできましたか? CapSolverに登録 して、初回チャージで6%のボーナスを取得してください!
FAQリション
CapSolverについてAIに伝える必要がありますか?
いいえ。実際には、CAPTCHAやCapSolverについてメッセージに記述しないでください。拡張機能は背景リソルブを背景で処理します。CAPTCHAが表示された場合に解決する時間を確保するためにるために、"60秒待ってから送信"などの指示を含めてください。
なぜ通常のGoogle Chromeは使できませんませんか?
2025年半ばにリリースされたGoogle Chrome 137+ は、ブランド版のビルドで --load-extension コマンドラインフラグを削サポートにしました。これにより、自動化されたセッションでChrome拡張機能をロードできなくなります。Chrome for Testing またはスタンドアロンのChromiumを使用する必要があります。
CapSolverがサポートするCAPTCHAタイプは?
CapSolverはreCAPTCHA v2 (チェックボックスおよび非表示)、reCAPTCHA v3、Cloudflare Turnstile、AWS WAF CAPTCHAなどに対応しています。Chrome拡張機能は自動的にCAPTCHAタイプを検出し、それに応じて解決します。
CapSolverの料金は?
CapSolverはCAPTCHAタイプと量に基づいて競争力のある価格を提供します。現在の価格は capsolver.com を参照してください。
OpenClawは無料ですか?
OpenClawはオープンソースで、自分のハードウェア上で無料で実行できます。AIモデルプロバイダーのAPIキーが必要であり、CAPTCHA解決にはCapSolverアカウントとクレジットが必要です。
AIにどのくらいの待機時間を指示すべきですか?
ほとんどのCAPTCHAでは30〜60秒が十分です。実際の解決時間は通常5〜20秒ですが、余分なバッファを追加することで信頼性が向上します。不明な場合は60秒を使用してください。
ヘッドレスサーバーで使用できますか?
はい。Chrome拡張機能はディスプレイコンテキストを必要とするため、Xvfb (X Virtual Framebuffer) を使用して仮想ディスプレイを起動する必要があります。DISPLAY=:99 を設定し、Xvfb :99 をバックグラウンドで実行してください。また、ブラウザ設定で noSandbox: true を設定してください。
コンプライアンス免責事項: このブログで提供される情報は、情報提供のみを目的としています。CapSolverは、すべての適用される法律および規制の遵守に努めています。CapSolverネットワークの不法、詐欺、または悪用の目的での使用は厳格に禁止され、調査されます。私たちのキャプチャ解決ソリューションは、公共データのクローリング中にキャプチャの問題を解決する際に100%のコンプライアンスを確保しながら、ユーザーエクスペリエンスを向上させます。私たちは、サービスの責任ある使用を奨励します。詳細については、サービス利用規約およびプライバシーポリシーをご覧ください。
もっと見る

CapSolverとWeb MCPの統合: 自律エージェント向けガイド
AIエージェントのウェブ自動化機能を向上させましょう。このガイドでは、Web MCPフレームワーク内でCapSolverを統合して、CAPTCHAの解決を効率化する方法を説明します。信頼性とコンプライアンスを確保しながら運用を実現します。

Nikolai Smirnov
17-Mar-2026

CAPTCHA AI 大規模モデルを用いた: なぜ企業向けシナリオに適しているのか
AIビジュアルモデルがCAPTCHA認識をどのように再構築しているのか、そして企業向けソルバーがデータ、スケーラビリティ、カスタムトレーニングを必要とする理由。

Sora Fujimoto
13-Mar-2026

WebMCP vs MCP: AIエージェントにとっての違いは何か?
AIエージェント向けにWebMCPとMCPの主な違いを探索し、ウェブ自動化および構造化データの相互作用におけるその役割を理解してください。これらのプロトコルがAIエージェントの能力の未来をどのように形作るかを学びましょう。

Anh Tuan
13-Mar-2026

OpenClaw 対 Nanobot: あなたのAIエージェントを選ぶ - 自動化のための
効率的な自動化のために、OpenClawとNanobotの2つの先進的なAIエージェントフレームワークを比較してください。その特徴、パフォーマンス、そしてCapSolverがどのようにその能力を向上させるかを確認してください。

Aloísio Vítor
11-Mar-2026

OpenClawでCAPTCHAを解く方法 – ステップバイステップガイドとCapSolver拡張機能
OpenClawでCAPTCHAを解く方法を学び、シームレスなAIブラウザ自動化のためにCapSolverのChrome拡張機能を使用してください。

Sora Fujimoto
06-Mar-2026

マルチアカウント戦略には、環境分離とAIバイパスの両方が必要です
AdsPowerとCapSolverでマルチアカウントをマスターしましょう。アカウントの禁止を防ぐために、環境分離とAIバイパスを使用してください。

Sora Fujimoto
02-Mar-2026


