CAPSOLVER
ブログ
CapSolverとn8nを使用してImageToTextを解決する方法

CapSolverとn8nを使用してImageToTextを解決する方法

Logo of CapSolver

Lucas Mitchell

Automation Engineer

18-Mar-2026

画像ベースのCAPTCHAはどこにでもあります — ログインフォーム、サインアップページ、チケット販売サイト、政府ポータルなど。これらは歪んだ文字、数字、またはその両方の組み合わせの画像を表示し、ユーザーに見たものを入力するよう求めます。従来のツールでこれらを自動化するには、独自のOCRパイプラインを構築し、ノイズフィルターを処理し、すべてのフォントと歪みタイプに対して特殊なケースを処理する必要があります。

独自のモデルをトレーニングすることなく、n8nワークフロー内で画像CAPTCHAを自動的に解決できるとしたらどうでしょうか?再利用可能な解決APIを構築している場合でも、画像CAPTCHAの読み取りを必要とするフォーム送信を自動化している場合でも、すべて可能です。

このガイドでは、n8n(ビジュアルワークフロー自動化ツール)と**CapSolver**(AIを活用したCAPTCHA解決サービス)を組み合わせて、オンデマンドで画像からテキストへのCAPTCHAを解決する方法を学びます — スタンドアロンのAPIエンドポイントとして、またはより大きな自動化ワークフローのステップとして。

構築するもの:

解決API — 他のツールが呼び出すことができる再利用可能なエンドポイント:

  • base64画像を許容し、認識されたテキストを返す画像からテキストへの解決API。

直接使用ワークフロー — CapSolverをより大きな自動化のステップとして埋め込む:

  • ターゲットウェブサイトからCAPTCHA画像を取得し、base64に変換し、CapSolverで解決し、認識されたテキストでフォームを送信するフォーム自動化。

ImageToTextTaskとは?

ImageToTextTaskは、CapSolverのOCRベースの認識サービスです。base64エンコードされたCAPTCHA画像を送信すると、CapSolverは認識されたテキスト(文字、数字、またはその両方)を即座に返します。

これは、reCAPTCHAやTurnstileなどの他のCapSolver操作とは根本的に異なります。

機能 ImageToText (認識) reCAPTCHA / Turnstile (トークン)
リソースタイプ 認識 トークン
入力 Base64画像 ウェブサイトURL + サイトキー
結果 認識されたテキスト (即時) トークン (ポーリングが必要)
プロキシが必要 いいえ タスクタイプによる
ユースケース 画像から歪んだテキストを読み取る 検証トークンを生成する

主な違いは、認識操作は即座に結果を返すことです — タスクの作成やポーリングはありません。画像を送信すると、CapSolverがそれを読み取り、テキストが単一のリクエスト-レスポンスサイクルで返されます。

必須パラメータ

パラメータ 説明
body Base64文字列 CAPTCHA画像、base64エンコード。改行文字なし、data:image/...;base64,プレフィックスなし — 生のbase64文字列のみ
module "common" 認識モジュール。"common"は一般的な英数字OCRを処理します

オプションパラメータ

パラメータ 説明
websiteURL CAPTCHAが表示されるページのURL(CapSolverが認識を最適化するのに役立ちます)
images (1-9) 複数の画像CAPTCHAを解決する際の"number"モジュール用の追加画像

モジュールタイプ

モジュール 目的
common 一般的なOCR — 文字、数字、混合文字。ほとんどのCAPTCHAのデフォルト
number 数字のみのCAPTCHA。imagesパラメータを介して最大9つの追加画像によるバッチ解決をサポート

前提条件

始める前に、以下があることを確認してください。

  1. n8nインスタンスセルフホストまたはn8n Cloud
  2. CapSolverアカウントこちらでサインアップし、APIキーを取得してください
  3. CapSolver n8nノード — n8nに公式ノードとしてすでに利用可能(インストール不要)

重要: CapSolverアカウントに十分な残高があることを確認してください。ImageToTextタスクは使用量に基づいてクレジットを消費します。


n8nでのCapSolverのセットアップ

CapSolverはn8nの公式統合として利用可能です — コミュニティノードのインストールは不要です。ワークフローを構築する際に、ノードパネルで直接見つけることができます。

公式統合であるため、CapSolverノードがアカウントで認証できるように、n8nでクレデンシャルを作成する必要があります。

ステップ1: クレデンシャルページを開く

n8nインスタンスに移動し、Settings -> Credentialsに移動します。ここに構成済みのすべてのクレデンシャルが表示されます。

CapSolverアカウントを表示するn8nクレデンシャルページ

ステップ2: CapSolverクレデンシャルを作成する

  1. Create credential(右上隅)をクリックします
  2. **「CapSolver」**を検索し、CapSolver APIを選択します
  3. APIキーを入力します — CapSolverダッシュボードから直接コピーします
  4. Allowed HTTP Request DomainsAll(デフォルト)のままにします
  5. Saveをクリックします

n8nは自動的に接続をテストします。APIキーが有効であることを確認する緑色の**「Connection tested successfully」**バナーが表示されます。

接続テストが成功したCapSolverクレデンシャル構成

重要: ワークフロー内のすべてのCapSolverノードはこのクレデンシャルを参照します。一度作成するだけで済みます — すべての解決ワークフローで同じクレデンシャルが共有されます。

これで、ImageToText解決ワークフローを構築する準備ができました!


CAPTCHA画像のBase64エンコーディングを理解する

ワークフローに入る前に、ImageToTextTaskのbase64要件を理解することが重要です。これは最も一般的なエラーの原因です。

CapSolverが期待するもの

bodyパラメータには、クリーンなbase64文字列 — 画像ファイルの生のエンコードされたバイトが含まれている必要があります。具体的には:

  • data:プレフィックスなしdata:image/png;base64,iVBORw0KGgo...がある場合、data:image/png;base64,部分を削除する必要があります
  • 改行文字なし — base64文字列は\n文字のない単一の連続した行である必要があります
  • 空白なし — スペース、タブ、その他の空白文字はありません

n8nでクリーンなBase64文字列を取得する方法

n8nのHTTP Requestノードで画像をフェッチすると、応答はバイナリデータとして届きます。CapSolver用にbase64に変換するには、Codeノードを使用します。

javascript Copy
// バイナリ画像データをクリーンなbase64に変換
const binaryData = $input.first().binary.data;
const base64String = binaryData.data; // n8nのバイナリ形式ではすでにbase64

// data:プレフィックスがあれば削除(安全チェック)
const cleanBase64 = base64String.replace(/^data:image\/\w+;base64,/, "");

// 改行文字を削除
const finalBase64 = cleanBase64.replace(/\n/g, "");

return [{ json: { body: finalBase64 } }];

一般的なエラー

エラー 結果
data:image/png;base64,...を送信 CapSolverがコンテンツを無効として拒否
Base64文字列に改行文字が含まれている CapSolverが画像をデコードできない
base64ではなく画像URLを送信 パラメータが間違っています — bodyはbase64を期待しており、URLではありません
空の文字列を送信 CapSolverがエラーを返す

ワークフロー1: ImageToText解決API

このワークフローは、base64 CAPTCHA画像を許容し、認識されたテキストを返すPOST APIエンドポイントを作成します。

仕組み

ワークフローは6つのノードで構成されています。

  1. Receive Solver Request — 画像データを含むPOSTリクエストを受信するWebhook
  2. Validate Image Inputbodyが存在し、有効なbase64であることをチェックするCodeノード
  3. Solve Image Captcha — Resource=Recognition, Operation=Image To Textを使用するCapSolverノード
  4. Image Captcha Error? — 解決が失敗したかどうかに基づいて分岐するIFノード
  5. Respond to Webhook — 成功時に認識されたテキストを返す
  6. Respond to Webhook Error — 失敗時にエラーメッセージを返す

ノード構成

1. Receive Solver Request (Webhook)

設定
HTTPメソッド POST
パス solver-image-to-text
レスポンス Response Node

これにより、https://your-n8n-instance.com/webhook/solver-image-to-textにエンドポイントが作成されます。

2. Validate Image Input (Code)

このノードは、リクエスト本文に有効なbodyパラメータが含まれていることを確認し、data:プレフィックスや偶発的な改行文字を削除します。

javascript Copy
const body = $input.first().json.body;

if (!body || !body.body) {
  return [{ json: { error: 'Missing required field: body (base64 encoded image)' } }];
}

let imageBase64 = String(body.body);

// data:プレフィックスが誤って含まれている場合は削除
imageBase64 = imageBase64.replace(/^data:image\/\w+;base64,/, '');

// 改行文字と空白を削除
imageBase64 = imageBase64.replace(/[\n\r\s]/g, '');

// 基本的なbase64検証
if (!/^[A-Za-z0-9+\/]+=*$/.test(imageBase64)) {
  return [{ json: { error: 'Invalid base64 encoding in body field' } }];
}

return [{
  json: {
    body: imageBase64,
    module: body.module || 'common'
  }
}];

3. Solve Image Captcha (CapSolver)

パラメータ 説明
リソース Recognition 認識リソースを選択(トークンではない)
操作 Image To Text ImageToTextTask操作
ボディ {{ $json.body }} クリーンなbase64画像文字列
モジュール {{ $json.module }} 認識モジュール(デフォルト: common

重要: CapSolverノードでは、まずResource = Recognitionを選択し、次にOperation = Image To Textを選択する必要があります。これはreCAPTCHAやTurnstileなどのトークン操作とは異なります。また、このノードでCapSolverクレデンシャルを選択してください。

4. Image Captcha Error? (IF)

設定
条件 ={{ $json.error }} が空ではない
Trueブランチ Error Respond to Webhookノードに移動
Falseブランチ Success Respond to Webhookノードに移動

CapSolverノードはエラー時に続行するため(onError: continueRegularOutput)、エラーはワークフローをクラッシュさせるのではなく、`{

コンプライアンス免責事項: このブログで提供される情報は、情報提供のみを目的としています。CapSolverは、すべての適用される法律および規制の遵守に努めています。CapSolverネットワークの不法、詐欺、または悪用の目的での使用は厳格に禁止され、調査されます。私たちのキャプチャ解決ソリューションは、公共データのクローリング中にキャプチャの問題を解決する際に100%のコンプライアンスを確保しながら、ユーザーエクスペリエンスを向上させます。私たちは、サービスの責任ある使用を奨励します。詳細については、サービス利用規約およびプライバシーポリシーをご覧ください。

もっと見る

CapSolver と n8n を使った reCAPTCHA v2/v3 の解決方法
CapSolver と n8n を使った reCAPTCHA v2/v3 の解決方法

CapSolverとn8nを使用してeCAPTCHA v2/v3ソルバーAPIを構築します。トークンの自動取得、ウェブサイトへの送信、保護されたデータの抽出をノーコードで自動化する方法を学びます。

n8n
Logo of CapSolver

Sora Fujimoto

22-Apr-2026

CapSolverを使用してn8nでGeeTest V3を解く方法:完全統合ガイド
CapSolverを使用してn8nでGeeTest V3を解く方法:完全統合ガイド

CapSolverをn8nと統合してGeeTest V3を解決し、信頼性の高い自動化ワークフローを構築する方法を学びましょう。

n8n
Logo of CapSolver

Sora Fujimoto

18-Mar-2026

CapSolverとn8nを使用してImageToTextを解決する方法
CapSolverとn8nを使用してImageToTextを解決する方法

画像からテキストへの変換、CAPTCHAソルバー、OCR CAPTCHA、CAPTSOVER、N8N、N8Nワークフロー、自動化、OCR API、CAPTCHA 自動化、Base64 画像、画像認識、AI OCR、Webhook、スケジュール済みワークフロー、フォーム自動化、CAPTCHAバイパス、セッション処理、プロキシなしCAPTCHA、インスタントOCR、テキスト認識

n8n
Logo of CapSolver

Lucas Mitchell

18-Mar-2026

CapSolverを使用してn8nでGeeTest V4を解く方法:完全統合ガイド
CapSolverを使用してn8nでGeeTest V4を解く方法:完全統合ガイド

CapSolverをn8nと統合してGeeTest V4を解決し、信頼性の高い自動化ワークフローを構築する方法を学びましょう。

n8n
Logo of CapSolver

Nikolai Smirnov

18-Mar-2026

sCapSolverとn8nの統合:CAPTCHAの解決とワークフローのオートメーション
n8nでのCapSolverの使い方: ワークフローでCAPTCHAを解くための完全なガイド

CapSolverをn8nと連携させてCAPTCHAを解き、信頼性のあるオートメーションワークフローを簡単に構築する方法を学びましょう。

n8n
Logo of CapSolver

Sora Fujimoto

18-Mar-2026

n8nにおけるTLSフィンガープリントの解決: CapSolverを使用して
n8nにおけるTLSファイアウォールの解決方法 CapSolverを用いて

n8nでCapSolverを使用してTLSフィンガープリントを解決。リクエストを本物のブラウザのように見せかけ、ボット検出のブロックを回避します。

n8n
Logo of CapSolver

Sora Fujimoto

18-Mar-2026