Cloud OCR SDKでの画像処理はすべて以下の手順で行います。

  1. まだABBYY Cloud OCR SDKに登録していない場合は、こちらのリンクから登録してください。 登録すると、アプリケーションIDとアプリケーションパスワードを受け取ります。処理サーバーにリクエストを送信する際は、必ずこれらが必要になります。
  2. 処理メソッドを選んでください:文書を認識するには、processImageメソッドかsubmitImageとprocessDocumentメソッドを組み合わせて使います。前者のメソッドは、アップロードした画像を選択したパラメータに従って直接処理し始めます。後者のメソッドは、複数の画像からの文書を統合して認識結果を1つのファイルとして受け取ります。例としてprocessImageメソッドを使います。
  3. 選んだメソッドで必要なパラメータを指定します。 例えば、processImageメソッドでは、認識言語、適切な処理プロフィール、出力ファイルの形式、パスワード保護のかかった画像にアクセスするためのパスワード、タスクの説明を指定することができます。
  4. 認証情報と一緒にこれらのパラメータを選んだメソッドへ受け渡します。サーバーのアドレスはhttp://<PROCESSING_LOCATION_ID>.ocrsdk.comです。詳しくはデータ処理ロケーションをご覧ください。
    POST http://<PROCESSING_LOCATION_ID>.ocrsdk.com/processImage?language=english&exportformat=pdfSearchable
  5. レスポンスをで取得します。成功したレスポンスは次の形式になっています:レスポンスXMLからtaskIDを読み取ります。タスク要素の属性に含まれています。詳しくはHTTPステータスコードとレスポンス形式をご覧ください。
    <response>
        <task id="c3187247-7e81-4d12-8767-bc886c1ab878"
            registrationTime="2012-02-16T06:42:09Z"
            statusChangeTime="2012-02-16T06:42:09Z"
            status="Queued"
            filesCount="1"
            credits="0"
            estimatedProcessingTime="1"
            description="Image.JPG to .pdf" />
    </response>
  6. getTaskStatusメソッドのパラメータにtaskIDを設定して、ループ内のタスクステータスを監視します。 アプリケーションが複数のタスクを開始している場合は、listFinishedTasksメソッドを呼び出して、すでに処理されているタスクの情報を取得することをおすすめします。 1つのアクティブなタスクは、連続したQueued とInProgressステータスを持ちます。 タスクが処理されるまでは、タスク情報を取得します。 重要! タスクステータスが変わるのは2~3秒間に1度です。 そのため、頻繁にこれらのメソッドを呼び出すべきではありません。
  7. タスクが処理されると、XMLレスポンスにCompletedステータスと処理結果の参照が含まれます: 処理結果のURLを抽出します。 URLはタスク要素のresultUrl属性に含まれています。
  8. 認識結果をダウンロードします。このリクエストには承認ヘッダーを含めてはなりません。この手順の実装は、さまざまなプログラム言語やプラットフォームのコードサンプルで確認することができます。アプリケーションの正しいオペレーションを確認するには、のようなHTTPデバッガをご利用ください。