エクスポート形式
ABBYY Cloud OCR SDKは、認識テキストを以下の形式で出力することができます:
形式 | 処理メソッドのexportFormatパラメータ | コメント |
---|---|---|
TXT | txt | |
RTF | rtf | |
DOCX | docx | |
XLSX | xlsx | |
PPTX | pptx | |
pdfSearchable | 画像全体がピクチャーとして保存され、認識テキストがその下に入ります。 | |
pdfTextAndImages | 認識テキストはテキストとして保存され、ピクチャーは画像として埋め込まれます。 | |
PDF/A-1b | pdfa | ファイルはPDF/A-1b準拠の形式で保存されます。画像全体がピクチャーとして保存され、認識テキストはその下に入ります。 |
XML | xml |
すべての座標がオリジナル画像に基づいて保存されます。 タグの説明は、XML文書の出力にてご確認ください。 |
xmlForCorrectedImage |
すべての座標は、ジオメトリー修正後の画像に基づいて保存されます。 タグの説明は、XML文書の出力にてご確認ください。 |
|
ALTO | alto |
processImage, processDocumentメソッドを使えば、これらの形式で認識テキストをエクスポートすることができます。また、これらのメソッドで、1つのタスクでエクスポート形式を最大3つまで指定することができます。追加料金は不要です。
さまざまなフィールド処理メソッドは、常に認識結果をXML形式で返します。そこには、認識した文字に関するさらに詳しい情報が含まれます。