OCRエクスポート形式： Word (DOC)、Excel (XLS)、PDF、TXT

Open documentation menuClose documentation menu

ABBYY Cloud OCR SDKは、認識テキストを以下の形式で出力することができます：

形式	処理メソッドのexportFormatパラメータ	コメント
TXT	txt
RTF	rtf
DOCX	docx
XLSX	xlsx
PPTX	pptx
PDF	pdfSearchable	画像全体がピクチャーとして保存され、認識テキストがその下に入ります。
PDF	pdfTextAndImages	認識テキストはテキストとして保存され、ピクチャーは画像として埋め込まれます。
PDF/A-1b	pdfa	ファイルはPDF/A-1b準拠の形式で保存されます。画像全体がピクチャーとして保存され、認識テキストはその下に入ります。
XML	xml	すべての座標がオリジナル画像に基づいて保存されます。タグの説明は、XML文書の出力にてご確認ください。
XML	xmlForCorrectedImage	すべての座標は、ジオメトリー修正後の画像に基づいて保存されます。タグの説明は、XML文書の出力にてご確認ください。
ALTO	alto

processImage, processDocumentメソッドを使えば、これらの形式で認識テキストをエクスポートすることができます。また、これらのメソッドで、1つのタスクでエクスポート形式を最大3つまで指定することができます。追加料金は不要です。

さまざまなフィールド処理メソッドは、常に認識結果をXML形式で返します。そこには、認識した文字に関するさらに詳しい情報が含まれます。