pCOS インターフェース
pCOS インターフェースを使うことにより、PDF ファイルのメタデータ、リンクやフォームといったインタラクティブな要素、ページの大きさなどの情報を取得することができます。 低レベルのプログラミングを行わずに、ページ内に無いオブジェクトを含む全てのオブジェクトに簡単なインターフェースでアクセスできます。
pCOS インターフェースの機能
pCOS インターフェースは PDF ファイルの色々な情報を取得できます。下記はその代表的なものです。
- 一般的な情報:リニアライズ PDF, タグ付き PDF, 暗号化および文書保護の設定、ページ数、フォント
- 文書の「情報」および XMP メタデータ
- 全フォントの、名前やフォント埋め込みの状態など
- URL
- 全てのブックマークを抜き出してページ番号と共に目次を作成
- フォームフィールドデータ:フィールド名、内容、位置など
- ページのサイズ、矩形、傾き
- PDF/X 準拠ファイルのステータス
- 添付ファイルの抜き出しとリスト
- レイヤ名
- 注釈の詳細
- コメントのリストと校正者の名前
- 電子署名の詳細:署名フィールドの名前、署名者名、日付、署名理由
- PDF/X や PDF/A ファイルからの ICC 出力インテントのプロファイルの抽出
- PDFlib ブロック のプロパティのリスト
- 文書中の JavaScript, ページ、注釈、フィールドのレベルの検出
詳細は pCOS データシート をご参照ください。
使用例
- PDF ファイルが事前に定義した基準に準拠するかどうかのチェック
- 多数の PDF ファイル中から問題のあるファイルを探す
- PDF ファイルの管理のためにプロパティのサマリーを作成
- PDF ファイルの公開前の品質チェック
- 文書の検索や保存などのワークフロー
- PDF データ構造の詳細の学習用
サポートしている PDF ファイル
- Acrobat DC までの全バージョンの PDF (ISO 32000 を含む)
- RC4 や AES で暗号化されたPDF(取得する内容によってはパスワードが必要となります)
- (可能な限り) 壊れた PDF を修復
出力フォーマット
pCOS インターフェースは実行結果を下記のフォーマットで出力することができます。
- プレーンテキスト
- タブ区切り
- ユーザ定義の書式
- ICC プロファイルや添付ファイルなどのバイナリーファイルの抽出
- Unicode テキスト(UTF-8 や UTF-16)
pCOS インターフェースは複数の PDF ファイルを一度に処理できるため、文書の「情報」、ページの書式、フォントやその他のプロパティのサマリーを容易に作成できます。タブ区切りの出力などと組み合わせ、pCOS インターフェースは強力な PDF 管理ツールとして利用できます。
コマンドラインツールとライブラリ
pCOS インターフェースは多くの環境に対応したプログラミングライブラリが提供されており、また、PLOP、PLOP DS ではバッチ処理用のコマンドラインツールも用意されています。ライブラリ版、コマンドラインツール版のどちらも、pCOS の全ての機能がサポートされています。
- コマンドラインツール版は PDF ファイルのバッチ処理に適しています。プログラムを作成する必要がなく、便利なオプションにより色々な処理に利用できます。
- ライブラリ版はお使いのプログラムから自由に呼び出すことができます。
ライブラリ版に特有の機能
- C, C++, COM, .NET, Java 用の言語バインディング
- (C 言語版のみ)PDF ファイルをメモリから直接読み込めます
- プログラムのサンプルが含まれています
コマンドラインツール版に特有の機能
- より複雑なオブジェクトの抽出や出力フォーマットのカスタマイズ
- 取得した情報を CSV やユーザ定義の書式で出力
- 辞書や配列などのような複合オブジェクトの再帰処理
pCOS パス:PDF オブジェクトのシンプルな構文での表現
pCOS インターフェースは PDF ファイル中の任意のオブジェクトを指す、シンプルな構文をサポートしています。pCOS の構文は PDF オブジェクトの構造に非常に良く似たものになっていますが、ページ、フォント、ブックマーク、フォームフィールドなど、良く使われるオブジェクトにアクセスするための便利なショートカットが用意されています。
複雑なツリー構造(ブックマークやフォームフィールド等)のかわりに、pCOS 仮想オブジェクトを利用することで簡単にアクセスできるようになります。一般的な PDF オブジェクト用の pCOS パスは pCOS のドキュメントに記載されています。
ライブラリを使うには pCOS パスが必要ですが、コマンドラインツールでもサポートされています。
pCOS インターフェースの試用
pCOS インターフェースは、以下の PDFlib 製品に内蔵されています。
- PDFlib+PDI
- PDFlib PPS
- PDFlib TET
- PDFlib PLOP
- PDFlib PLOP DS
- TET PDF IFilter
※PLOP、PLOP DS では pCOS コマンドラインツールを使用することができます。
上記の各製品に内蔵されているコマンドラインツールおよびライブラリは、ライセンスキーを設定しない状態でも全ての機能を利用することができますが、10ページ、1MBまでのPDFファイルのみ扱うことができます。ライセンスキーを設定していない状態の pCOS は評価のためにのみご使用いただけます。ライセンスキーを設定することでこれらの制限は無くなり、正規版としてご使用いただくことが可能となります。