pCOS インターフェース
pCOS インターフェースを使うことにより、PDF ファイルのメタデータ、リンクやフォームといったインタラクティブな要素、ページの大きさなどの情報を取得することができます。 低レベルのプログラミングを行わずに、ページ内に無いオブジェクトを含む全てのオブジェクトに簡単なインターフェースでアクセスできます。
pCOS インターフェースの機能
pCOS インターフェースは PDF ファイルの色々な情報を取得できます。下記はその代表的なものです。
- 一般的な情報:リニアライズ PDF, タグ付き PDF, 暗号化および文書保護の設定、ページ数、フォント
- 文書の「情報」および XMP メタデータ
- 全フォントの、名前やフォント埋め込みの状態など
- URL
- 全てのブックマークを抜き出してページ番号と共に目次を作成
- フォームフィールドデータ:フィールド名、内容、位置など
- ページのサイズ、矩形、傾き
- PDF/X 準拠ファイルのステータス
- 添付ファイルの抜き出しとリスト
- レイヤ名
- 注釈の詳細
- コメントのリストと校正者の名前
- 電子署名の詳細:署名フィールドの名前、署名者名、日付、署名理由
- PDF/X や PDF/A ファイルからの ICC 出力インテントのプロファイルの抽出
- PDFlib ブロック のプロパティのリスト
- 文書中の JavaScript, ページ、注釈、フィールドのレベルの検出
詳細は pCOS データシート をご参照ください。
使用例
- PDF ファイルが事前に定義した基準に準拠するかどうかのチェック
- 多数の PDF ファイル中から問題のあるファイルを探す
- PDF ファイルの管理のためにプロパティのサマリーを作成
- PDF ファイルの公開前の品質チェック
- 文書の検索や保存などのワークフロー
- PDF データ構造の詳細の学習用
サポートしている PDF ファイル
- Acrobat DC までの全バージョンの PDF (ISO 32000 を含む)
- RC4 や AES で暗号化されたPDF(取得する内容によってはパスワードが必要となります)
- (可能な限り) 壊れた PDF を修復
出力フォーマット
pCOS インターフェースは実行結果を下記のフォーマットで出力することができます。
- プレーンテキスト
- タブ区切り
- ユーザ定義の書式
- ICC プロファイルや添付ファイルなどのバイナリーファイルの抽出
- Unicode テキスト(UTF-8 や UTF-16)
pCOS インターフェースは複数の PDF ファイルを一度に処理できるため、文書の「情報」、ページの書式、フォントやその他のプロパティのサマリーを容易に作成できます。タブ区切りの出力などと組み合わせ、pCOS インターフェースは強力な PDF 管理ツールとして利用できます。
ライブラリ
pCOS インターフェースは多くの環境のプログラム言語向けにライブラリが提供されています。
- C, C++, COM, .NET, Java 等の各種言語バインディング
- プログラムのサンプルが同梱されています
pCOS パス:PDF オブジェクトのシンプルな構文での表現
pCOS インターフェースは PDF ファイル中の任意のオブジェクトを指す、シンプルな構文をサポートしています。pCOS の構文は PDF オブジェクトの構造に非常に良く似たものになっていますが、ページ、フォント、ブックマーク、フォームフィールドなど、良く使われるオブジェクトにアクセスするための便利なショートカットが用意されています。
複雑なツリー構造(ブックマークやフォームフィールド等)のかわりに、pCOS 仮想オブジェクトを利用することで簡単にアクセスできるようになります。一般的な PDF オブジェクト用の pCOS パスは pCOS のドキュメントに記載されています。
pCOS インターフェースの試用
pCOS インターフェースは、以下の PDFlib 製品に内蔵されています。
- PDFlib+PDI
- PDFlib PPS
- PDFlib TET
上記の各製品はライセンスキーを設定しない状態でも全ての機能を利用することができますが、10ページ、1MBまでのPDFファイルのみ扱うことができます。ライセンスキーを設定していない状態の pCOS は評価のためにのみご使用いただけます。ライセンスキーを設定することでこれらの制限は無くなり、製品版としてご使用いただくことが可能となります。