1. ホーム
  2. 製品
  3. PDFlib pCOS
Product

PDFlib pCOS

PDFlib pCOS を使うことにより、PDF ファイルのメタデータ、リンクやフォームといったインタラクティブな要素、ページの大きさなどの情報を取得することができます。 低レベルのプログラミングを行わずに、ページ内に無いオブジェクトを含む全てのオブジェクトに簡単なインターフェースでアクセスできます。

PDFlib pCOS の機能

PDFlib pCOS は PDF ファイルの色々な情報を取得できます。下記はその代表的なものです。

  • 一般的な情報:リニアライズ PDF, タグ付き PDF, 暗号化および文書保護の設定、ページ数、フォント
  • 文書の「情報」および XMP メタデータ
  • 全フォントの、名前やフォント埋め込みの状態など
  • URL
  • 全てのブックマークを抜き出してページ番号と共に目次を作成
  • フォームフィールドデータ:フィールド名、内容、位置など
  • ページのサイズ、矩形、傾き
  • PDF/X 準拠ファイルのステータス
  • 添付ファイルの抜き出しとリスト
  • レイヤ名
  • 注釈の詳細
  • コメントのリストと校正者の名前
  • 電子署名の詳細:署名フィールドの名前、署名者名、日付、署名理由
  • PDF/X や PDF/A ファイルからの ICC 出力インテントのプロファイルの抽出
  • PDFlib ブロック のプロパティのリスト
  • 文書中の JavaScript, ページ、注釈、フィールドのレベルの検出

PDFlib pCOS 4の新機能

pCOS 4では、バグフィックスのほか、以下の機能強化を施しました。

  • PDFの情報を読み出すための新機能
    • ページ内あるいは注釈の中に透明オブジェクトがあるページを識別する機能
    • 暗号化された添付ファイルを識別
    • PDF/A, PDF/E, PDF/UA, PDF/X, そしてPDF/VTの全ての特性を識別する機能
  • 汎用のUnicode文字列に変換するメソッドを搭載 pCOS_convert_to_unicode()
  • 対応する開発言語バインディングを部分的に更新
    • Perl 5.8 - 5.18
    • PHP 5.3, 5.4, 5.5
    • Python 2.6, 2.7, 3.2, 3.3 のオブジェクト指向インターフェース
  • いくつかの規格に適合しないPDF構造の受容
  • 破損したPDFドキュメントの修復機能を強化

使用例

  • PDF ファイルが事前に定義した基準に準拠するかどうかのチェック
  • 多数の PDF ファイル中から問題のあるファイルを探す
  • PDF ファイルの管理のためにプロパティのサマリーを作成
  • PDF ファイルの公開前の品質チェック
  • 文書の検索や保存などのワークフロー
  • PDF データ構造の詳細の学習用

サポートしている PDF ファイル

  • Acrobat XI までの全バージョンの PDF(ISO 32000 を含む)
  • RC4やAESで暗号化されたPDF(取得する内容によってはパスワードが必要となります)
  • (可能な限り)壊れたPDFを修復

出力フォーマット

PDFlib pCOS は実行結果を下記のフォーマットで出力することができます。

  • プレーンテキスト
  • タブ区切り
  • ユーザ定義の書式
  • ICC プロファイルや添付ファイルなどのバイナリーファイルの抽出
  • Unicode テキスト(UTF-8 や UTF-16)

PDFlib pCOS は複数の PDF ファイルを一度に処理できるため、文書の「情報」、ページの書式、フォントやその他のプロパティのサマリーを容易に作成できます。タブ区切りの出力などと組み合わせ、PDFlib pCOS は強力な PDF 管理ツールとして利用できます。

コマンドラインツールとライブラリ

PDFlib pCOS は多くの環境に対応したプログラミングライブラリが提供されており、またバッチ処理用のコマンドラインツールも用意されています。ライブラリ版、コマンドラインツール版のどちらも、pCOS の全ての機能がサポートされています。

  • コマンドラインツール版は PDF ファイルのバッチ処理に適しています。プログラムを作成する必要がなく、便利なオプションにより色々な処理に利用できます。
  • ライブラリ版はお使いのプログラムから自由に呼び出すことができます。

ライブラリ版に特有の機能

  • C, C++, COM, .NET, Java 用の言語バインディング
  • (C 言語版のみ)PDF ファイルをメモリから直接読み込めます
  • プログラムのサンプルが含まれています

コマンドラインツール版に特有の機能

  • より複雑なオブジェクトの抽出や出力フォーマットのカスタマイズ
  • 取得した情報を CSV やユーザ定義の書式で出力
  • 辞書や配列などのような複合オブジェクトの再帰処理

pCOS パス:PDF オブジェクトのシンプルな構文での表現

PDFlib pCOS は PDF ファイル中の任意のオブジェクトを指す、シンプルな構文をサポートしています。pCOS の構文は PDF オブジェクトの構造に非常に良く似たものになっていますが、ページ、フォント、ブックマーク、フォームフィールドなど、良く使われるオブジェクトにアクセスするための便利なショートカットが用意されています。

複雑なツリー構造(ブックマークやフォームフィールド等)のかわりに、pCOS 仮想オブジェクトを利用することで簡単にアクセスできるようになります。一般的な PDF オブジェクト用の pCOS パスは pCOS のドキュメントに記載されています。

ライブラリを使うには pCOS パスが必要ですが、コマンドラインツールでもサポートされています。

pCOS の試用

pCOS に同梱されているコマンドラインツールおよびライブラリはライセンスキーを設定しない状態でも全ての機能を利用することができますが、10ページ、1MBまでのPDFファイルのみ扱うことができます。ライセンスキーを設定していない状態の pCOS は評価のためのみにご使用いただけます。ライセンスキーを設定することでこれらの制限は無くなり、 正規版としてご使用いただくことが可能となります。

pCOS パッケージのダウンロード

 pCOS アーカイブファイル ダウンロード
  -  お使いのOSと開発言語に対応するアーカイブファイルをダウンロードしてご利用ください。

 pCOS マニュアル
  -  マニュアル(英語版)とパスリファレンス(日本語版)がございます。