PDFlib TET プラグイン
TET プラグイン は PDF ファイルから文字列を抜き出すための、無償の Acrobat 用プラグイン です。このプラグインは単体で動作するものですので、使用の際に TET は不要です。
TET プラグインは Acrobat のプラグインとして動作しますが、(TET の強力な機能を実感して頂くためのデモをかねるため)テキストの抽出の際には TET の持つ機能のみで動作しており、Acrobat 自体の機能は使っていません。TET は Acrobat の持つ文字列の抽出機能よりも高機能で多くの便利な機能がありますので、Acrobat の文字列のコピーや検索機能よりも便利に使用できます。
Acrobat では文字化けした文字列しか抽出できないような場合でも、PDFlib TET では正しく処理できる可能性が高いです。TET プラグインは以下の機能を提供しています。
- PDF ファイルの文字列をクリップボードかファイルに、テキスト、RTF, XML フォーマットでコピー。クリップボードへのコピー機能が拡張されることにより、コピー・ペーストによる作業が楽になります。
- PDF ファイルからブックマークをコピー
- XMP メタデータのコピー
- ファイル中の単語の検索
- テキスト抽出機能の詳細設定が可能。設定は保存することも可能です。
Acrobat のコピー機能よりも高機能な点
TET プラグインは以下の点において Acrobat よりも強力な機能を持ちます。
- 出力形式をカスタマイズできますので、出力後に変換する必要がありません。
- TET は多くの場合、Acrobat では文字化けしてしまうようなケースでも文字列を正しく解釈可能です。
- 未知のグリフ(適切な Unicode マップが無い場合等)は赤色で強調して表示されます。また、「?」など任意の文字で置換することが可能です。
- TET は Acrobat よりも高速に PDF ファイルを処理できます。
パッケージのダウンロード
- TET プラグイン ダウンロード
- Windows用のTET プラグインは、Acrobat X/XI/DC の Standard/Pro で、OS X/macOS用のTET プラグインは、Acrobat X/XI/DC の Pro/Professional で動作します。