スポンサードリンク

例えば、フリー版で制限された機能であるページの抽出を選択してみます。
056ce337.png

すると、

WS000000.JPG

フリー版でもできるんだーと思いきや、

WS000001.JPG

注意されますが、できそうですね~。

49e70c70.jpeg

できました!。 でっかいマークが付きました…。

これを防ぐには、$37.5(一年)~ですよ。

ダウンロード: PDF Xchange Viewer (無料版)
アップグレードするには: http://www.tracker-software.com/buy-now

Amazonで PDF 関連のおすすめ商品を探す(有償ソフト)

Xchange01


フリーソフトでも強力な編集機能を備えたビューア

NEW!!
>>PDF-XChange Viewer(強力な編集機能を備えたPDFビューア)【インストール・ダウンロード編】へ

PDF Xchange Viewer
PDF Xchange Viewer スクリーンショット
PDF Xchange Viewer
「ドキュメント」メニュー

このソフトもFoxit J-Readerと同様、ビューアーとはいいながらも、ミニ・アクロバットととでも言いたいぐらい編集機能が豊富です。

テキスト書き込み・注釈・図形挿入・付箋紙貼付け・文字の装飾・フォントの変更など、ほぼあらゆる編集が可能。セキュリティも最新のアクロバット9(暗号化256bit AES)レベルを適用可能です。

このソフトでの上位版であるPDF Xchange ViewerPROとの違いはページの追加・削除位であり、そこは他のフリーソフトでカバーできる点だろうし、これはお得な一本です。

なお、新規作成するドキュメントには、”DEMO!”のウォータマークが入ります。(PDF Xchange Viewer PROとの違い)これを防ぐには有料版($37.5~)をということです。

しおり(ブックマーク)も追加・編集できます。ウォーターマークなしで。【画像

PDF Xchange viewerでしおりを追加
該当ページを表示させた状態で、ブックマーク(Ctrl + B)の”新規作成”をクリックしテキストを編集する。ドラッグして入れ替えも可能。

もちろん、ビューアとしてもタブブライズ機能で複数のPDFを快適に閲覧可能です。

OCR機能が追加されました!

フリーソフトでOCR機能付とは画期的ですね。日本語の認識率は…です(:_;)。英語ではいいのかもしれません。

私がテストしてみた様子はコチラ↓

OCR 精度の比較 無料版と有料(製品)版

64Bit 版のウィンドウズにも対応しています。

ダウンロード: PDF Xchange Viewer
>>PDF-XChange Viewer(強力な編集機能を備えたPDFビューア)【インストール・ダウンロード編】へ

Amazonで PDF 関連のおすすめ商品を探す(有償ソフト)

Amazonで PDF 関連のおすすめ商品を探す(有償ソフト)

JUST PDF 2 [作成・編集・データ変換] 通常版 DL版 [ダウンロード]
JUST PDF 2 [作成・編集・データ変換] 通常版 DL版 [ダウンロード]




フリーソフトのPDF XChange Viewer(無料版)のOCR機能と、有料製品の読んde!!ココ Ver.13(エプソン)のOCR機能を比較してみました。

FUJITSU ScanSnap S1500
のデフォルト設定でPDF化した少し古い本(元サイズB5版位)の1ページです。

まずは、PDF Xchange Viewer(無料版)のOCR機能を使ってテキスト情報を抽出します。

004D1B92.png
Xchange viewerのOCR設定の様子

やり方は、ツールバーのOCRボタンを押して出てきたダイアログボックスでページ指定と、Primary Language をJapaneseに変更してOKを。

ちょっと読めませんね。
Xchange viewer でのOCR結果

メニューの、ツール(T)→基本ツール→選択ツール(L)でカーソルが手袋から矢印に変わったら文章上でドラッグすると選択状態になります。
テキスト選択後コピーして、メモ帳に貼り付けたものがこちら。

だいぶがんばっているようですが、すんなりとは読めませんね。

これが「透明テキスト」の中身なのですが、この認識レベルだと、後で特定の文字列を全文検索などしても引っかかりそうにありません。何しろ元ファイルがこれだけ崩れていては。

そして、読んでココ(正しくは、読んde!!ココ)。

このソフトは、昔に購入したEPSONフラットヘッドスキャナにバンドル(付属)していたパーソナル版からアップグレード購入(読んde!!ココ Ver.13 アップグレード版 for ダウンロード [ダウンロード])したものです。

00070076.png
読んでココでPDFを読みこむ

読んでココを立ちあげて、メニューの、ファイル(F)→PDFファイルから取り込む→ファイル名指定→ページ番号指定後、このような画面になるので、

OCR認識結果のテキスト
OCR認識結果

ここでクリップボードに転送を押すと、認識結果のテキスト情報がコピーされるので、これもまた、メモ帳に貼り付けました。

d873b4ab.png
読み取ったPDFと両者のOCR結果比較

コチラは前と違ってほぼ完全に認識されていてストレスなく読むことができます。
並べて比較してみました。

まとめ

国産有料ソフトでは、ここまで完全に認識されるなら、文章だけの小説本などはPDFファイルのままで閲覧するよりも、少しだけ手間はかかりますが、OCR→テキストファイル化することによって文字サイズやフォントの変更が出来るようになるので、他のソフトや電子ブックリーダーやスマートフォン等にに送った時に格段に読みやすくなると思います。
読んde!!ココ Ver.13 ダウンロード版 [ダウンロード]
読んde!!ココ Ver.13 ダウンロード版 [ダウンロード]


Amazonで PDF 関連のおすすめ商品を探す(有償ソフト)

国産フリーソフトではめぼしいものはありません。

英語版だとこのようなもの(Free PDF to Word Doc Converter)もありますが、日本語が文字化けしてしまいます。
有料ソフトでは、本家のAdobe Acrobatや、おすすめの瞬簡PDF 変換 7 (旧名称リッチテキストPDF)(アンテナハウス)、売上No.1のいきなりPDF(ソースネクスト)ほかいろいろあります。
無料で使えそうなものなら、オンラインサービスですが、PDF to Word ・PDF to Excelが良さそうです。

  PDFをオフィス形式ファイル(doc、xls、rtf など)に逆変換する場合、元のPDFが主にテキスト主体ならほぼ上手くいきますが(元のPDFとそっくりなdoc(など)に変換される)、テキストと画像が複雑に入り混じったPDFや、文字の大きさ・色がさまざまなPDF、段組や表が複雑に使用されているPDFの場合、変換しても、段組が大きく崩れたり、テキストが文字化け風に変換されてしまったりする事もあり、なかなか一筋縄では行きません。
PDFをオフィス用ファイル に逆変換したいということは、文書の内容を再利用・編集したいからだと思うのですが、PDFには大雑把に言うと
  • テキスト情報(+線画・画像)主体のPDF (ワードなどから作成したもの)
  • 画像系のPDF (写真・イメージ・スキャナから取り込んでテキスト情報の無いもの)
があります。一見同じPDFに見えますが、文字を編集する場合以下のような違いあります。
テキスト主体(+画像)系のPDF

ワードなどから作成したPDFはテキストデータが含まれているので、テキストファイル(txt)には容易に変換できますし、MSオフィス形式ファイルなどに変換する場合も、段組を再現するとき多少崩れることはありますが、だいたい元のPDFと似たような感じに変換されます。
ただし、フリーソフトではめぼしいものは有りません。有料ではいろいろ良さそうなものがあります。全て試したわけではありませんが、値段相応と思われます。

画像系のPDF

画像系のPDFは一度、画像から文字情報を認識しなければなりません。

 それがOCR (Optical Character Reader【光学式文字読取】)で、そのソフト(の日本語用)は開発に相当なコストがかかるためか、フリーソフトでは現在ありません ほとんどありません。
フリーソフトのPDF XChange Viewer(無料版)はOCR機能がありますが、日本語に使用した場合、認識率が悪く実用には難があります。【参考リンク:OCR 精度の比較 無料版と有料(製品)版

 

 PDFに含まれる画像(図表・線画)を取り出すだけで、あとで自分でワード等に貼付けて再利用したいなら、PDF Explorerなどのフリーソフトで取り出すことができますし、画面をキャプチャするソフトで強引に切り出すという方法もあります。

OCR ソフトは、商用では『読んde!!ココ』や、『読取革命』など、数種類、一万円前後まででもありますし、スキャナを買うと簡易版が付属してくることもあります。それらのソフトではワード・エクセルへの変換も、まず満足できるレベルで可能です。

ちょっと古いですが、コチラなども参考にしてみてください。
PC Online【記事】: PDFをOffice文書に逆変換

Amazonで PDF 関連のおすすめ商品を探す(有償ソフト)