2012年07月07日

◆ PDF を HTML に変換する方法

 PDF を HTML に変換するには、どうすればいいか?
 (1) Gmail の添付ファイルにすればいい。
 (2) ネット上の変換サービスを使えばいい。

 Gmail を使う方法


 簡単な方法がある。それは、Gmail の添付ファイルにすることだ。次の手順で。
  ・ PDF をダウンロードする。
  ・ 添付ファイルにして、自分の Gmail 宛に送信する。
  ・ Gmail に届いたら、添付ファイルを HTML 形式で開く。

 
 これできれいに HTML 化される。
 ( ※ ただし HTML ソースの加工は困難であるようだ。かなり特殊な形式にしているので。)


 見本はこれ。
  → 政府事故調の中間報告 の一部(HTML)

  ※ 図が消えたりして、難点がある。
    レイアウトはかなり正確だ。

 Web上でやる方法

 
 ネット上の変換サービスを使う、という方法もある。

 (1)
 たとえば、次のサイトで変換できる。
  → http://www.pdfonline.com/pdf-to-word-converter/
 これは、比較的高速だが、正確さが劣る。レイアウトがかなり崩れることがある。

 (2)
 次のサイトでは、HTML でなく、Word ファイルに変換できる。
  → http://www.pdfonline.com/pdf-to-word-converter/
 こうして Word ファイルを得たら、それを Word 上で HTML に変換すればいい。
 結果的に、かなり満足のできる変換となる。(ページごとの区切りが消えるのも好ましい。)

 使ってみると、次の難点が見つかった。
  ・ やたらと時間がかかる。(特にファイルサイズが大きいとき)
  ・ ファイルサイズが大きいと、後半が省略される。

 それでも、正確な HTML 変換ができることは、好ましい。

  → サンプル (4MB)
  ※ このサンプルは zip 圧縮してある。(フォルダ)
    HTML ファイルと画像ファイルのセットなので。
    


 [ 付記 ]
 OpenOffice を使う、という案もあるが、これだと、PDF の全体が画像形式になってしまって、うまく行かないことが多い。
 特に、PDFの設定が「編集が不許可」になっていると、うまく行かないようだ。
posted by 管理人 at 09:47 | Comment(1) | コンピュータ_03 | 更新情報をチェックする
この記事へのコメント
後半を全面的に加筆しました。
Posted by 管理人 at 2012年07月07日 19:53
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

  ※ コメントが掲載されるまで、時間がかかることがあります。

過去ログ