(1) Gmail の添付ファイルにすればいい。
(2) ネット上の変換サービスを使えばいい。
Gmail を使う方法
簡単な方法がある。それは、Gmail の添付ファイルにすることだ。次の手順で。
・ PDF をダウンロードする。
・ 添付ファイルにして、自分の Gmail 宛に送信する。
・ Gmail に届いたら、添付ファイルを HTML 形式で開く。
これできれいに HTML 化される。
( ※ ただし HTML ソースの加工は困難であるようだ。かなり特殊な形式にしているので。)
見本はこれ。
→ 政府事故調の中間報告 の一部(HTML)
※ 図が消えたりして、難点がある。
レイアウトはかなり正確だ。
Web上でやる方法
ネット上の変換サービスを使う、という方法もある。
(1)
たとえば、次のサイトで変換できる。
→ http://www.pdfonline.com/pdf-to-word-converter/
これは、比較的高速だが、正確さが劣る。レイアウトがかなり崩れることがある。
(2)
次のサイトでは、HTML でなく、Word ファイルに変換できる。
→ http://www.pdfonline.com/pdf-to-word-converter/
こうして Word ファイルを得たら、それを Word 上で HTML に変換すればいい。
結果的に、かなり満足のできる変換となる。(ページごとの区切りが消えるのも好ましい。)
使ってみると、次の難点が見つかった。
・ やたらと時間がかかる。(特にファイルサイズが大きいとき)
・ ファイルサイズが大きいと、後半が省略される。
それでも、正確な HTML 変換ができることは、好ましい。
→ サンプル (4MB)
※ このサンプルは zip 圧縮してある。(フォルダ)
HTML ファイルと画像ファイルのセットなので。
[ 付記 ]
OpenOffice を使う、という案もあるが、これだと、PDF の全体が画像形式になってしまって、うまく行かないことが多い。
特に、PDFの設定が「編集が不許可」になっていると、うまく行かないようだ。
