2012年05月02日

◆ Web情報をWebに保存(無料)

 Web上にある情報を( HDD でなく)Webに保存する方法がある。
 いちいちストレージに保存しなくても、ネット上に安全に保存できる。無料。 ──
 
 自分で作成したデータを安全にバックアップするなら、ストレージがいい。( Dropbox など)
  → ストレージサービス いろいろ

 一方、Web上にあるページを安全にバックアップしたいことがある。バックアップという意味はなくても、ページを一括して保存しておくと、あとで一括して検索することができるので、便利だ。これは、仕事に役立つ資料を集めるときに、使う方法だ。
 ただ、こういう保存は容量が多くなりがちだ。ストレージサービスには容量の制限がある(無償だと5GBぐらいのことが多い)ので、ストレージサービスに入れるのはためらわれる。
 もっとうまい方法はないか? ある。それを説明しよう。

 ──

 設定は後述するとして、この方法を導入したあとと、次のように利用する。
  ・ ネット上で保存したいページを見つける。
  ・ そのページを開いたまま、ブラウザの一箇所をクリックする

 これで保存は完了だ。つまり、クリック一発で済む。  (^^)v

 あとで検索したいときは、次のようにする。
  ・ 保存先のページをブラウザで開く。
  ・ 開きたいページについて検索語で検索する。

 これで見つかる。つまり、検索一発で済む。  (^^)v
 ※ 目次の一覧もある。新しい順に並んでいるので、保存したばかりのページ
   ならば、タイトルを見て、そのタイトルをクリックするだけでいい。
   その場合には、検索すらも必要ない。
 
 ──
 
 この方法が優れているのは、次の点だ。
  ・ タイトルだけでなく全文が検索対象となる。
   ( Evernote などでは、ファイル名と設定タグだけが検索対象。)
         ※ Evernote は全文検索が可能とのことです。修正しました。

  ・ 全文検索のインデックスがあるので、全文が瞬時に検索される。
   (パソコン上でやる Grep みたいに長い時間がかからない。)


 ただし、この方法にも、少しだけ弱点がある。

 第1に、HTMLファイルやテキストファイルが対象であり、PDFファイルは対象とならない。PDF ファイルは、いったん HTML 形式に変換して登録する必要がある。ただし、HTML 変換は、Google が自動的にやってくれるから、そのための手間が少しかかるだけだ。(後述)
 なお、PDF について、全文検索を必要とせず、タイトルだけが検索対象となればいいのであれば、PDF をそのまま登録するだけでいい。特に手間はかからない。

 第2に、容量の限界がある。アカウント1つにつき、10ギガバイトだ。容量が 10ギガバイトに近づいたら、別のアカウントを取得して、新たに別のところに保存する必要がある。……とはいえ、10ギガバイトもあれば、普通は十分だろう。
 また、この 10ギガバイトという容量は、毎年少しずつアップしていくらしい。数年前は2ギガバイトだったのが、今では 10ギガバイトに増えている。5年後には 20ギガバイトになっているかもしれない。

 ────────────

 では、いよいよ、そのサービスの導入法を示そう。

 このサービスは、特に難しいサービスではない。実を言うと、他の名前で提供されているサービスだ。そいつを「 Webページ保存のため」というふうに、本来の目的外で利用するだけだ。
 そのサービスは、これだ。
  → あとで読む

 このサービスの内容は、次の通り。
 「 Web ページを HTML メールにして、ユーザーのメールアドレスに送る」


 これは、次のことが本来の目的である。
 「Web ページをいったん保存して、あとで好きなときに、メールソフトを使って読む」


 ともあれ、ここでは「Web ページを保存する」という作業がなされている。
 さらに、これに加えて、次のサービスを導入する。
 「 HTML メールをネット上に保存する」


 これは Gmail (など)で提供されている機能だ。そこで、上記の二つのサービスを併用することで、次の二点がなされる。
  ・ Web ページを HTML メールにする
  ・ HTML メールを Web 上に保存する
 両者をまとめると、次のようになる。
 「 Web ページを Web 上に保存する (HTML メールの形で)」


 このとき、メールサービス( Gmail )の機能に従って、次の機能や条件が付く。
  ・ 全文検索が可能である。(即時)
  ・ 容量は 10ギガバイトである。(今後も増えていく。)


 ただし、Gmail には、アカウントの取得が制限されているという難点がある。また、Gmail を保存先にすると、普通のメールとごちゃ混ぜになって不都合だ、という難点も生じる。
 この問題を避けるには、次のようにする。
 「 livedoor メールか、au one メールを使う」

 この二つのメールサービスは、Gmail と同じものである。機能は少し制限されているが、実質的には Gmail とほとんど変わらない。しかも、アカウントを容易に取得できる。複数アカウントも可だ。
 また、ログインが面倒なら、自動ログインをする LastPass を使えばいい。

 ──

 利用するためにする設定は、次の通り。
  ・ メールアカウントを取得する ( livedoor か au one )
  ・ 「あとで読む」のサイトで、メールアドレスを入力する
  ・ ブックマークするボタンを、ブックマークツールバーに置くか、
   メニューの「ブックマーク」( or 「お気に入り」)に登録する


 設定が済んだら、あとはクリック一発で、Web ページを保存できる。
 あとで検索したいときは、メールサービスのサイトを開いて、検索語を入力するだけだ。(複雑な条件検索も可能。 → その方法
 


[ 付記1 ]
 PDF ファイルは、そのままでは、リンクとタイトルが保存されるだけだ。
 全文検索の対象とするためには、いったん HTML 変換する必要がある。
 それには、次の手続きを取る。
  ・ その文書を(タイトルなどの検索語で)ググる
  ・ Google の検索結果に文書名が表示されたら、「クイックビュー」をクリック
  ・ HTML 変換されたページが表示されるので、前記の Web 保存を実行する。

 かくて PDF ファイルが HTML ファイルに変換され、全文検索の対象となる。
 ( ※ ただしファイルサイズは大きめになるので注意。)
 ( ※ ファイルサイズを減らしたいのであれば、PDF をテキスト形式に変換して
     から、それをメールアドレスに送ればいい。手動なので、手間がかかる。)
 
 なお、PDFファイルの実例を知りたければ、これ。
  → PDF ファイルの検索例
 ここの一番上に、「クイックビュー」という文字が見える。そこをクリックして開いたら、そのウェブページを保存すればいい。(先の手順で) → こうすれば、PDF ファイルを保存したのと同じ結果になる。あとで全文検索も可能。(確認済み)

  ※ Evernote では PDF も全文検索が可能とのことです。


 《 補足 》
 なお、クイックビューのページでは、「Google ドキュメントに保存」という項目が見えるから、ここで保存しておいてもいい。保存すると、Google Drive にも自動保存される。( Google Drive に加入していた場合。)
 そうすると何が便利かというと、あまりアイデアは思い浮かばないが、「PDFだけを検索する」というときに便利かもしれない。たとえば、「どこかのPDFファイルにあの話があったんだけど、どのPDFファイルだったかな」というとき。検索語が思い浮かばないまま、タイトルの一覧だけを次々と見ていく、……というような使い方。
  
 [ 付記2 ]
 複数のアカウントを使うこともできる。次のように。
  ・ 複数のメールアカウントを使って、複数の設定をする。
  ・ それぞれを別々のブラウザに登録する。
  ・ 保存するときは、分野別に、どれかに保存する。
    例。専門分野については、アカウント1で保存する。
      それ以外については、アカウント2で保存する。
      あとで検索するときは、どちらか一方で検索する。

 この方法だと、「容量が倍になる」というメリットがあるが、「ブラウザを使い分けないといけない」というデメリットもある。一長一短。私は? やりません。ものぐさなので。(そもそも、専門分野以外では、保存の必要を感じない。)
 
 [ 付記3 ]
 この方法を覚えておけば、もはや「 HDD に資料を保存する」という面倒は、やらないで済むようになる。
  ・ HDD に資料を保存するのは、フォルダを指定する作業が面倒だ。
   (本項の方法ならば、クリック一発で済む。)
  ・ HDD に資料を保存するのは、あとで検索するのが面倒だ。
   (本項の方法ならば、検索一発で済む。)
  ・ HDD に資料を保存するのは、データが消失する恐れがある。
   (本項の方法ならば、自動的に安全に保存される。)

 いいことずくめ。クラウド流に資料を保存するのは、自作データだけでない。ネットで集めた情報も、だ。
  
 [ 付記4 ]
 本項で述べた方法は、主として文字情報を扱うような、小さなファイルサイズのものが対象だ。
 一方、巨大なサイズの画像ファイルもある。こういうのを保存すると、たちまち容量の限界に達してしまいそうだ。その場合には、次の方法を取る。
 「ウェブ魚拓を取る」
 この方法によって、ネット上で巨大な画像を保存することが可能となる。
( ※ ただし、手間はちょっとかかる。また、仕事のためというよりは、趣味のためとなるだろう。私としては、あまり言及せず、簡単に紹介しておくだけに留める。)
  
 [ 付記5 ]
 「 Evernote なら PDF も使えるし、全文検索も可能です」
 との指摘を受けた。(コメント欄)
 ならば、Evernote にすればいいか? いや、Evernote には致命的な問題がある。容量の制限だ。
 「無料版では毎月60MBまで、有料版では毎月 1000MBまで」

 とのことだ。有料版はともかく、無料版(毎月60MB)では、PDF などの保存をするには足りなくなる恐れが十分にある。他にも画像ファイルなどがたっぷりとあるはずだからだ。となると、Evernote だけに絞って保存するのは、上策ではないだろう。
 ただし、「 PDF ファイルだけは Evernote にする」というのは、よさそうだ。
( ※ しかし、保存場所が二箇所になると、検索が面倒になるので、あまりお勧めもしない。
  
 なお、Evernote をすでに使っている人もいるだろう。そういう人は、個人の情報整理(メモ整理)に使っているはずだ。ならば Evernote は、「ネット上の情報保存のため」には向いていないことになる。検索したときに、自作ファイルと、他人のファイルとが、混じってしまうからだ。
 私としては、Evernote はやはり、その本来の目的のために使う方がいい、と思う。つまり、こうだ。
 「多様な端末(スマホやノートPCやデスクトップなど)で、メモ情報を共有する」
 具体的には、日常生活での情報スクラップだ。そういう目的であれば、毎月60MB で十分に足りるだろう。
 一方、Web 上のファイルを大量に保存する、という目的のためには、本項の方法を使う方がいいだろう。あとで検索するときに、誤情報(自作ファイル)がヒットしないからだ。
   
 あと、もう一つ。Evernote には「全文検索の精度が良くない」という難点がある。
 急速に使い勝手が向上しているEVERNOTEなのですが、全文検索機能だけは、どうしても「もうひとつ!」という印象があります。特に、雑誌のPDF化などをしても(第48回「電子ファイリングで雑誌をデジタル化する」参照)、そのページ内の検索が、非常によくヒットしてくれたり、全くダメだったりします。
( → マイナビ
 Evernote の全文検索には、あまり精度がないようだ。一方、本項で示した方法は、Google の全文検索技術を使っているので、検索精度がとても高い。
posted by 管理人 at 15:09 | Comment(2) | コンピュータ_03 | 更新情報をチェックする
この記事へのコメント
Evernoteは全文検索できるしpdfどころかocrで画像内も検索できますよ
Posted by yy at 2012年05月02日 17:19
ご指摘ありがとうございました。該当箇所を修正し、また、 [ 付記5 ]を加筆しました。
Posted by 管理人 at 2012年05月02日 17:40
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。
  ※ コメントが掲載されるまで、時間がかかることがあります。

過去ログ