手持ちの書籍を電子書籍にしてみた。

こんばんは、営業さんの新規提案に同行すれば、その営業さんよりも明らかにグレイトな営業活動が出来てしまう、研究開発エンジニアのケイタソです。頼むから営業さんはもっとアタマを使って提案をしてほしいっす。


さて、僕は紙媒体が大嫌いです。
扱いづらい、場所をとる、生産過程で自然を傷つける、というのが理由。
というわけで、ここ最近電子書籍というものに大きな期待を抱いています。
AmazonKindle for iPhoneもダウンロードしました。
iPhoneのGoodReaderで手持ちのPDF(主に研究論文など)を読んでいます。
当然iPadも欲しいです。


で、この流れで最近Web界隈で流行っているのが書籍のデジタル化。
購入した裁断機で手持ちの書籍を裁断し、ScanSnapで読み込んでPDFにし、iPhoneなどに突っ込むというやり口がメジャーです。


しかしながら、僕は他人がやってるやり方でやるわけがないので、いつも通りアタマをひねりました。

裁断機

まず裁断機ですが、価格はピンキリであるものの、概ね3〜5万円するみたいです。

プラス 断裁機 PK-513L 裁断幅A4タテ 26-106

プラス 断裁機 PK-513L 裁断幅A4タテ 26-106

一方、FedEx Kinko'sの裁断サービス。これは1回105円です。
従って、単純計算で本を300〜500冊以上裁断すれば裁断機購入のメリットが出てくるようです。


もちろん裁断機を購入すれば本をKinko'sまで持ち歩かず自宅で一度に大量に裁断できるとか生涯使えるとかいろいろメリットがあるとは思います。
しかし、そもそも手持ちの書籍を急いで電子化して持ち歩く理由が無く、したがって自宅で大量に捌く必要がありません。


そして、これから死ぬまでに300〜500冊、紙媒体の本を買って読むとは思いません。
書籍が電子化されれば僕はそっちを利用するわけで、それが何年後になるかは正確にはわかりませんが、例えば10年後だとして、今後10年間で300冊の紙媒体の書籍を読むかというと、それは絶対に無いと断言できます。
仮にあったとしても、裁断しているうちに刃が痛むので、替刃を買わないといけません。それが1.5万円くらい。いつになったら元が取れるんだっていう(笑)


理由は定量的なものばかりではありません。
ひとつは、裁断機をどこに置くのだという問題。
僕の部屋は訪問者に言わせればまず「広い」という評価で、裁断機を置くスペースなんて余裕であります。
しかしながら、恐ろしいほどにマッチしないでしょう。僕のこの美しくデザインされた空間に対して、事務感丸出しの裁断機が。

プラス 断裁機 PK-513L 裁断幅A4タテ 26-106
使うときに出して使い終わったら収納する?…ありえません。今よりもずっと頻繁に本を購入して裁断しまくらないと上記理由により元が取れませんが、そうなったら出し入れが頻繁に発生して面倒です。


加えて、僕が読むものには会社で購入するものもそれなりにあり、勝手に裁断できないものも少なくありません。


さらにさらに。
僕は根が超神経質なので、自力で裁断するとしたらものすごい神経を使います。0.01ミリのズレや無駄も許しません。
でも僕はこんなことよりもっと生産的なことに神経を使いたいと思っています。こんな作業に神経をすり減らしたくありません。


従って、僕の場合はFedEx Kinko'sなどの裁断サービスを利用した方が良さそうです。

ScanSnap

FUJITSU ScanSnap S1300 FI-S1300

FUJITSU ScanSnap S1300 FI-S1300

これはアリかなと思っていました。
会社帰りにKinko'sで裁断を行い、自宅でスキャンしてPDF化するっていう快適生活。


しかし、残念ながら、やはりプロダクトとしてのデザイン上の美しさがイマイチ感じられない。
できれば家に置きたくないし、収納場所すら安易に提供したくない。
むき出しで置きっ放しにしたらしたで、このタイプの機器は埃の掃除が大変になるし。


一方でスキャンしてくれるサービスも探したのですが、裁断とは異なり、著作権の絡みが発生するので、そんなサービスもないようです。


ということで、会社の業務用複合機を利用することにしました。
さすが業務用、しかもわりと新しい機種だけあり、YouTubeなどに上がっている動画のScanSnapよりもずっと高速で、多機能です。


僕は書籍をモノクロ300dpiのPDFにして、その画像のテキスト部分には同複合機OCR結果を埋め込んでいます。
これにより、DjVuよろしく、PDF内での文字列の選択・コピー・検索などが可能になります。
これぞ電子書籍の醍醐味!
ちなみに、OCRまでやると民生品のスキャナでは時間がかかるのですが、こちとら業務用複合機なので高速に一括で処理できます。


また、オートシートフィーダだけでなくフラットベッドのスキャンも可能ですので、同じPDFのファイルでも複数のスキャン手法を組み合わせて読み取ることができます。糊の関係で一部裁断が不完全なときなどに使えます。
スキャン手法だけでなく、途中でカラーモードを変更したり、その他設定を変更したりと、かなり自由度が高いです。


スキャン結果のPDFはネットワーク経由で自分のLinuxマシンのSambaで受けているので、終わったら自分のデスクに戻るだけ。
そこにはPDFがちゃんと送られてきています。


そんな感じで、これが一般的な話なのかは判断しかねますが、会社の複合機はかなり使えます。
もしもこれが禁止になったら、その時は今よりもスペックが上がっているであろうScanSnapを購入すればいいですね。

で、書籍を一冊処理してみた。

手始めにこの本をKinko'sで裁断して、会社の複合機でPDFにしてみました。
A5サイズで272ページですが、合計100MB程になりました。
僕はMacだけでなくモバイルデバイスでも表示しようと考えているので、各章ごとに別ファイルとしています。今回一番ページ数の多い章で15MBでした。この本の場合、全体の平均は6MB/章くらいかな?


それにしても、いいですね。これ。
大きなディスプレイに表示させてマウスを使って読むと、普通に紙媒体を読むより楽です。Macなら綺麗で読みやすいですし、Automatorを使ってPDFの結合プログラムを作り、それを使うことで各章ごとに分けたファイルを1つに結合できます。*1

OCR埋込による検索も狙い通りです。

Mac標準インストールのビューアでコメント挿入や各種マークアップもできます。

iPhoneNexus Oneにも入れましたが、デバイスの性能的にiPhone 3G(Sじゃない方)は厳しいですね。Nexus Oneは表示も検索もサクサクなのでアリです。

リーダーを自作したい。

こうなると、いろんなことができるので、読書に特化したPDFリーダーを自作したいところです。
あんな機能やこんな機能を付けたりして。。。
また、OCRの文字認識性能には満足していないので、この辺のソリューションも欲しいですね。
あとはライセンスやパーミッションの問題がクリアできれば、ビジネスになり得ます。
うーん、いい感じ。

まとめ

  • 人によっては裁断機よりも裁断サービスの方が合ってるかも。
  • ScanSnapもいいけど、会社にはもっと良いスキャナがあるかも。
  • 電子書籍マンセー*2

編集後記

僕はあまりネガティブな表現は好まず、極力そういう言葉は使いたくないのですが、今回の記事は否定文がびっしり並んでしまいました。うーん、今回ばかりは仕方ないかな。

*1:Windowsのことは知りません。

*2:すみません、出版業界のことは全然考えてません。