Audibleなどのオーディオブックサービスは「ながら読書」ができて便利であるいっぽう、取り扱い書籍の少なさがネックです。
持病である対人恐怖症関連の書籍を聴きたくても、そんなマイナー本のラインナップが充実する気配は全然ありません(苦笑)。

そこでオーディオブックのようなものを自力で作ってみました。
当記事では、自作の具体的な流れと、自作の肝である読み取りソフトの比較をご紹介します。

オーディオブック自作の流れ

ほかにも方法はあるかもしれませんが、わたしがオーディオブック(のようなもの)を自作した際の流れは以下の4ステップです。

1. 書籍をPDF化する

書籍をオーディオブックに変換

いわゆる「自炊」というやつですね。
裁断機を使って書籍を1枚ずつの紙に分解し、それら(の文字情報)をスキャナーで読み取ります。
わたしは自炊素人なので、作業の際はこちらのページを参考にしました。

スキャン時の出力フォーマットはPDFで。
ほかにもJPEGなどいろいろありますが、書籍ならPDFが一番だと思います。
書籍の全ページ(の文字情報)を1つのPDFファイルにまとめらるので管理が容易です(JPEGだと1ページごとに1ファイル出力なので大量のファイルが出来上がってしまう)。

また、スキャン時は必ずOCRオプションを選択。
OCR(光学文字認識技術)を使えば、書籍の1ページ1ページを画像ではなく文字として認識しながらスキャンできます。
PDFファイルの読み上げ精度を高めるためには必須です。

2. PDF読み取りソフトを使う

自炊したPDFファイルを、読み取りソフトを使ってテキストファイルに出力します。

書籍の自炊では、OCRを使っても必ず何らかの読み取りミスが起こるからです。
そのため後述の読み上げアプリでPDFファイルを読み上げさせると、おかしな箇所がどうしても出てきてしまいます。
たとえば文の途中で別の文に移動して読み上げたり、ページの末尾から次ページに進まずページの冒頭へ戻るといった現象は少なくありません。

読み上げの精度を高めるためには読み取りソフトの使用が必須です。
無料ソフトの読み取り精度はどれもイマイチなので、わたしは「ABBYY FineReader」という有料ソフトを使っています。

なぜテキストファイルへ出力するかというと、次の校正作業を効率よく行うためです。
スキャナーでも読み取りソフトでも、縦書きの書籍をPDF化すると縦書きのまま出力されるんですね。
個人的に縦書きのテキストは校正しづらいので、いったんテキストファイルへの出力作業をはじめに行っています。

3. テキストファイルを校正する

OCRスキャン・読み取りソフトを使っても、出来上がったテキストファイルは100%完璧ではありません。
わずかな文字認識のミスを、テキストエディタ上で校正していきます(漢字の修正、文字の削除や追加など)。

メモ帳などの無料のテキストエディタで十分です。
1行ずつミスを探していくのは大変なので、わたしは適当に行っています。
同じミスが何回もある場合は、エディタの置換機能を使うと便利です。

4. 読み上げアプリを使う

最後にスマホの読み上げアプリやパソコンの読み上げソフトを使って、校正後のテキストファイルを読み上げます。
これでオーディオブック(のようなもの)の完成です。

わたしは「Voice Dream Reader」というiOSアプリを使っています(Androidアプリ版もあります)。
同種のアプリのなかでは日本語読み上げ精度が高いです。

Voice Dream Readerは有料でしかも価格は安くありませんが、そのぶん機能が充実しています。
たとえファイルに文字以外の画像などが含まれていても、文字だけを選んで読み上げることが可能です。
また、DropboxやGoogleDriveと連携してテキストファイルデータを簡単に同期できます。

読み取りソフトの精度を比較

読み取りソフトを使うにあたっては、有名な3つのソフトの読み取り精度を簡単に比較してみました。
「Acrobat Reader DC」、「ABBYY FineReader」、「読取革命」それぞれを使ってみた感想です。

ちなみにGoogleDriveやOneDriveなどのウェブアプリ(ウェブサービス)にも読み取り機能がありますが、現時点での精度は以下のソフトより劣っているように思います。

1. Acrobat Reader DC

Acrobat Reader DC」(アクロバット リーダー ディーシー)は、Adobe社の有名なPDFビューワーですね。
基本的にはPDFファイル閲覧ソフトですが、無料でもPDFの読み取りができます。

ただ、無料というだけあって読み取り精度は良くありません。
無意味な記号の羅列が出力されたり、読み取り後に文や文章の順番が入れ替わっていることが多いです。

同ソフトの有料プラン(月額1500円ほど)ではOCR機能が用意されていますが、かなりコスパが悪いので見送りとなりました。
多くて月に1冊くらいしかオーディオブック化しないわたしには、月額より買い切り型の有料ソフトのほうが合っています。

2. ABBYY FineReader

ABBYY FineReader」(アビー ファインリーダー)はロシアのIT企業が開発したソフトなんですが、OCRソフトとして世界的に有名だそうです。
30日間の無料お試し版があるので、まずは使ってみることをおすすめします。

個人的には読み取り精度が他ソフトより高いと感じます。
専門用語の多い日本語書籍でもほとんど正確に読み取ってくれている印象です。

常用漢字以外の漢字の読み取りについては他ソフトと同様にうまくいきません。
古い書籍をオーディオブック化する場合は、多少は自分で手直しするしかないでしょうね…。

3. 読取革命

読取革命」は、パナソニック製の読み取りソフトです。
こちらは10日間お試し版が用意されています。

読取革命の精度は、「Acrobat Reader DC」と「ABBYY FineReader」の中間といったところでしょうか。
文字ひとつひとつの読み取り具合は全体的に悪くありませんが、文章の順番が入れ替わってしまったり抜けがあったりするのが難点です。

現代の小説や新書などのオーディオブック化なら脳内でなんとか補完できると思います。
しかし専門書や昔の書籍については、おそらく校正作業の段階でお手上げになってしまうでしょう…。

書籍をオーディオブック化する手順そのものは単純で、あとは慣れですね(わたしは不器用なので本の裁断・スキャンがいちばん大変でした)。
読み取りソフトを使えばオーディオブック化の作業が間違いなく楽になるので、どれかひとつ試してみてください。