テキストデータを使ったデイジー図書の製作に役立つ(公共図書館)

― テキストデータを使ったデイジー図書は音訳デイジー図書の製作時間のおよそ1/10 ―

取材先:新宿区立戸山図書館 大城澄子館長

新宿区の方針にもとづき、障がい者支援サービスの充実に取り組んでおられる新宿区立戸山図書館の大城澄子館長に、「スキャネックス」と「RECAIUS音訳エディタ(DaisyRings)」を利用した合成音声デイジー図書の製作について取材をさせていただきました。

戸山図書館では視覚に不自由がある方へのサービスに対して、42名の音訳ボランティアの方々と連携し、年間約50タイトルの録音図書(音声デイジー図書)を毎年製作しています。
2016年4月から「障害者差別解消法」が施行され、これにともない公共図書館の障がい者への合理的配慮が求められることになりました。音声デイジー図書へのニーズが今後一層高まることが予想されます。しかし、音訳(音読)ボランティアの方々のキャパシティには限度がありますし、製作時間はどうしても長くなります。
そこで着目したのが、文字情報をスキャナーとOCRソフトを使ってテキストデータに変換し、それを音訳ソフトによって合成音声に変換してデイジー図書を製作する方法でした。マルチメディアデイジー化を視野に入れています。
いろいろなスキャナーや音訳ソフトを検討してみた結果、次の製品を使ってデイジー図書を製作することにしました。

chart_software

戸山図書館では「スキャネックス」を2015年12月に購入し、2016年1月にテキストデータを製作しました。対象にした本は、ジョルジュ・ペレック著 桑田光平訳「給料をあげてもらうために上司に近づく技術と方法」(155ページ)。本文は句読点がない文章で、訳者のあとがきに翻訳も大変つらい作業であったとありましたが、音訳もどのように読んだらよいのか全く見当がつかず、音訳者が困っておりました。
そこで、テキストデータにし、機械的に読上げれば、原書の意向に沿うものになるのではないかと思いテキスト化しました。他、新書、図版の多い書籍も試してみました。また、戸山図書館発行の「声の図書館だより」は原稿作成後、すぐに合成音声デイジーの編集をすることができます。読上げの声を若い女性、男性、子どもの声などを選ぶこともできます。
実際にスキャンからテキストデータを製作してみると、音声から製作する工程と作業時間に大きな違いがあることが分かりました。例えば、法律書(「基本民法1『総則・物件総論』(395ページ・録音時間27時間57分)」)の場合、予想される作業日数を比較すると下記のようになります。

chart_date

※音声デイジー図書は音訳ボランティアが1~4を4人で行いますが、テキストデータからデイジー図書製作する場合は1~4までを一人で行うことも可能ですし、ページ数の多い書籍は数人で分割し、同時に製作することが可能になります。図書館サイドは選書、テータ共有、ボランティアへの依頼、サピエ図書館への登録等の進行管理全般を行います。なお、音声デイジー図書の製作に最短で6か月を要していますが、これは、ボランティアの方々が言葉の正確な読み方や意味などの調査に要する時間や正確な音読を提供するための習熟にかかります。多忙な日常から作業時間を捻出し、音訳や編集作業をしてくださっています。

【テキストデイジー図書を製作した上での評価と今後の展望】

1、「スキャネックス」は本を壊さなくてもスキャンできる点、ページをめくれば自動的にスキャンしてくれる点が優れています。
シートフィードスキャナーでスキャンするには、本を壊してシート状にする必要があります。本を壊すのは著作権法上、好ましくないという意見もあり、本は出来るだけ壊したくありません。
フラットベッドスキャナーは本を壊さなくてよいのですが、本を裏返してガラス面に押し付けてスキャンする手間がかかります。本の接合部分が黒ずんで綺麗なデータが出来ないことも気になります。
その点、スキャネックスは本を開いた状態でスキャンできるし、ページをめくればスイッチを押さなくても自動的にスキャンしてくれるので作業が 楽です。画質も申し分ありません。

library1
(スキャネックスで本をスキャンしているところ)

2、「読取革命」はOCR日本語変換率が高く、必要なところだけ範囲指定して
容易にテキストデータができます。
「読取革命」は単語辞書60万語を内蔵しているので日本語変換率は高いです。
(注)弊社の調査では10pt活字の変換率が99.9%でした。
文中の写真、図版、小見出し、ページなど、テキストデータに不要な部分は範囲指定をして除くことができるので、容易にテキストデータができます。
原本とテキストデータの文字校正に一番時間がかかりました。

3、「RECAIUS音訳エディタ(DaisyRings)」はクラウド型音訳ソフトなので、
PCにソフトを入れる手間がいらず、複数の人が同時に作業できます。
音声合成の質は高く、読みやアクセントの修正、複数話者の選択などが容易にできます。音訳されたデータはデイジー形式でダウンロードされてデイジー図書が完成します。
図書館が視覚障がい者のためのデイジー製作に使う場合(著作権法37条3項に該当する)は使用料が比較的安価です。
複数アクセスの契約をすれば、複数の者が同時に作業できるので、デイジー図書を短期間に量産することも可能になると考えられます。
※クラウド型音訳ソフトを使用することが困難な図書館では、スタンドアローン型の音訳ソフト「PLEXTALK Producer(シナノケンシ㈱)」を使用する方法があります。

4、テキストデータを使ったデイジー図書は編集作業のみで、量産が可能です。
戸山図書館の利用者は、音訳ボランティアの方々の読みによるデイジー図書へのニーズは高いのですが、一方で、法律書や専門書系を希望する方々はスピードを求めています。音訳者の読みとテキストデータを使って編集し、製作を棲み分けることを考えています。
そのため、ボランティアを音訳チーム、音訳デイジー編集チーム、テキストデイジー編集チームの3グループに編成する予定です。
また、緊急で必要な場合は、テキストデータを製作し、テキストデータのみの提供もできます。

5、図書館がテキストデータによるデイジー図書製作を活用することをお薦めします。
これから視覚障がい者のためのデイジー図書製作を始めようとする図書館の場合は、音訳ボランティアを組織するのに時間がかかりますから、テキストデータによるデイジー図書製作から始められると良いのではないでしょうか。
既に音訳ボランティアによるデイジー図書製作を実施されている図書館の場合でも、テキストデータによるデイジー図書製作も並行して取り入れられると、障がい者の様々な要望に応えることができると思います。

6、図版や写真と文字を同期させて出力するマルチメディアデイジーの製作も可能になります。
図書館で製作した種々の発行物やパンフレットを原稿(テキストデータ)からすぐに音訳することができるので、図や写真を組み合わせることで、分かり易い情報発信をすることができます。
視覚障がい者以外にも、文字が読み難い方や高齢者で視力が低下している方、識字障がいの方々などにも音訳で情報を提供することが容易にできるようになります。
小学校低学年の児童が漢字入りの本でも音声を聞きながら読めば、本の内容を理解することができます。子ども達の自学自習、調べ学習を促す支援の一つとして活用できるのではないでしょうか。

library2
(デイジー編集をしているところ)

library3
(戸山図書館で子ども達にマルチメディアデイジーを使って音声と画像を見せている)

2016年7月20日
取材者 水野(A.M.T.㈱)hu

Bookmark this on Yahoo Bookmark