2016年3月13日日曜日

英文テキストからオーディオブックを自作♪

英文テキストから音声ファイルを作成する方法は、色々あります。英文読み上げだけならば、OS標準の機能で簡単にできます。
  • Windowsの「ナレーター」…スタートボタン→検索窓に「ナレーター」と入れれば起動可能。キー入力やフォアグラウンド・プロセス(のテキスト部分)を読み上げてくれたりします。
  • Mac OS Xの「音声入力と読み上げ」(古いOS Xでは「スピーチ」)…「システム環境設定」にある「音声入力と読み上げ」(旧OS Xでは「スピーチ」)を設定すれば、たとえば特定のキーを押した時に選択したテキストを読み上げるなど。
この他、このテのサービスをしてくれるサイトや(短い文章ならMP3ファイルを作成してくれる所もある)、ブラウザのプラグインでテキスト読み上げをしてくれる物もありますが、文字数に制限があるとかMP3が作れないとか。その辺のツールで読み上げさせて、これをレコーダーで録音というアナログな手法も無くはないのですが、もっとスマートなやり方無いのかな~。要するに、制限なしにテキストから音声ファイルを作れるツールを探していた訳です。そんな折、以下のWebページで、MacOS X標準で色々できることを教えてもらいました。
このページには、英語プレゼンテーションの原稿をMacに読み上げさせ(AIFFファイルとして出力し)、これをiPhone/iPodで聴きながらひたすらシャドウイングをするという英語プレゼンの練習法が書いてあるのですが、これを使えば、たとえばpublic domainになっている小説などからオーディオブックが自作出来るではないか!
  • 件のページ曰く、「感情的表現こそありませんが、たぶん大多数の日本人よりは発音が良いです。原稿を完全に覚えるためだけではなく、発音やアクセントなどの勘違いを減らすためにも効果的です。」これは大納得。が、「ジョギングしながらでも英語についていって淀みなく言えるように練習します。」とはなんとも過激な(過酷な)練習方法だ!
閑話休題。

という訳で、Wikisource <https://en.wikisource.org/wiki/Main_Page>にあるpublic domainの英文小説をいくつか音声ファイル化してみました。OS Xのsayコマンドで作られるAIFFファイル(.aiff)はそのままでは容量がデカいので、ビットレートを少し下げたAAC(.m4a)なりMP3(.mp3)なりを作り(これにも色々な道具がありますが簡便にはiTunesでできます)、これをiPod touchに入れて繰り返し聴いて“英語耳”を鍛えます。なんちて。
  • iTunesは音声ファイルのフォーマット変換専用ソフトではありませんが、「環境設定」→「CDをセットした時の動作」→「読み込み設定」の設定を調整することで、変換先の音声ファイルのフォーマット・ビットレート等を調整できます。CDを読み込む時(ソコソコ高音質にしたい)とオーディオブックを作る時(96~128kbpsで十分)とで毎回設定を変えなきゃいけないのが面倒臭いですけどね。
  • あとユーザにとってはどうでも良いことかも知れませんが、このsayコマンドはおそらくOS Xの「読み上げ」ツールの心臓部(アプリから呼び出されている)のようです。
ちなみに。ネット記事をそのままcopy-and-paste (コピペ)すると、OS Xのsayコマンドが処理できない文字が入ったりします(いわゆる2バイト文字など)。これを除去/ASCII化するには、同じくOS Xのnative2asciiというコマンドが使えます。あと、テキストファイルを章毎に準備したなどで何度も同じ手順を繰り返すような場合、シェルのfor/foreachコマンドを使うと大幅に手間が省けます。

複数のテキストファイルの拡張子が全て.txtである場合、MacOSのアプリケーション「ターミナル」でたとえば以下のようにすれば良いです(入力部には下線を引いておきます;sayコマンドには標準入力を食わせています。また、この例では、音声ファイル作成に必要なものではありませんが、作業の進捗状況を見るため、echoコマンドで処理が終わったファイル名を表示させています)

    yuu0720@imac2014% foreach f ( *.txt )
    foreach? native2ascii $f | say -o `basename $f .txt`.aiff
    foreach? echo $f
    foreach? end
    Chap01.txt
    Chap02.txt
    (…途中省略…)
    Chap10.txt
    yuu0720@imac2014%
  • 注:この例ではシェルにはワタシが使い慣れたcsh (tcsh)を使っています。MacOSのターミナルのシェルは、デフォルトはsh (bash)で、同じことをするにはforeachでなくforを使うとか、構文が違うとか…そりゃもう色々と違うのですが…書き出すと止まらなくなるので、必要/興味がある人はご自身で適当に調べて下さい(←shの内蔵コマンド構文を殆ど忘れているので書きようが無いというのが本当のトコロです/苦笑)。
でき上がったAIFFファイルはiTunesに突っ込みます(drag-and-dropするだけ)。iTunes上でこれらのAACバージョンを作ったら、元のAIFFファイルはもう不要なので消してしまって構わないでしょう。
  • 今ドキのMacOSは言語設定が日本語になっていると、デフォの音声が「Kyoko」(日本人)となり、発音がカタカナ発音(笑)で非常にイタダケません。システム環境設定の「音声入力と読み上げ」でネイティブの人の声を選んでおくと良いです(あるいはsayコマンドに「-v Vicki」とかのオプションを付けても良いです)。色々な人(?)の声がありますが、聴き取りやすい人(?)としては、米国人男性Alexさん、それに米国人女性Vickiさん辺りでしょうか。でもenglish speakerは米国人に限りません。聴き取り練習用に、イギリス人、オーストラリア人、それとインド人の人々(?)にもご活躍頂くと役立つかも?(TOEIC対策にもね♪)
売り物やネット上で入手可能な英語教材では、興味を持って聴き続けられる物がなかなかみつからなかったりしますが、
  • 自分が興味のあるもの
  • 読んだことがある本(読んだのは日本語でも良い)
  • 観たことがある映画やドラマの原作
だったりすると、(合成音声の味気ない読み方ではありますが)結構持続して聴くことが出来ます。お試しあれ♪

・  ・  ・  ・  ・

…といったことを後輩のO君にチョット前に言ったのですが(彼もワタシ同様英語の読み書きはソコソコできるけど(TOEICスコアはワタシより上)、聴く・話すが不得意(これはワタシ以上に下手)という典型的な日本人パターン)、先日彼の車に乗せて貰った時に聞こえてきた英語スピーチは、何やら少々怪しげな内容でした。

「オゥタークゥイズアジィャパニーズタームフォーピーポゥウィドゥオブセッシヴイントゥレスツ…」

英語版アンサイクロペディア<http://uncyclopedia.wikia.com/wiki/Main_Page>の「オタク (Otaku)」とか、その他面白そうな項目をいくつか拾って、これを音声ファイル化したとのこと。確かに面白いけど! 飽きずに聴き続けられるけど! そういう使い方を教えたんじゃないってば!!(笑)

・  ・  ・  ・  ・

ちなみにこのO君、MacBook Air使いなのに(生意気なことに高級DTMソフトを使っていてボカロの声も多数揃えている)、最初は「ターミナル」というアプリケーションの存在を知らないようでした。「シェルって何ですか?」とか「カレントディレクトリってどういう意味ですか?」って。シェルはWindowsのコマンドプロンプトに似たようなものだよと言ったら、「?」なご様子(技術者なんだからソレくらい知ってろよ)。UNIXにもMS-DOSにも「さわったことがありません」とのこと(MacOS XはUNIXベースだぞ!…GUIだけ使っている限りあまり関係無いのかも知れませんケド)。う~ん、どこから教えりゃいいんだぁ!(涙)…と、世代ギャップを感じさせられました(普段は生意気なことばかり言う奴なので、こっちも年齢の差をよく忘れるんですけどね/笑)。UNIXシェルの次はスクリプトエディタやAutomaterを仕込んで教えて進ぜよう(悪笑)。それともWindowsでDOS窓…とはもう言わずコマンドプロンプトですね、を有効活用する方法やバッチファイルの書き方の方が良いカナ? (Win10はコマンドプロンプトが大幅に強化されていてチョット感動モンです)

そんなワタシ、Mac使用中は「ターミナル」を1つか2つ起動させていることが多いです(Windowsでもコマンドプロンプトを時々使います)。だって、単純な繰り返し作業や一括処理って、プログラム組んだりスクリプト書いたり、あるいはコマンド行からの入力だけで、大幅に省力化できますから。でもこういうコトをする人って、一部業界以外では既に絶滅危惧種なのかも知れません。少なくともワタシの周囲では、プログラマ・システム管理関係者以外では、何故か一定以上の年齢で、ごく少数…(嗚呼、合掌)。

0 件のコメント:

コメントを投稿