自動音声は聞き取りやすい製品もあるんだね

YouTubeで期間限定ヱヴァンゲリヲン新劇場版を観てから、オススメ動画に考察班の動画が出てくる。その中で、エヴァファンch [エヴァンゲリオンの解説・考察] – YouTubeの自動音声は聞き取りやすくて感心した。ちゃんと解る。

動画コンテンツは自動音声がイライラする。『モヤモヤさまぁ~ず2』というテレビ番組が面白そうなんだけど観ない。
あの番組でいちばんモヤモヤする要素がナレーション。すごく聞き取りにくい。
自動音声は斬新で、当時としては面白くてイジりがいがあっただろうけど聞き取りにくい。耳が疲れる。なんでわざわざこんなエフェクトをかけるんだろ。

YouTubeのニュース系チャンネルもそうで、ボーカロイドっぽいやつに喋らせてる動画はイラつく。何を言ってるかわからない。初音ミクはかわいいけど、そもそも歌にしたって字幕がないと歌詞がわからん。ニュース系の作り手もそれは解っていて、字幕を付けてる。だから静止してコマ送りで字幕だけ観る。

ところが、上で紹介した動画の自動音声は良くできてる。調べたらそんなに高くない。

動画の説明文を見ると「CV:CEVIO(さとうささら)」とある。ググったらTechno-Speech, Inc. / 株式会社テクノスピーチという会社が開発したようだ。
About CeVIO | CeVIO Official Site
ナレーションボイスは女性2種類、男性1種類。ひとり6600円。Vectorで買うと5280円。安い。
CeVIO CS7 シリーズ | 新世代の音声合成ソフトウェア【ベクターPCショップ】
何か作りたくなるなあ……

ちなみに自動音声で検索してみると、業務用はHOYAの「VoiceText」が活躍しているみたい。HOYAってあのメガネレンズのHOYA? 意外なところでこの会社が出てきた。
VoiceTextホーム | HOYA音声合成ソフトウェア VoiceText
もともとPENTAXの子会社が開発していた。それをPENTAXごとHOYAが買収。そこはたぶんレンズつながりだと思う。で、HOYAはイメージシステム部門だけRICOHに譲渡。音声事業はHOYAに残った。トヨタのカーナビ、阪神電鉄や東京モノレールの自答音声に採用されている。一太郎の読み上げ機能もこれ。業務用だから高価なんでしょうね……公式サイトに値段がない(笑)

そしてなんと、自動音声風のエフェクトでウザいと思っていた『モヤモヤさまぁ~ず2』のナレーションもWikipediaによるとVoiceTextの「SHOW」だった。
サンプル音声 | HOYA音声合成ソフトウェア VoiceText
サンプルの下のほうにあるから初期の製品だな……上の方の女性の声は聞き取りやすい。
『モヤモヤさまぁ?ず2』のナレーションはシステムが古いかチューニング不足らしい。
6600円のシステムに負けるなよ……。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください