【東京校】東芝デジタルソリューションズの新しい音声合成ツール「Voice Track Maker」を用いたゲームジャムをレポート!
こんにちは!バンタンゲームアカデミーです!
今回は8月に行われた東芝デジタルソリューションズの新しい音声合成ツール「Voice Track Maker」の説明会とゲームジャムの様子についてお届けしていきます。
東芝デジタルソリューションズサイト
https://voicetrackmaker.bp.recaius.jp/ContentsPage
今回登壇したのは東芝デジタルソリューションズで音声合成ツールの企画・事業開発を担当している倉田宜典さん。倉田さんは二足歩行ロボットの開発や、対話形式の音声合成ルールの開発などに携わったのち、2020年に東芝デジタルソリューションズに入社。「Voice Track Maker」の企画立案から担当しています。
まず、音声合成とはどのようなものか説明してくれました。
「音声合成とは、声で文章を読み上げてくれる音声情報処理のひとつです。YouTubeの“ゆっくりさん”など、棒読みの投稿動画を見たことがあると思いますが、商業用で使われているもシステムはもっとハイエンドなものです。
私たちは7、8年前から声優さんを起用してカスタムにセリフを読み上げる音声合成ツールを制作し始めましたが、もっと品質を上げて普及していかないといけないと思い、よりリアルを追求する必要があると感じていました。」
「天気予報やカーナビの音声案内で使用するには読み上げるだけの品質でも納得していただけるのですが、アプリケーションやゲームといった、クリエイティブシーンでの使用にはなかなか通用しない。なぜかと言うと、セリフが自己完結な口調になっていて、会話にはならないんです。なので、声に緩急をつけてリズムがある音声が欲しいという要望が増えてきました。その要望に応えるべくVoice Track Makerを企画しました。」
「Voice Track Makerは、音声合成に抑揚とリズムをコントロールすることができ、リアルの声優と音声合成の声の落差を無くすことを可能にしています。」
倉田さんは実際にただ情報を読んでいる音声と演技をつけた音声を流し、違いを説明。明らかに、演技をつけた音声の方が本当に人が読み上げているかのように聞こえました。
次に、Voice Track Makerの使い方についてシステムを使いながらレクチャーしていきます。
セリフ台本とセリフを演技して読み上げている音声データを用意し、Voice Track Makerに取り込みます。
以前はリズムや抑揚を手作業で一つひとつ調整していかなくてはならなかったものが、調律調整のボタンをクリックするだけで、既存の音声データが演技の見本の音声データを自動的に分析し、主旋律を調整します。
他にもアクセントやイントネーションがおかしい場合は、グラフで音域を微調整することも可能に。そのように調整した音声合成データを聞いてみると、実際に人が話したセリフかのように聞こえました。
また、男性の声を女性の声で出力できたり、2つの声をミックスしてオリジナルの声を作成できたり、自分のイメージする声に近づけることも可能になっています。
倉田さんはVoice Track Makerでクリエイターたちを可能性の幅を広げていきたいと話します。「色々な使い方ができますが、作品作りのための利用ならば無償で提供しています。新しいシステムなので皆さんと共にこれから育んでいきたいと思っています。」
倉田さんの登壇後には集まった生徒たちで、Voice Track Makerが実際にどのようなシーンで活躍するかワークショップが行われました。
音声合成がリアルになることで私たちの社会がより便利になっていく未来を感じられたイベントでした!
8/4~5の2日程で「Voice Track Maker」を用いたゲームジャム制作が行われました!
その様子をお写真でご紹介致します\(^o^)/
皆さん真剣な眼差しで製作されてますね!!
2日間で制作したゲームは東京校内で各チームごとにプレゼンテーションも行いました!!
8/21(土)には、東京校、大阪校合同でプレゼンテーションの発表をオンラインにて開催致しました\(^o^)/
その様子もお写真で御覧ください。
1年生の方も緊張しながらもしっかりプレゼンを行っておりました!!
バンタンゲームアカデミーでは実務的な経験を学内で蓄える仕組みを確立する為に、学内インターンを随時行っております。