AWS

Amazon Pollyで、より人間らしい表現力豊かな新しいジェネレーティブ音声3種が利用可能に

NewsPilot編集部

Amazon Web Services(AWS)は、AWSのテキスト読み上げサービスであるAmazon Pollyで、より人間らしい自然で表現力豊かな音声を生成するジェネレーティブ音声の提供開始を発表しました。

Amazon Pollyは、テキストを自然な音声に変換するサービスです。今回の発表により、Amazon Pollyは、従来の標準音声、ニューラル音声、長文音声に加えて、新たにジェネレーティブ音声をサポートしました。

ジェネレーティブ音声は、従来の音声よりも、より人間らしい自然な発話や感情表現が可能になります。
発表時点では、米国英語の「Ruth」と「Matthew」、英国英語の「Amy」の3種類が利用可能です。

ジェネレーティブ音声は、大規模言語モデルを用いた音声合成技術によって実現されています。
従来の音声合成技術では、音声を合成する際に、音素と呼ばれる音声の最小単位を連結していく方法が一般的でしたが、ジェネレーティブ音声では、深層学習を用いることで、より自然で滑らかな音声を生成することが可能になりました。

Amazon Pollyは、ニュース記事のナレーション、eラーニング教材の音声化、ビデオゲームのキャラクターボイスなど、様々な用途に利用されています。ジェネレーティブ音声は、このような用途において、より人間らしい自然な音声を提供することで、ユーザー体験を向上させることが期待されます。

Amazon Pollyのジェネレーティブ音声は、AWSマネジメントコンソール、AWS CLI、AWS SDKから利用できます。
利用料金は、変換したテキストの文字数に基づいて課金されます。

今回の発表により、Amazon Pollyは、より人間らしい自然な音声を生成するサービスへと進化しました。今後、ジェネレーティブ音声は、様々な用途で活用され、ユーザー体験を向上させていくことが期待されます。

参照元サイト:A new generative engine and three voices are now generally available on Amazon Polly

ABOUT ME
NewsPilot編集部
NewsPilot編集部
世界の様々なニュースを、日本語でわかりやすく、いち早くお届けします!
記事URLをコピーしました