Googleが新たに音楽生成AI「リリア」の提供を開始しました。
このAIは、ユーザーが入力した文章に基づいて、最大30秒の楽器音を生成できるという優れた機能を備えています。
「目まぐるしいサックスとトランペット、激しいドラム、深夜のジャズクラブの雰囲気」といった具体的なイメージを提供することで、ユーザーは自分のクリエイティブなビジョンを音楽に変換することが可能になります。
さらに、Googleは「リリア」を動画生成AI「Veo」、画像生成AI「Imagen」と連携させることで、音楽、動画、画像を一体的に作成できるプラットフォームを構築しています。
このように、さまざまな生成AIが組み合わさることで、一から音楽を作り出すだけでなく、視覚的な要素も取り入れたコンテンツが生まれることが期待されます。
そして、音声生成AI「チャープ」にも注目が集まります。
約10秒の音声を入力すると、さまざまな文言を自然に読み上げることが可能で、日本語にも対応しています。
このような技術が、人々の生活をどのように向上させるか、非常に興味深いですね。
GoogleのCEO、サンダー・ピチャイ氏がラスベガスでのイベントで語ったように、AIはこれからの生活を変革する大きな力を持っています。
もちろん、著作権侵害や偽情報の問題も提起されているため、これらの安全対策にも力を入れる必要があるでしょう。
プログラマーとしては、このような生成AIの進化にわくわくします。
特に、様々なメディア形式が組み合わさることで、新しい表現の可能性が広がることに魅力を感じます。
今後の技術の進展がどのようなクリエイティブな成果に結びつくのか、楽しみでなりません。
