Suno AIはプロンプトの順番で効果が変わる?実際に検証してみた。

プロンプトの順番が前にある方が効果が高く、後ろの方が効果が低いのか?

Suno AIで音楽を生成する際、Style of musicにプロンプトをいくつも記載していくことになりますが、より強調したいプロンプトがある場合は、基本的に前の方においたほうが効果がありそうなので優先順位をつけて前の方にいれておこうと思うのが自然です。では実際のところはどうなのかを検証しました。

結論として、Style of musicに記載するプロンプトは14個目くらいまでは効果が安定してあまり変わりませんでしたただ、15個目では影響力が低下し、16個目以降は完全に無視される傾向にあることがわかりました。

プロンプトの順番に意味があります。14個目くらいまではどの順番でも大きく変わらないので、強調したいプロンプトは14個目までに入れましょう。

次に具体的にどのようにやったかを説明していきます。

検証方法

検証のコンセプト

プロンプトの入力した順番の効果を測るのはかなり難しいです。これまでに検証した「プロンプトは何個目まで意味があるのか?」は必ず男性ボーカルになる曲で、ボーカルが女性に変わったかどうかの「男性ボーカルか女性ボーカルか」で判断していましたが、後ろに行くほど効果が薄れていくかどうかについてこの方法では判断が難しいと思い、ちょっとやり方を変えています。

今回の検証方法は、2番目に男性ボーカルになる「male voice」を入れることで何もなければ男性ボーカルになるようにし状態、3番目以降のどこかの位置に「vocaloid」のプロンプトを入れるというやり方です。

「vocaloid」はその名の通り、ボーカロイドの要素を取り入れるプロンプトで、ボーカルが初音ミクのような機械音声(ボーカロイド音声)に変わります。このため、聞くだけでプロンプトの効果があったかどうかが判断しやすくなります。「vocaloid」を追加し、その順番で声がボーカロイドのような機械音声が曲の中に含まれるか、その回数の増減で判断しました。

なんで「female voice」にしなかったのか?という疑問が出てきそうですが、これはいくつか理由があり、

  • 歌詞の影響などで女性ボーカルが出てきてしまうことはゼロではないから。一方で「vocaloid」はプロンプトを入れないと絶対出てこない
  • 「male voice」と「female voice」だとデュエットみたいに両方の声がでてきてが分かりづらい。「vocaloid」ならデュエットにならないだろうと想定した
  • 「vocaloid」のプロンプトはテンポも独特に変化するので効果が分かりやすくなるという理由です。結果的に「mele voice」と「vocaloid」でも1つの曲に男性ボーカルと機械音声の両方の声がでてきてしまいましたが・・・。

という考えからです。後述しますが、結局はデュエットは発生してしまいましたが・・・。

「vocaloid」というプロンプトを入力する順番を変えて、ボーカロイド音声が発生する数が増減するかで効果を確認しました。

検証方法と結果

具体的な方法

次のようなルールで曲を生成して検証をしています。

  1. 歌詞も固定し、Style of musicのプロンプト1番目に「j-pop」、2番目に「male voice」を固定。
  2. プロンプトの3番目以降に「vocaloid」を配置。徐々に順番を後ろにずらしていく。
  3. 各順番で10回生成し、ボーカロイド音声が含まれた曲の回数をカウント
  4. ボーカロイド音声の出現率で効果を判定

検証結果

検証した結果、下図のようになりました。

「vocaloid」のプロンプトを3番目に配置した場合、10回中9回でボーカロイド音声が生成されました。5番目~14番目までは6~7回であまり変化は見られません。15番目になると回数が急に減り、16番目以降では効果が見られませんでした。だいたい14番目までは同じ効果が得られるようです。3番目なら効果高い可能性はあるとおもいますが判定は難しいです。

一方で15番目になると急激に効果が下がり、16番目に至っては無視されました(16番目以降は完全に無視されるのは前の検証と同じ)。このため、プロンプトの効果を加えたいならば14番目までに入力し、どの順番にいれてもだいたい同じ効果が得られる可能性があります。

ただ、注意点として今回の検証では男性ボーカルとボーカロイド音声は1つの中に共存しないだろうと思っていたのですが、普通に両方含まれましたし、なんなら男性ボーカル+女性ボーカルのみとか、ここにボーカロイド音声が加わって3つの音声が入っていたことがありました。

このときはボーカロイド音声が入っていたら1回でカウントしています。これはこのプロンプトがないと絶対に出てこないので「vocaloid」のプロンプトが影響したと判断したためです。

ちなみに急にでてきた女性ボーカルはボーカロイド音声が基本的に女性のボーカロイド音声になるのでその名残かと思います。なぜSuno AIがあえて女性ボーカルにしたかはちょっとわかりません。

また、ボーカロイド音声は曲の冒頭だけを歌って、あとは男性ボーカルのみで全部歌いきる、みたいなパターンが多かったです。2つの音声をいれるプロンプトがあるので、これを満たすために苦肉の策でSuno AIがこのような対応をしたのかと思います。

まとめ

Suno AIでは、プロンプトの順序が生成結果に影響を与えていました。今回のボーカルを使った検証では、重要な要素は14番目までに記載すると良く、14番目まではどこに入れても効果はさほど変わらないという結果でした。16番目以降は完全に無視されるので、そもそもプロンプトを16個以上使うのは意味がないと思われます。

【PR】日本最大級のイヤホン・ヘッドホン専門。取り扱い量がすさまじい・・・。
    高級イヤホンを中古で安く買えます。不要なイヤホンを売れるのもいいですね。

コメント

タイトルとURLをコピーしました