プロンプトの順番に意味があるのか?
Custom mode でStyle of musicにプロンプトを入力するときに、「プロンプトの順番は曲に影響を与えるのか?どういう順番がよいのか?」というところが気になるところだと思います。私もいつも気になっていたので検証してみました。
結論、やはりプロンプトの順番は曲に影響を与えていました。
基本的にSunoでは自分が最も優先したい内容から順番にプロンプトを入力していくと思います。おそらくそれは正しいと思います。ただ、本当にそうなのかは検証しないと確実なことが言えないと思っていたので今回はその検証を行いました。プロンプトの動きを理解していないと狙いの音楽を作れないと思いますので。
もちろん、今回の検証はあくまで一つの検証に過ぎないので、順番に影響があるものとやっぱり影響がないものもあると思います。ただ少なくとも今回の検証では順番が影響を与えていたので結論として「影響がある」としました。それでは具体的にどんなことを検証したのかを書いていきます。
関連リンク:Sunoで検証!効果があるプロンプト数は○○個だった
関連リンク:Suno AIはプロンプトの順番で効果が変わる?実際に検証してみた。
男性ボーカルと女性ボーカルを使った検証
影響があったのか、なかったのかを判断するのに分かりやすくするため、指定したプロンプトに対して男性ボーカルになったか女性ボーカルになったかで判定できないか検証しました。
最初に検証した方法は次のようになります
- Sunoのバージョンはv4
- 声に関わるプロンプトを指示しなければ、100%男性ボーカルになる歌詞を使用する
(以前の検証で確認済み。今回はこの性質を利用。詳しくはこちら。) - プロンプトは「male voice」と「female voice」を入力し、男性ボーカルになったか女性ボーカルになったかを記録。これを10回繰り返す。
- 音楽のジャンルは「j-pop」で固定
つまりプロンプトで「female voice」を「male voice」の前に入力して女性ボーカルの数が多かったら順番に意味があると考えられる、としました。
そして検証した結果は次のようになりました。

「male voice」のみ、「female voice」のみを入れた場合は想定通りちゃんと男性ボーカル、女性ボーカルになりました。ただ、肝心の「male voice」と「female voice」両方をいれたときは、デュエットのようにどちらの声も入ってきてしまい判断できなくなってしまいました。ある意味発見であり指定した通りではありますが、これでは予定した検証ができていません。ですので、ちょっとやり方を変えてみました。
「male voice」、「female voice」をプロンプトの最初に入力してみる
たまに男性ボーカル、もしくは女性ボーカルを必ず発現させたかったのでプロンプトの一番最初に「male voice」、「female voice」を入力したことがあるのですが、うまくいかないことが結構あったのでこの方法を試してみました。結果は次の通りです。

結果として、プロンプトの指示通りにならない結果がでました(表の黄色ハッチの部分)。例えば一番上の結果は、本来ならば男性ボーカルのみが発現するはずですが女性ボーカルが結構入ってきました。上から2番目の結果は完全に女性ボーカルのみで先頭に書かれている「male voice」は完全に無視されています。
これらの表は最初の表と同じプロンプトを使っており、順番だけを変えて結果が大きく変わっているのでプロンプトの順番に影響があることを示唆しています。
正直、このような結果になった理由はわかりません。ただ、いろいろと試してみましたが、どうも音楽のジャンルを最初に入力した後に「male voice」「female voice」を指定すると思い通りに曲を作ってくれます。というよりは、逆に「male voice」「female voice」を入力したあとに音楽ジャンルを指定するとSunoが混乱して予定外の結果になってしまう、といった印象です。ただこれはもうちょっと検証が必要かと思います。
無視されてしまうmale voiceを書き方を変えて認識させられないか
あまりにも「male voice」→「female voice」→「j-pop」の順番だと「male voice」を無視するので、なんとか矯正させられないかプロンプトの書き方を変えてみました。ただ、これまで検証でかなりCreditを消費してしまったので、ここから先は全て2回の生成で結果を見ています。

めちゃくちゃ頑固ですね・・・。何やっても無駄でした。ネガティブプロンプトでもダメでしたので、ここまでやっても変わらないのであれば逆に利用する方法があるかもしれないです。
まとめ
プロンプトの順番に意味があるかを「male voice」「female voice」を使って検証してみました。結果として、プロンプトの順番に意味があり、今回の検証ではプロンプトの順番に失敗すると何をやっても男性ボーカルにならなくなることが分かりました。特に声の指定を最初に、ジャンル指定を最後に入力するとおかしくなったので、ジャンル指定は最初に指定しておいた方がよいかもしれません。
(おまけ)
「male voice」「female voice」の両方を入力しておくと、デュエットが一定割合で発現してくれる。

コメント