自分の声のUTAU音源というよりも、棋譜読みちゃん企画のマスコットキャラクター・つくよみちゃんのUTAU音源が作りたいので、「キャラ声」の再現を目指しています。
つくよみちゃんUTAU音源、及びつくよみちゃんというキャラクターそのものは、棋譜読みちゃんの枠を超えて、法人・個人問わず無断で商用利用できるフリー素材として配布したいと考えています!(クレジット表記は必須)
UTAUについては完全に初心者なので、ご意見・アドバイスをいただけますと、大変ありがたく存じますm(__)m
目指す声質
つくよみちゃんのイメージボイスはこれです。
清楚で透明感のある、やや儚げな高い声……というイメージです。
キャラクターとしては、献身的で健気な性格の14歳(人間換算)です。
絵から生まれたフェアリー的な存在で、物質的な肉体を持ちません。見てくれる人がいなければ存在できない、儚い存在です。
モチーフ及び座右の銘は「鏡花水月」。
目標とする系統のUTAU音源を探してみたのですが、「張りのある大人の声」や「元気なロリの声」の音源はあれど、「清楚な少女声」はあまり見つけられませんでした。おそらく、息成分の多い声を良音源にするのは難しいのでしょう。
しっとりとした大人っぽい声ということであれば、清楚系の音源もあるのですが、それはつくよみちゃんのイメージとは違います。
雪歌ユフが近いかも知れませんが、ユフもお姉さんですものね。
大人すぎずロリすぎず、12〜15歳の少女のボイスがいいんですよね〜。
※追記
モリス・モリという音源を知りました。今のところ、これが一番理想に近いです。
原音の声は意外と低いのですが、UTAUのフラグのgの使用や曲の音階の高さによって、大人すぎずロリすぎない、絶妙な少女感を実現しているようです。
これまでに収録した音源たち
最初に、自然体で収録した音源は、清楚さというか、おとなしさが足りませんでした。
下の動画で、その音声を聞くことができます。収録方法や、「UTAUとは何か」も簡単に説明しています。
【つくよみちゃんUTAU化計画!】
— 棋譜読みちゃん@開発企画中! (@Kifuyomi) 2018年6月30日
実際に喋らせて/歌わせてみました!
詳細は動画をご覧ください!
・UTAU:@ameyaP_様
・OREMO:@nwp8861様
・くろ州式8モーラ連続音リスト:@96s_kM4osM様
・歌連続音ガイドBGM集 タイムマシン(1640mP) - by まいこ:@maiko3tattun様
・中の人:@Rei_Yumesaki pic.twitter.com/iGfKmxwON2
※動画内で「原音調整」と書いているものは、「原音設定」の誤表記です。
それから、複数の音源を収録しました。
この下で公開していくのは、
・ホワイトノイズは除去済み
・リップノイズ等は未処理
・原音設定は自動でできるところまで
・連続音で収録しているが、原音設定をきちんとしていないので、最初の音だけ使って単独音的に鳴らしている
という状態のテスト音声です。
シャリシャリ感が気になるかも知れませんが、それについては後で改めて取り上げます。
歌わせている曲は、即興のオリジナル曲「テスト2」(←曲名)です。
原音
→簡易な喋り(唄詠不使用)
→女声曲によく使われる範囲の音
→合成音声歌唱でしばしば見られる超高音
→低音
の順で遷移していきます。
「仮の音源名(収録音階)」の形式で表記します。
まいこ様発案の「歌連続音」で収録しているので、実際には収録音階は2つありますが、低い方の音程を収録音階としています。
それでは、収録順にご紹介します!
◆つくよみちゃんCheerful(G4)
最初に録った音源。
前述の通り、つくよみちゃんの声としては元気すぎますが、朗らかに歌わせたいとき用の表情音源としては使えるかも知れません。
◆【没】つくよみちゃんWhisper(C5)
裏声で収録した音源。マイクの設定を間違えてPC内臓マイクで録ってしまい、音質が悪いため、没になりました。
しかし、高周波数に由来するシャリシャリ音がないという利点もあり、他の音源を作成する上でのヒントになるかも知れません。
また、裏声で収録してもウィスパー音源になるわけではないということが分かりました。
◆【没】つくよみちゃんTender(G4)
Cheerfulでの反省を活かし、優しい声になるよう心掛けた音源。
いい感じだと思ったのですが、上のWhisperと同様、マイクの設定ミスのため没になりました。
◆【要検討】つくよみちゃんDynamic(D5)
シャウト……は歌が下手すぎて無理だったので、ヘッドボイス的な裏声で収録した音源。
低音がふざけた声になるのは仕方ないとして、他の音源と比べて息成分が少なく、同じキャラクターの声として馴染まないので、没になりました。
追記:使用される方によっては使い道があるようなので、「没」から「要検討」に変更しました。
◆つくよみちゃんBreathy(A4)
裏声というよりも、ウィスパーボイスで収録した音源。
UTAUで出力される音がウィスパーボイスかどうかはさておき、少なくとも優しい感じの音になり、使い道のありそうな音源になりました。唄詠で喋らせるならこれが一番つくよみちゃんっぽい声になるようです。
◆つくよみちゃんAverage(G4)
CheerfulとBreathyの中間のイメージで、ウィスパー気味(完全なウィスパーにはしない)の地声(裏声にならないようにする)という微妙なラインを狙って収録した音源。
つくよみちゃんUTAU音源のイメージの中心に据えたいのですが、クオリティにやや不満&不安があります。
◆【要検討】つくよみちゃんFalsetto(D5)
ウィスパーとかヘッドボイスとか考えず、自分にとって出しやすい自然体の裏声で収録した音源。
高音部を歌わせたらいいんじゃないか……と思いきや、UTAUは原音より上の音を出すのは得意なので、必要ないかも知れません。他の音源より少しは高音が綺麗なような気がしますが、必要性については要検討です。
◆つくよみちゃんDeep(D4)
ここまでの音源だと低音に弱すぎるので、低音用に収録した音源。
「テスト2」で比較すると、最後の低音部を一番綺麗に発音できます。高めの音に使った時は、やや深い響きを持たせることができます。
唄詠で喋らせる時、低めの声にしたい場合はDeepがいい感じです。
◆つくよみちゃんAverage2(G4)
シャリシャリ感が気になってもう一度収録したAvarage。やっぱりシャリシャリになりました。
ほぼAverageと同じ感じで歌いますが、心なしかおとなしめかも知れません。Average(1回目)と最終的な出来を比べてみて、負けた方はもう片方の音が変な時のための「避難先」に回すことを考えています。
◆比較用:中の人の歌声(下手糞注意)
特に練習やテンポの確認を行わずに適当に歌ったので、音痴な上にかなり速くなってしまいました。
公開するのに勇気を要するほど下手糞。あくまでUTAUで生成した音声との比較用です。中の人がこれだけ下手糞ならば、UTAU音源を作る甲斐もあるというものでしょう!(ポジティブ)
歌ってみたOKです。最高音はE6(hihiE)ですけど……。
◆真面目な歌&リバーブ(2018.10.18追記)
【つくよみちゃんUTAU音源制作中!】
— 棋譜読みちゃん@10/17 UTAU新動画UP! (@Kifuyomi) 2018年10月17日
本日新しい記事をUPしました!https://t.co/hRhB2gdeyn
前半は原音に対する処理の話です。後半では、前回のサンプル音声よりも真面目な歌で、表情音源の実用性を検証しています。ご意見、ご感想、アドバイス大歓迎です!
※動画の音声は完成品ではありません。 pic.twitter.com/kyRhuXakqE
周波数に由来するシャリシャリ感について
UTAUは多少ノイジーになるものですが、他のUTAU音源と比べてもシャリシャリ感が強いと思われます。
原音が雑音みたいな声なので(根拠のない自虐というわけではなく、静寂の中では通るが雑音には見事に紛れてしまうので、そうなのかなと)、UTAUに入れた時に雑音じみた仕上がりになるのも仕方のないことなのかも知れません。
とは言え、できるだけどうにかしたい……ということでまず考えたのが、原音の高音域を削ってしまうことです。
◆これが元のつくよみちゃんAverage(G4)
◆適当に高音域を削ったもの
◆もっと削ったもの(これはさすがにやりすぎ?)
しかし、「イコライジングは本来、ミックスの段階で、曲調・伴奏・演出に合わせて行うべきものだ」という考え方もあるでしょう。
それに、耳に刺さるような高音はなくせても、全体的なロボ声感はこれではなくせません。
よく分からないのですが、原音設定や周波数表によっても、音の質感が変わることがあるみたいですね……?
原音自体の高音域を削るべきかどうか、削るとしたらどのように処理するとよいのかは、詳しい方からご意見を伺って決めたいと思います。
アドバイスも大歓迎です!
※追記1
参考までに、Audacityでの周波数解析の結果を載せておきます。
UTAUのシャリシャリ感について!
— 棋譜読みちゃん@10/2 UTAU音源サンプル公開! (@Kifuyomi) 2018年10月4日
画像は、つくよみちゃんAvarage・Avarage2の原音を、Audacityの周波数解析にかけたものです。
10000〜15000Hzの盛り上がりは、イコライザーで抑えたりするべきなのでしょうか? UTAUに詳しい方、いかが思われますか?
詳細&サンプル音声→https://t.co/DK3ecQ69jo pic.twitter.com/D3CuslSm4m
※追記1のさらに追記
UTAUのシャリシャリ感問題について、WEB拍手にて他音源との比較をご提案いただきましてありがとうございます!
— 棋譜読みちゃん@10/2 UTAU音源サンプル公開! (@Kifuyomi) 2018年10月4日
似た声の音源が見つからなかったので、あまり研究できていないのですが、雪歌ユフと闇音レンリは見ていました。画像は順に、雪歌ユフ連続音01・02、闇音レンリN_G4・C_G4の原音一式です。 pic.twitter.com/Ct1wVTWegd
つくよみちゃんは、というより中の人の声は、やっぱり10000〜15000Hzがうるさいのかな、と思います。
— 棋譜読みちゃん@10/2 UTAU音源サンプル公開! (@Kifuyomi) 2018年10月4日
とは言え、高音域の処遇はミックスの段階で各ユーザーに決めていただくべきことかも知れませんし、「高音域をカットすると伴奏に埋もれるからこのままでいい」というご意見もいただきました。
※追記2
合成エンジンについて。次の記事で簡単に比較しています。
ありがとうございます!
— 棋譜読みちゃん@10/2 UTAU音源サンプル公開! (@Kifuyomi) 2018年10月4日
エンジンについては、今のところはresamplerが一番安定しているようです。TIPSはギーギー、fresampはポコポコとしたノイズが入る傾向にありました。(原音設定をきちんとしたら変わるかも知れません)
Moresamplerはまだ試していませんでした。ご親切にありがとうございます!
【ブログ更新!】
— 棋譜読みちゃん@10/2 UTAU音源サンプル公開! (@Kifuyomi) 2018年10月9日
つくよみちゃんUTAU音源 合成エンジン比較 https://t.co/SXIjm5N8LP
前回の記事の補足として、つくよみちゃんAverageを様々な合成エンジンで出力したものを公開します。
比較したもの:resampler、TIPS、fresamp11、fresamp14
、tn_fnds、VS4U、bkh01、Moresampler
※追記3
イコライジングしたものとしていないもの、両方配布しちゃえば? というアイディアをいただきました。
確かに……! ライト層にもヘビー層にも使っていただける音源にしようと思うなら、それが一番親切ですよね!
最近も人によって意見が割れてたよねこの話
— ☆*・゚★カノン★・゚。*・☆ (@canon_73) 2018年10月4日
割れたけどどっちの言い分もわかる感じだったから、結局配布者がどんな層をターゲットにするのかで判断したら良い問題だと思う https://t.co/cY32w1v36X
私も興味のある話題だったもので
— ☆*・゚★カノン★・゚。*・☆ (@canon_73) 2018年10月4日
自分で何とかしちゃうから余計なことしないでほしい層と、Audacityとかでミックスしてる層で求めるものが全く違いそうなので、絞れないのならいっそEQ処理したものとしてないものを両方配布しちゃえば良いような気もします
そうなんですよね、本当におっしゃる通りです。
— 棋譜読みちゃん@10/2 UTAU音源サンプル公開! (@Kifuyomi) 2018年10月4日
どうしたものかと思っておりましたが、両方配布するという手もあるのですね! EQあり音源・なし音源という形で配布されているのを見たことがなかったので、目から鱗です。
本当に助かりました! ありがとうございます!
※追記4
遅ればせながら、「BRE」の存在を知りました。原音設定完了後、推奨エンジンとともにBREの推奨値も決めて、音源プロフィールに記載しておけば、サポートとしては十分かも知れません。
UTAUのシャリシャリ感についてですが、USTの音のプロパティでBREの値を下げる(デフォルトは50で、例えば40にするなど)と多少軽減できるようです! Vocoderのエフェクトで、声とホワイトノイズを混ぜる割合を決めるのと似た感じでしょうか。
— 棋譜読みちゃん@10/2 UTAU音源サンプル公開! (@Kifuyomi) 2018年10月9日
BREを100にしたら、見事にひそひそ声になって面白いです!
※追記5
ローカットとシャリシャリ感の関係について、次々回の記事で書きました。
【音声あり】つくよみちゃんUTAU音源 進捗報告
※追記6
他の方が配布されているUSTと伴奏データを使って、有名な楽曲を歌わせてみました。
大抵営利利用は禁止なので、クリエイターとして収入を得ている自分には公開することができませんが、「少女声音源を名乗れる声質」「ハキハキした発音」「伴奏に埋もれないブライトネス」を確認することができました。
この分なら、高音域を削ったバージョンはなくてもよいように感じています。
(続き)
— 棋譜読みちゃん@10/17 UTAU新動画UP! (@Kifuyomi) 2018年10月18日
つくよみちゃんUTAU音源用に、楽曲を自作する予定ではありますが、もし既存のボカロ・UTAU曲の中で営利利用OKなものがありましたら、教えていただけると助かります……!
※クリエイターとして収入を得ている場合は、作品を無料で公開しても広報活動=営利利用になると考えています。
音圧について
※詳しいUTAUの仕様を知っているわけではないので、想像に基づく記述が含まれます。
UTAUが音声を合成する際には、振幅が約0.5になるように、機械的に波形を持ち上げたり潰したりしているようです。
音声合成のためには必要なことなのだと思いますが、結果として、聞こえの上での音量=ラウドネスは文字によってばらつくことがあるように思います。
それをなるべく緩和するため、原音の段階で音圧調整をしたいのですが、通常の音圧調整でよいのか分かりません。
Audacityのエンベロープツールで、飛び出ているところのみへこませて、波形の曲線を損なわないようにすればOKでしょうか?(もちろん、へこませるのは母音の、しかも飛び出ている山の部分のみで、前後の子音や飛び出ていない部分は巻き込まないようにする)
ここは詳しい方からのご意見に従おうと思います。
※追記
自分でも音圧調整について実験してみましたが、ある理由によりよく分かりませんでした。詳細は次々回の記事をご覧ください。
【音声あり】つくよみちゃんUTAU音源 進捗報告
自分でできること、依頼したいこと
【依頼@】
・「要検討」音源を採用するかどうかについてのアドバイス
・
・原音の音圧調整についてのアドバイス
・全体的なアドバイス(あれば)
・エイリアスの付け方の決定(多音階音源というよりも、エイリアス接尾辞で使い分けるイメージですが、ユーザー視点で使いやすい状態になっていればどのようにしていただいても構いません)
↓
【自分】
・リップノイズ等の除去
・音圧の調整
・前後の無音部分のカット
・1文字目の母音開始時間を合わせる(その方が原音設定がやりやすいのではないか、という考え。不要なら無音部分のカット=大まかな統一のみ)
↓
【依頼A】
・原音設定
・必要があれば周波数表の修正(必要性の有無の判断は相手方におまかせ)
↓
【自分】
・デモソングの作成
↓
【依頼B】※依頼@Aとは別の方でOK。
・デモソングの調声
・他の音源と比べやすいよう、有名な曲でカバーを作っていただく
・UTAUアンケート
こんな感じでしょうか。
何せ初心者なので、重要なことが抜けているかも知れませんが、それも含めて依頼@でサポートしていただきたく存じます。
ひとまず今回のご報告は以上です。
アドバイス大歓迎です!