【サンプル音声あり】つくよみちゃんUTAU音源制作中! 清楚な少女声を目指して……【アドバイス大歓迎!】
2018年10月02日

【サンプル音声あり】つくよみちゃんUTAU音源制作中! 清楚な少女声を目指して……【アドバイス大歓迎!】

現在UTAU音源制作中です!

自分の声のUTAU音源というよりも、棋譜読みちゃん企画のマスコットキャラクター・つくよみちゃんのUTAU音源が作りたいので、「キャラ声」の再現を目指しています。

つくよみちゃんUTAU音源、及びつくよみちゃんというキャラクターそのものは、棋譜読みちゃんの枠を超えて、法人・個人問わず無断で商用利用できるフリー素材として配布したいと考えています!(クレジット表記は必須)

UTAUについては完全に初心者なので、ご意見・アドバイスをいただけますと、大変ありがたく存じますm(__)m



目指す声質


つくよみちゃんのイメージボイスはこれです。


清楚で透明感のある、やや儚げな高い声……というイメージです。

キャラクターとしては、献身的で健気な性格の14歳(人間換算)です。
絵から生まれたフェアリー的な存在で、物質的な肉体を持ちません。見てくれる人がいなければ存在できない、儚い存在です。
モチーフ及び座右の銘は「鏡花水月」。


目標とする系統のUTAU音源を探してみたのですが、「張りのある大人の声」や「元気なロリの声」の音源はあれど、「清楚な少女声」はあまり見つけられませんでした。おそらく、息成分の多い声を良音源にするのは難しいのでしょう。

しっとりとした大人っぽい声ということであれば、清楚系の音源もあるのですが、それはつくよみちゃんのイメージとは違います。
雪歌ユフが近いかも知れませんが、ユフもお姉さんですものね。

大人すぎずロリすぎず、12〜15歳の少女のボイスがいいんですよね〜。


※追記
モリス・モリという音源を知りました。今のところ、これが一番理想に近いです。
原音の声は意外と低いのですが、UTAUのフラグのgの使用や曲の音階の高さによって、大人すぎずロリすぎない、絶妙な少女感を実現しているようです。




これまでに収録した音源たち


最初に、自然体で収録した音源は、清楚さというか、おとなしさが足りませんでした。
下の動画で、その音声を聞くことができます。収録方法や、「UTAUとは何か」も簡単に説明しています。


※動画内で「原音調整」と書いているものは、「原音設定」の誤表記です。


それから、複数の音源を収録しました。
この下で公開していくのは、

・収録条件は音階以外上に埋め込んだツイートと同じ
・ホワイトノイズは除去済み
・リップノイズ等は未処理
・原音設定は自動でできるところまで
・連続音で収録しているが、原音設定をきちんとしていないので、最初の音だけ使って単独音的に鳴らしている

という状態のテスト音声です。

シャリシャリ感が気になるかも知れませんが、それについては後で改めて取り上げます。

歌わせている曲は、即興のオリジナル曲「テスト2」(←曲名)です。
原音
→簡易な喋り(唄詠不使用)
→女声曲によく使われる範囲の音
→合成音声歌唱でしばしば見られる超高音
→低音

の順で遷移していきます。

「仮の音源名(収録音階)」の形式で表記します。
まいこ様発案の「歌連続音」で収録しているので、実際には収録音階は2つありますが、低い方の音程を収録音階としています。

それでは、収録順にご紹介します!


◆つくよみちゃんCheerful(G4)



最初に録った音源。
前述の通り、つくよみちゃんの声としては元気すぎますが、朗らかに歌わせたいとき用の表情音源としては使えるかも知れません。


◆【没】つくよみちゃんWhisper(C5)



裏声で収録した音源。マイクの設定を間違えてPC内臓マイクで録ってしまい、音質が悪いため、没になりました。
しかし、高周波数に由来するシャリシャリ音がないという利点もあり、他の音源を作成する上でのヒントになるかも知れません。
また、裏声で収録してもウィスパー音源になるわけではないということが分かりました。


◆【没】つくよみちゃんTender(G4)



Cheerfulでの反省を活かし、優しい声になるよう心掛けた音源。
いい感じだと思ったのですが、上のWhisperと同様、マイクの設定ミスのため没になりました。


◆【要検討】つくよみちゃんDynamic(D5)



シャウト……は歌が下手すぎて無理だったので、ヘッドボイス的な裏声で収録した音源。
低音がふざけた声になるのは仕方ないとして、他の音源と比べて息成分が少なく、同じキャラクターの声として馴染まないので、没になりました。
追記:使用される方によっては使い道があるようなので、「没」から「要検討」に変更しました。


◆つくよみちゃんBreathy(A4)



裏声というよりも、ウィスパーボイスで収録した音源。
UTAUで出力される音がウィスパーボイスかどうかはさておき、少なくとも優しい感じの音になり、使い道のありそうな音源になりました。唄詠で喋らせるならこれが一番つくよみちゃんっぽい声になるようです。


◆つくよみちゃんAverage(G4)



CheerfulとBreathyの中間のイメージで、ウィスパー気味(完全なウィスパーにはしない)の地声(裏声にならないようにする)という微妙なラインを狙って収録した音源。
つくよみちゃんUTAU音源のイメージの中心に据えたいのですが、クオリティにやや不満&不安があります。


◆【要検討】つくよみちゃんFalsetto(D5)



ウィスパーとかヘッドボイスとか考えず、自分にとって出しやすい自然体の裏声で収録した音源。
高音部を歌わせたらいいんじゃないか……と思いきや、UTAUは原音より上の音を出すのは得意なので、必要ないかも知れません。他の音源より少しは高音が綺麗なような気がしますが、必要性については要検討です。


◆つくよみちゃんDeep(D4)



ここまでの音源だと低音に弱すぎるので、低音用に収録した音源。
「テスト2」で比較すると、最後の低音部を一番綺麗に発音できます。高めの音に使った時は、やや深い響きを持たせることができます。
唄詠で喋らせる時、低めの声にしたい場合はDeepがいい感じです。


◆つくよみちゃんAverage2(G4)



シャリシャリ感が気になってもう一度収録したAvarage。やっぱりシャリシャリになりました。
ほぼAverageと同じ感じで歌いますが、心なしかおとなしめかも知れません。Average(1回目)と最終的な出来を比べてみて、負けた方はもう片方の音が変な時のための「避難先」に回すことを考えています。


◆比較用:中の人の歌声(下手糞注意)



特に練習やテンポの確認を行わずに適当に歌ったので、音痴な上にかなり速くなってしまいました。
公開するのに勇気を要するほど下手糞。あくまでUTAUで生成した音声との比較用です。中の人がこれだけ下手糞ならば、UTAU音源を作る甲斐もあるというものでしょう!(ポジティブ)
歌ってみたOKです。最高音はE6(hihiE)ですけど……。


◆SofTalk&唄詠による文章読み上げ(2018.10.06追記)


BreathyとDeepを使用しています。
喋るのは結構得意な音源と言える気がします! 聞き取りやすいし、BGMに埋もれません。
また、SofTalkからの出力時にサンプリング周波数が22050Hzに落とされるので、高音域がカットされて耳に優しい音になります。



◆真面目な歌&リバーブ(2018.10.18追記)





周波数に由来するシャリシャリ感について


UTAUは多少ノイジーになるものですが、他のUTAU音源と比べてもシャリシャリ感が強いと思われます。

原音が雑音みたいな声なので(根拠のない自虐というわけではなく、静寂の中では通るが雑音には見事に紛れてしまうので、そうなのかなと)、UTAUに入れた時に雑音じみた仕上がりになるのも仕方のないことなのかも知れません。


とは言え、できるだけどうにかしたい……ということでまず考えたのが、原音の高音域を削ってしまうことです。

◆これが元のつくよみちゃんAverage(G4)

◆適当に高音域を削ったもの

◆もっと削ったもの(これはさすがにやりすぎ?)


しかし、「イコライジングは本来、ミックスの段階で、曲調・伴奏・演出に合わせて行うべきものだ」という考え方もあるでしょう。
それに、耳に刺さるような高音はなくせても、全体的なロボ声感はこれではなくせません。

よく分からないのですが、原音設定や周波数表によっても、音の質感が変わることがあるみたいですね……?

原音自体の高音域を削るべきかどうか、削るとしたらどのように処理するとよいのかは、詳しい方からご意見を伺って決めたいと思います。
アドバイスも大歓迎です!



※追記1
参考までに、Audacityでの周波数解析の結果を載せておきます。


※追記1のさらに追記




※追記2
合成エンジンについて。次の記事で簡単に比較しています。




※追記3
イコライジングしたものとしていないもの、両方配布しちゃえば? というアイディアをいただきました。
確かに……! ライト層にもヘビー層にも使っていただける音源にしようと思うなら、それが一番親切ですよね!





※追記4
遅ればせながら、「BRE」の存在を知りました。原音設定完了後、推奨エンジンとともにBREの推奨値も決めて、音源プロフィールに記載しておけば、サポートとしては十分かも知れません。



※追記5
ローカットとシャリシャリ感の関係について、次々回の記事で書きました。
【音声あり】つくよみちゃんUTAU音源 進捗報告


※追記6
他の方が配布されているUSTと伴奏データを使って、有名な楽曲を歌わせてみました。
大抵営利利用は禁止なので、クリエイターとして収入を得ている自分には公開することができませんが、「少女声音源を名乗れる声質」「ハキハキした発音」「伴奏に埋もれないブライトネス」を確認することができました。
この分なら、高音域を削ったバージョンはなくてもよいように感じています。




音圧について


※詳しいUTAUの仕様を知っているわけではないので、想像に基づく記述が含まれます。

UTAUが音声を合成する際には、振幅が約0.5になるように、機械的に波形を持ち上げたり潰したりしているようです。
音声合成のためには必要なことなのだと思いますが、結果として、聞こえの上での音量=ラウドネスは文字によってばらつくことがあるように思います。

それをなるべく緩和するため、原音の段階で音圧調整をしたいのですが、通常の音圧調整でよいのか分かりません。
Audacityのエンベロープツールで、飛び出ているところのみへこませて、波形の曲線を損なわないようにすればOKでしょうか?(もちろん、へこませるのは母音の、しかも飛び出ている山の部分のみで、前後の子音や飛び出ていない部分は巻き込まないようにする)

ここは詳しい方からのご意見に従おうと思います。

※追記
自分でも音圧調整について実験してみましたが、ある理由によりよく分かりませんでした。詳細は次々回の記事をご覧ください。
【音声あり】つくよみちゃんUTAU音源 進捗報告


自分でできること、依頼したいこと


【依頼@】
・「要検討」音源を採用するかどうかについてのアドバイス
シャリシャリ感についてのアドバイス ※追記にあるように、いろいろ情報をいただきましたので、なくても大丈夫になりました。
・原音の音圧調整についてのアドバイス
・全体的なアドバイス(あれば)
・エイリアスの付け方の決定(多音階音源というよりも、エイリアス接尾辞で使い分けるイメージですが、ユーザー視点で使いやすい状態になっていればどのようにしていただいても構いません)

 ↓

【自分】
・リップノイズ等の除去
・音圧の調整
・前後の無音部分のカット
・1文字目の母音開始時間を合わせる(その方が原音設定がやりやすいのではないか、という考え。不要なら無音部分のカット=大まかな統一のみ)

 ↓

【依頼A】
・原音設定
・必要があれば周波数表の修正(必要性の有無の判断は相手方におまかせ)

 ↓

【自分】
・デモソングの作成

 ↓

【依頼B】※依頼@Aとは別の方でOK。
・デモソングの調声
・他の音源と比べやすいよう、有名な曲でカバーを作っていただく
・UTAUアンケート


こんな感じでしょうか。
何せ初心者なので、重要なことが抜けているかも知れませんが、それも含めて依頼@でサポートしていただきたく存じます。

ひとまず今回のご報告は以上です。
アドバイス大歓迎です!

スポンサーリンク
posted by Rei Yumesaki at 20:39 | 制作日記 音声作品 | 更新情報をチェックする
【サンプル音声あり】つくよみちゃんUTAU音源制作中! 清楚な少女声を目指して……【アドバイス大歓迎!】
先月の人気記事 TOP5