« イエデンで悩む | トップページ | 害虫駆除用銃で悩む »

2013年6月 9日 (日)

ボーカロイドを分析して悩む

悩むくらいだったら分析なんてしなければいいのに・・・、てなことを言うアナタ、オタク体質を理解していませんね~。まぁそんなもの理解したってなんの役にもたちませんけれどもね。でも、分析したから悩むのか、はたまた悩むために分析するのか、とか、まぁそんなことはどうでもいいのだ。

とっかかりは、作ってみた「Understand Me」の最初の部分で「ア」系の発音がなんだか不自然だなぁと感じたことだった。特にこの「アンダースタン・ミー」の「ダー」のところの発音がなんだかハスキーすぎるというか、なんだか不自然だなぁ、ここんところがもうちょっとなんとかなれば本当に人間が歌っているように聞こえなくもないのになぁ、と。

Vocaloid3 Editor(以下V3Eと略)では、「Understand」という単語を辞書を引いて「V n d @r s t { n d」というV3Eの内部発音記号に展開する。問題はこの「@r」の部分だ。 マニュアルを見ると、「@r」には特に記述がなくてその代わりに「@」のところには「シュワ(あいまいな母音)」と書いてある(図はマニュアルからの一部引用)。

V3eman4 「シュワ」って何? 日本語ですかそれ? ボーカロイドが手話? シュワルツネガーと何か関係がある? 他の母音記号にはなんにもコメントがなくて「@」にだけ「シュワ」って? などなど突っ込みどころ多数なのだが、結局のところなんだかサッパリ分からない(ガリレオふう)。

で、その周波数スペクトルを取ってみたのが次の図だ。なんだか高域までチャラチャラといろいろ入っているが、-60dB以下は多分聞こえないだろうと思うので無視して、どうも赤く囲んだ部分がうるさく耳に付いているんではないか、という気がする。




R8barspec

実際にこのスペクトル解析を行った音をmp3にしてあるので聞いていただこうか。

「r8bars.mp3」をダウンロード

だから、この音声ファイルから3khz以上をバッサリを切り落とせるようなチェビシェフ・フィルタみたいなのがWindowsのアプリケーションとしてないものかと探してみたのだが、意外とないもので、Mathmaticaとかなんだかそういう数学ライブラリには入っていたりするんだろうか? SourceForgeを探してみたが、やはりそういうプロジェクトもないようだし。
Windows上でWaveファイルを処理できるデジタルフィルタって、意外と便利なんじゃないかと思うんだが、誰か作ってくれないかな。

しかたがないので、昔学校で習ったZ変換とかで何とかやってみようと思ったのだが、WEBにあるZ変換のサイトを見てもこれまたさっぱりわからない。これは原義に立ち返ってちまちまとプログラムを書くしかないんだろうか? perlで書いてみたらファイルの入出力だけで30分かかったりして非常に遅い。メモリの利用効率が悪いので、こういう多量データの計算には向いてないんだろうなぁ。Cで書くか?それもめんどくさいなぁ。

仮計算をしてみると、そもそも16bitPCMオーディオというのが計算には全然向いていないっていうか、デジタルフィルタ的計算をやろうとすると計算精度が全然足りない。確かに16bit44.1kサンプル/秒というのはオーディを記録するにはいいんだろうけど計算するにはその倍以上の精度が必要なようだ。これは結構めんどくさいぞ。

というわけなので、Z変換をはじめとするデジタルフィルタなんかを再履修中。

翌日追記:
恥ずかしながら今まで知らなかったのだが、シュワっていうのはこれのことだったらしい。
Schuwa
この発音記号のことをシュワ(Schwa)っていうのかっ!? 何語だよっ?!

この発音記号はよく知っているが、「あいまいなア~」とは知らなかった。

これはさりげなく発音できると英語がうまく聞こえるらしいぞ。

(つづく)

|

« イエデンで悩む | トップページ | 害虫駆除用銃で悩む »

プログラミング」カテゴリの記事

コメント

ん?mp3へのリンクが表示されないな? なんでだろう?

投稿: Picks Clicks | 2013年6月 9日 (日) 21時45分

コメントを書く



(ウェブ上には掲載しません)




« イエデンで悩む | トップページ | 害虫駆除用銃で悩む »