Vocaloid初音ミクMikuMikuDanceという驚愕のソフトウェア

  【リンクフリー】 私設研究所ネオテックラボ Neo-Tech-Lab.co.uk
【記載者】 上田智章 ☆Tomoaki Ueda☆ NTLMMD

 
ここにチェックボックス型外部コンテンツ・メニューが入ります。




【ブラウザはGoogle Chrome】

●最新版ダウンロードはこちら

【お知らせ】

現在、特にお知らせする事項はありません。

【メニュー】 PMDファイルの構造に関する記述や、Excel VBAでPMDモデルを3次元表示するあふぉな試みなど。
  【Excel VBA編】【ソース公開中】 ●ポリゴン・フィルとテクスチャー・マッピング  ●透視変換  ●光源計算
  【NyARToolkitCSで拡張現実編】【ソース公開中】 ●【ポリゴン、テクスチャーマッピング、Sphere Mapping編】  ●【表情処理編】
  【拡張現実センサ編】 ●AR sensor(拡張現実センサ)
  【予想】●IK bone制御[ただのメモだよ]
  【過去記事メニューへ】 【期間】2008/03/11~                      【English page】

■記載日2011年02月03日■18:55頃記載
【μ-iVoiceのハードウェア版】
ミク型ターミネータ開発に向けて、人工声帯とするべく、ハードウェアを製作してみました。
本体の頭脳部分は今のパソコン性能では何年か先でしょうけど。
やはり数百台規模の広域分散処理ネットワークでないと無理か。



■記載日2011年01月15日■14:43頃記載
【μ-iVoice Version0.09】
データベースの構築はまだこれからですが、漢字を自動的にひらがなに読み替える機能を付与したμ-iVoice Version0.09を公開しました。
ローカルにある音声データの組み込み機能もVersion0.08で加わっています。
Excel VBAの音声データ録音・編集ツールで任意話者の音声データを作成し、組み込むことができるようになりました。
予備実験で確認した限りでは、将来的には、『あいうえお』の5音を登録するだけで、任意の人の声をものマネできるようになりそうです。
実は母音である『あいうえお』以外の音声は子音と母音で構成されているのですが、子音の部分だけ取り出して聞いても、
広帯域スペクトルを持った過渡的な音声なので、性別はおろか誰の声かもわからないのです。
母音の部分だけを別人の母音で置き換えてみると、そっくりな声に聞こえてしまうから不思議です。
開発中の自動編集ツールで、この辺のブレンドを解決できるのではないかと考えています。
将来的には『あいうえお』の録音だけで、音声置き換えが可能になるだろうと考えています。
置き換えが困難なのは、な行、ま行、ん等です。これを解決できればいいのですが。

Version0.09では漢字データベースを中心に取り組みましたが、
実は、漢字データベースに制御スクリプトを使うこともできるので、将来的にはアクセントも自動変換できるようになっています。
残された課題の中での問題点は、音声データの転送バイト数削減です。圧縮するか、データ構造の見直しを行う必要がありそうです。
この辺りのソフトウェア技術は古くから取り組まれている分野なのですが、私には激しく異分野なので勉強する必要があるのです。


【図】ローカルにある音声データ組み込み機能の一部を使ったデモの例
ローカルにある画像ファイルをドラッグ・ドロップすると......

漢字辞書をある程度充実させたら、今度はWebGLに戻ってBoneと表情をなんとかしよう。
漸く、Web Agentへの接続が見えてきた気がする。

■記載日2011年01月09日■03:12頃記載
【テスト版μ-iVoice】
まだ、いろいろ復旧できていませんが、Ver.0.07β版のμ-iVoiceをアップしてみます。
昨年、ブラウザの改訂で動作しなくなったのはどうやら型付配列(Uint8Array等)のindexOfが1MB以上だと動作しなくなっているからのようです。
セキュリティー対策にしては手抜きなので、ブラウザのバグの可能性が高そうです。

【μ-iVoice】『JavaScriptだけで音声合成/シンセサイザをサイトに実装するAPI』

 (第2次試作2011/12/29/~2012/01/09/)
μ-iVoiceはプラグインに頼らずにJavaScriptだけでシンセサイザ/音声合成/ボーカロイドをホームページに実装するAPIです。 ハードウェア技術であるDDS(Direct Digital Synthesizer)の変形アルゴリズムで実現しました。Version0.06では、音声データをAI学習させたデータを使用していましたが、Version0.07以降は音声データをブラウザ上で加工する方式に変更しました。今後は音質改善に取り組みます。
現状はひらがな入力のみに対応しています。抑揚を付けるための簡単な制御文字も持っています。自動抑揚変換も開発中です。
対応ブラウザは、Google Chrome、Mozilla Fire Fox、Apple Safariです。IEは.wav形式オーディオファイル再生に対応していないので利用できません。将来的には、ブラウザにNaCl(Native Client)+Pepperが標準実装されるようですから、漢字入力から発音させるまでを全部ブラウザ上で行うことも可能でしょう。テキスト化したMIDIデータから演奏する機能も備えています。近いうちにAltera社のCPLD(MaxII)で音声合成チップを製作する予定です。
 ●【web.fc2.com】【μ-iVoice】
 ●【geocities.jp】【μ-iVoice】
 ●【sites.google.com】【埋め込みμ-iVoice】

■記載日2012年1月7日■16:20頃記載
【μ-iVoice Webで使える音声合成API。もうすぐ公開?】
JavaScriptだけで実現する音声合成API μ-iVoiceの開発をしています。
主要ブラウザ側でセキュリティー関連の変更があったらしく、大きな容量のJSONP受け渡しに問題が発生したので、100程ある抜け道から1つを選んでコーディングし直しました。
音声データベース、ドラム音データベース共に、モノラル, 16bit, 22.05kSPSで作成してみました。
次のバージョンでは、音質を向上させるための処理を加える予定です。
Google Text-To-Speechのようにパラメータ付URLで発声したり、ブログなどでも使えるように追加の作業を行っています。
より人間の発音に近い自然な音声合成を行うために下のようなスクリプト型に変更しようとしています。
音の高さをC#4、F5のように指定し、音の長さをL10, L5のように指定、音の強さをV5, V7のように指定するようにします。
次のバージョンでは、こんな感じで入力するようになります。
 A4L10V7こB4んにちわ。A4はB4つねみG4くなのA4L14よろしくL20ね。
スクリプトが面倒な人向けにC#版コンポーザも試作開始しました。

【実験サンプル】『なんちゃってミク』声版 (base64形式データコンテナを使った改良版)


図 C#で製作中のイントネーション等を編集できる音声合成コンポーザ

【過去記事メニュー】

【↓記事へのリンク】

【↓記事題名】

記載日2010年11月19日~2011年12月25日の記事 記載日2010年11月19日~2011年12月25日の記事
■記載日2011年12月25日■
■記載日2011年12月07日■
■記載日2011年11月09日■
■記載日2011年10月06日■
■記載日2011年9月12日■
■記載日2011年8月12日■
■記載日2011年8月9日■
■記載日2011年7月31日■
■記載日2011年7月30日■
■記載日2011年7月16日■
■記載日2011年7月7日■
■記載日2011年7月2日■
■記載日2011年7月2日■
■記載日2011年7月1日■
■記載日2011年6月27日■
■記載日2011年6月13日■
■記載日2011年6月10日■
■記載日2011年6月10日■
■記載日2011年6月4日■
■記載日2011年5月24日■
■記載日2011年5月9日■
■記載日2011年5月8日■
【またなんかブラウザの仕様が変更になったかも?】
【MMDのダウンロードページにボタンを発見!】
【MMD最新版Version7.39.dotリリース!】
【MMD海外ユーザーにKinect導入者が増え始めた】
【MMD世界傾向】
【Web シンセサイザ/ボーカロイドを一から製作してみた】(第1次試作)
【Web シンセサイザ/ボーカロイドを一から製作してみよう】
【MikuMikuDanceは開発終了?】
【Pocaloid2って何ですか?】
【WebGLでPMDを表示してみた】
【WebGLでちびミクを表示してみた】
【Kinect for Windows SDK Betaをインストールしてみた】
【FireFox5でWebGLを動かそうとすると発生する不具合】
【FireFox5でWebGLを動作させるには?】
【FireFox5.0ではWebGLでCross-DomainイメージをTextureにできなくなった件】
【WebGL / bullet.js のデモを見つけました】
【WebGLに関する解り易いページは?】
【Vocaloid3 Editorが今秋発売予定】
【WebGLが面白そう】
【MikuMikuDanceのモデルデータにPMX仕様が追加された模様】
【OpenNI.Net.dllが仕様変更になった件】
【米ToyotaのCollora CMにMiku登場】
■記載日2011年5月5日■
■記載日2011年5月3日■
■記載日2011年4月8日■
■記載日2011年4月5日■
■記載日2011年3月31日■
■記載日2011年3月26日■
■記載日2011年3月25日■
■記載日2011年3月24日■
■記載日2011年3月23日■
■記載日2011年2月5日■
■記載日2011年2月4日■
■記載日2011年1月29日■
■記載日2011年1月27日■
■記載日2011年1月27日■
■記載日2011年1月27日■
■記載日2011年1月23日■
■記載日2011年1月20日■
■記載日2010年11月19日■
【Google翻訳の音声合成の件、記事を分離します】
【Google翻訳の音声合成が凄い件】
【コミPo!がまた進化したらしい】
【KinectのC#による使い方】
【Kinectが反転していた理由】
【Kinectが左右反転している件】
【OpenNIでIR, image共に左右反転している件】
【KinectをC#で使う方法は? その2】
【KinectをC#で使う方法は?】
【MMDのKINECT】その2
【MMDのPMDで拡張現実:Bone制御のテスト】
【MMDのPMDで拡張現実:表情のテスト】
【MMDのKINECT】
【PMDで拡張現実】Sphere Mappingにトライ(続き)YouTubeメモ動画
【PMDで拡張現実】Sphere Mappingにトライ
【PMDで拡張現実】
コミPo!(その3)
NyARToolkitCSで遊んでみました
記載日2010年12月10日 コミPo!(その2)
記載日2010年11月10日 コミPo!って知ってます?
記載日2010年10月29日 イギリスで初音ミクが人気
記載日2010年08月04日 PMDデータを再利用されにくくする方法
記載日2010年07月31日 PMDデータに著作権はあるのか?
記載日2010年07月22日 Holophonics Augmented Realityに挑戦中
記載日2010年06月27日 【YouTubeで樋口優さんのチャンネル発見!
記載日2010年06月20日 【待望のKumane Mikuの動画が完成したとのこと】
記載日2010年06月15日 【Panoramio向け写真閲覧用公開ツール上でMikuMikuDanceの布教活動】
記載日2010年06月13日 【MikuMikuDanceに実装された機能に今頃気が付いたよ】
記載日2010年06月08日 【やっぱりなかなか速度がでない。ぱらぱらならどうだろうか。】
記載日2010年05月23日 【初音ミクが『あかつき』に搭乗。宇宙へ。】
記載日2010年04月16日 【Mikuが逆パターン[実写⇒カメラVMD]を発見。それに続いて同パターン先行事例も。】
記載日2010年04月15日 【VMDデータってどうなっているんでしょ?】
記載日2010年04月10日 【ARToolKitを少しいじってみる(続き2)】
記載日2010年04月09日 【ARToolKitを少しいじってみる(続き)】
記載日2010年04月07日 【ARToolKitを少しいじってみる】
記載日2010年04月03日 【VBAのバグ直しておきました】
記載日2010年04月02日 【久しぶりにVBAを触ってみる】
記載日2010年04月01日
記載日2010年04月15日
(セルフ・シャドウに関して勘違いに勘違いを重ねたので記事移動してまとめます。)
記載日2010年03月15日 【えぇ?設定ミス?】
記載日2010年03月13日 【ちょっと忘れていたけど動画削除対応をMikuに移管する】

過去記事・メニューの表示】 チェックを入れると2008年3月11日~2010年2月までの記事メニューがプルダウン表示されます。