HOME > 製品カテゴリ > 音声合成ミドルウェア 概要  |  SDK  |  サンプル音声

VOStalkとは

VOStalk(ボストーク)は、旭化成の音声技術をもとに開発されたコンパクトな音声合成ミドルウェアです。
低演算量・低メモリサイズでありながら、高音質でナチュラルな韻律生成を実現しています。




特長

  • さまざまな読み上げ方に対応
    • 漢字かな混じり文および中間表現形式(アクセント付かな文字)を読み上げ可能
    • 声の特徴を簡単にコントロール
      • 読み上げ速度/ポーズ長/音の高さ/音量/イントネーションの強さ
        /声の太さ/周波数特性
      • 高性能な分析合成により音質劣化を低減
    • 数字・アルファベット読み上げモードの選択が可能
      • 電話番号、位取り数字を識別し、自然に読み上げる通常モード
      • 個々の文字を独立して読み上げる棒読みモード(例:製品番号)
    • ユーザ辞書と標準テキスト辞書の併用により、特定単語の読み上げ方を追加可能

  • 組み込み用途に適したソフトウェア
    • 長い文章では最適な位置で自動分割してメモリと演算量を節約
    • 必要使用メモリ量を事前に確認・設定でき、メモリ管理が容易
  • エンジン仕様
    • テキスト解析処理エンジン(TTIエンジン)と音声合成エンジン(ITSエンジン)の2エンジン構成
    • 22.050kHz, 16kHz, 11.025kHz, 8kHz のサンプリング周波数をサポート


    【VOStalk®】
    • コンパクトな波形辞書サイズ
    • 女性2声・男性1声
    • 楽譜記号付かな文字で歌も歌える
    【VOStalk® advanced】
    • 快活で自然な韻律、滑らかな音質
    • 女性1声



▲ページのトップへ

対応プロセッサ/プラットフォーム

VOStalk®エンジンはANSI C準拠で作成のためOS非依存になっています。
以下は、対応可能な例です。

  • 対応プロセッサ
    • RISC
      • ARM (ARM7, ARM9, StrongARM, XScale)
      • SH (SH2, SH2A, SH3, SH4, SH4A)
    • Pentium互換

  • 対応OS
    • 組み込み系
      • μ-iTRON
      • VxWorks
      • WindowsCE
      • Windows Automotive
      • PocketPC
      • Windows Mobile
      • Android
      • Embedded-Linux
    • PC
      • Microsoft Windows
      • PC-Linux

▲ページのトップへ

対象製品カテゴリ

  • カーナビゲーション
  • テレマティクス
  • ETC端末
  • 携帯端末
  • 業務用端末
  • ゲーム音声
  • 音声応答システム
  • 家電製品
▲ページのトップへ




メモリサイズ例



  音声合成製品
  VOStalk® VOStalk® advanced
ROM エンジンライブラリ
(組み込みエンジン
典型例)
190kB程度
(テキスト解析部 100kB
+ 音声合成部 90kB)
200kB程度
(テキスト解析部 100kB
+音声合成部 100kB)
波形辞書 410kB / 360kB / 270kB / 150kB
(22kHz / 16kHz / 11kHz / 8kHz)
2.9MB / 2.6MB / 2.1MB / 1.9MB
(22kHz / 16kHz / 11kHz / 8kHz)
韻律辞書 150kB 460kB
テキスト解析辞書 3.3MB / 2.3MB / 1.7MB
( 大語彙 / 中語彙 / 小語彙 )
3.3MB / 2.3MB / 1.7MB
( 大語彙 / 中語彙 / 小語彙 )
RAM ワークエリアサイズ
(典型例、エンジン・オブジェクト含む)
230kB程度
(テキスト解析部 200kB
+音声合成部 30kB)
240kB程度
(テキスト解析部 200kB
+音声合成部 40kB)


    ※エンジンライブラリサイズはコンパイラ依存
    ※RAMサイズは韻律生成パラメータに依存、一度に処理する最大テキスト長に依存
    ※波形辞書の作成に(株)国際電気通信基礎技術研究所及び(独)科学技術振興機構の
    音声分析変換合成法STRAIGHTを利用しています。
    ※テキスト解析辞書は奈良先端科学技術大学院大学のIPADICのテキストデータベースを
    元に拡張して作成しています。
    ※VOStalk®エンジンライブラリ及び辞書等をシステム・アプリケーションに組み込んで
    再配布・販売する場合には、別途量産ライセンスが必要です。
▲ページのトップへ