speech

名詞
1)ことば,話し言葉,言語
2)一国(地方)のことば,国語,方言
3)ものを言う力,言語能力
4)談話,会話,話しぶり,話し方
5)演説,講演
6)(楽器の)音色,響き
7)【文法】話法


コンピューター業界
 コンピュータで処理するメッセージなどの聴覚情報。 人間にわかりやすいので,多くの応用分野でディジタルデータとしての入力法,データ圧縮,音声合成,応答出力などの研究が進んでいる。
 音声による Web の利用を可能にするために W3C は『音声入出力インタフェースフレームワーク』を用意し,それには VoiceXML,SSML,SRGS,CCXML,Semantic Interpretation for Speech Recognition,などが含まれる。


音声圧縮
 音声は元々アナログデータで,これをデジタル的に圧縮するには,デジタルデータに変換しなければならない。 この変換の代表的なものに PCM というコーデックがあるが,これでデジタル化したデータ は非常に巨大で,非常に扱い難い。 そこで,ADPCM と呼ばれるコーデックが登場し,この後継として初期の MD に使われていた ATRAC が開発された。 その後,更に圧縮率を改善した後継の ATRAC2 に移行した。 これと時を同じくして MP3 が登場した。 さらに,国産のコーデックである TwinVQ が開発され,その高い圧縮率から MPEG-4 にも採用された。



spoken language processing 音声言語情報処理

 人工知能の研究分野のひとつで,音声による言語情報を記号情報化し,同音異義語判断など(言語処理)を経て, 文字情報に変換し,知識情報処理(概念処理)へつなげる。 音声入力は,他の入力手段に比べ自然な入力法で今後の発展が期待されている。 また文字コードによる表現を自然な音声出力とする音声合成など(対話処理)を行い,自然言語対話処理システムを目標とする研究分野でもある。



speech synthesis 音声合成

 コンピュータ上のデーターを音声で出力するために,データーに対応する音声を合成して作ること。 代表的な方法に,人間の声を文・節・語単位にあらかじめ登録しておき選択編集する選択合成法。 音声を分析してその特徴をバラメータ化して圧縮記憶させたものから編集する分析合成, 人工音声を一定の方法で合成する法則合成などがある。 分析合成では,文章の解析,抑揚やリズムの作成,母音や子音を組み合わせなどが分析されるらしい。
 音声合成技術は,入力データのチェックのための読み合わせやワープロ文書の読み上げ, コンピュータの出力を電話で伝える場合などに有効。 NTT の電話番号案内,高速道路の運行状況案内,パソコンではテキストファイルの読み上げプログラムなどで実用化している。


規則合成
 音声合成の一方式,音素・音節などの単位で合成する。 どうしてもアクセントに乏しい無機質な発声になる。

録音編集
 音声合成の一方式,単語・フレーズ単位で録音した音声を編集する。 予め用意した単語しか発音できない。



audio response unit(ARU) 音声応答装置

 電話などの問い合わせやアクセスに対して,コンピュータから音声で応答する装置。



  • 音声入出力インターフェースフレームワーク
  • 音声認識
  • Voice Extensible Markup Language(Voice XML)



    AudioEncoder
     WAVE/MP3/WMA/Ogg Vorbis/Monkey's Audio/Twin VQ 形式などの音声ファイルを相互変換できるフリーソフト。 2003年4月3日に v2.03d を公開,対応は Windows 2000/XP。 動作には .NET Framework が必要。
    サイト:http://kazuki.s18.xrea.com



    Pazera Free Audio Extractor
     AVI/WMV/MPEG/MOV/FLV 形式などの複数動画から音声を一括抽出できるソフト。 2008年3月17日 v1.0 が公開,対応 OS は Windows。
    サイト:http://www.dhost.info/jack1024/index_en.php



    QuickAudio
     MP3/Ogg Vorbis ファイルを直接読み込める波形編集ソフト。 ノーマライズやフェードイン・アウト,音量変更などができる。 MP3 音声から必要な部分だけを切り出すといった簡単な編集が手軽に行える。 2007年9月 v2.00.1 が公開,対応 OS は Windows。
    サイト:http://www.sionsoft.com



    RH1FFT
     音声をリアルタイム解析して周波数分布を“ソノグラフ”で表示できるシェアウェア。 指定したWAVEファイルやマイクなどから入力された音声をリアルタイムで解析し,縦軸で周波数,横軸で時間,色で音量を表した“ソノグラフ”で表示できる。  2007年8月19日 v2.21 が公開,対応 OS は Windows 2000/XP。
    サイト:http://www.asahi-net.or.jp/~es3t-kbt/fft



    Sazanami
     高機能リバーブなど多彩なエフェクトを備え,WAVE/MP3/WMA/Ogg Vorbis形式などに対応したシェアウェアの多機能波形編集ソフト。
     2008年5月29日 v1.5 が公開。 主な変更点は,複数のエフェクトをあらかじめ指定した順番で一括してかけられる“効果の連結実行”機能が追加されたこと。 “効果の連結実行”機能ではエフェクトの組み合わせを“プリセット”として保存することも可能。
    サイト:http://hp.vector.co.jp/authors/VA027069



    Wavosaur
     VST エフェクトや ASIO ドライバーに対応した音声編集ソフト。 WAVE/MP3/AIFF/AU 形式のほか,サンプラー“AKAI S1000”形式の音声などを読み込める。 VST エフェクトは音声を再生しながらリアルタイムでかけることが可能なほか,指定した順序で複数のエフェクトを一括してかけることもできる。 編集した音声ファイルは WAVE 形式で保存できる。 2007年7月1日 v1.0.0.9000 が公開,対応 OS は Windows。
    サイト:http://www.wavosaur.com


    Wavosaur v1.0.2.0
     2008年3月25日公開。 主な変更点は,波形からリズムを自動検知して分割する“Auto slice region”機能が追加されたこと。



    戻る 英語『S』最初のメニュー