用TTS技術開發具有文本朗讀功能的應用程序(轉)之一(2008-05-15 20:21:33)轉載標簽:聲音的合成ttsit 分類:相關學術
摘 要:TTS技術已經越來越廣泛地應用到現代計算機的各個領域,本文介紹了利用微軟的Microsoft Speech SDK 5.1提供的TTS(text-to-speech)技術開發具有語音朗讀功能的應用程序。
關鍵字:語音合成;TTS;發聲引擎
中圖分類號:TN912.33;TP311.52 文獻標識碼:A
Create speech-enableed Apllications with TTS Technology
Abstract: The TTS technology is more and more popular in modern computer, this article introduces How to Create speech-enableed Apllications use the Microsoft Speech SDK 5.1
Key word: Speech Synthesis;TTS;speech Engine
1.TTS技術概述
上世紀90年代中期以來,隨著個人計算機的硬件和軟件功能越來越強,和現代語音技術的發展,以前在科幻電影中才能看到的會說話的電腦已經成為現實。而TTS技術正是電腦能夠說話的關鍵技術之一。
TTS是text-to-speech的縮寫,英文也稱Speech Synthesis即語音合成。語音合成就是一個將文本轉化為語音輸出的過程,這個過程的工作主要是將輸入的文本按字或詞分解為音素,并且對文本中的數字、貨幣單位、單詞變形以及標點等要特殊處理的符號進行分析,以及將音素生成數字音頻然后用揚聲器播放出來或者存為聲音文件以后用多媒體軟件播放。
當應用程序需要發聲的時候就調用語音合成引擎(SPEECH SYNTHESIS ENGINE)進行語言合成,將文本處理后通過揚聲器用近似于人的聲音“讀”出來,通常還可以通過改變對語音引擎的設置改變“說話” 的速度,聲音頻率(低沉或者尖銳),聲音大小,還能模擬口形、唇形和舌位的變化對聲音的影響。面前計算機通過語音合成發出的聲音效果聽起來就象是錄音磁帶發出的聲音。
與一些用預先錄制的聲音文件實現發聲的應用程序相比,TTS的發聲引擎只有幾兆大小,不需要大量的聲音文件支持,因此可以節省很大的儲存空間,并且可以朗讀預先未知的任何語句。現在已經有許多應用軟件應用TTS技術實現語音功能,例如一些播音軟件可以用來讀小說或作校對工作,還可以朗讀電子郵件,一些電子詞典可以讀出單詞,還可以用于查詢中心自動播放服務信息等。
2.關于Microsoft Speech SDK
|
|