語音編碼質量的評定
在語音編碼技術中,對語音質量的評價是一個很重要的問題。如何評價語音編碼質量也成為語音編碼領域所研究的一個重要課題。對此多年來人們提出了許多方法,歸納起來大致可分為兩類,即客觀評定方法和主觀評定方法。
客觀評定方法用客觀測量的手段來評價語音編碼的質量,常用的方法有信噪比、加權信噪比、平均分段信噪比等。它們都是建立在度量均方誤差的基礎上,其特點是計算簡單,但不能完全反映人對語音質量的感覺。這個問題對于速率為16Kbit/s以下的中、低速率語音編碼尤為突出,因此主要適用于速率較高的波形編碼類型。
主觀評定方法符合人類聽話時對語音質量的感覺,因而目前得到廣泛應用。最主要的主觀評定方法是主觀評定等級(Subjective Opinion Scale),或稱平均評定得分(Mean Opinion Score,縮寫MOS)。MOS得分采用五級評分標準,其方法是,由數十名試聽者在相同信道環境中試聽并給予評分,然后對評分進行統計處理,求出平均得分。由于主觀和客觀上的種種原因,每次試聽所得的評分會有波動。為了減小波動的誤差,除了試聽者人數要足夠多之外,所測語音材料也要足夠豐富,試聽環境也應盡量保持相同。
在這里要特別需要說明的是,試聽者對語音質量的主觀感覺往往是和其注意力集中程度相聯系的,因而,對應于主觀評定等級,還有一個收聽注意力等級(Listening Effect Scale)。下表給出主觀評定等級的質量等級、分數和相應的收聽注意力等級。
主觀評定等級表
質量等級 |
分數 |
收聽注意力等級 |
優 |
5 |
可完全放松,不需要注意力 |
良 |
4 |
需要注意,但不需明顯集中注意力 |
滿意(正常) |
3 |
中等程度的注意力 |
差 |
2 |
需要集中注意力 |
劣 |
1 |
即使努力去聽,也很難聽懂
|
從用戶角度看,通常認為MOS分4.0~4.5分為高質量語音編碼,達到長途電話網的質量要求。MOS分3.5分左右稱作通信質量,這時聽者能感覺到語音質量有所下降,但不影響正常的通話,可以滿足多數通信系統使用要求。MOS分3.0分以下常稱為合成語音質量,這種語音一般只有足夠高的可懂度,但是自然度較差,不容易識別講話者。
語音編碼技術標準的制定,對數字語音技術的實用化和發展起到了推動作用。
[上一頁] [下一頁]
|