歡迎來到通信人在線![用戶登錄] [免費注冊]

幾種低速率語音編碼器的合成語音質量的主觀和客觀評價指標

瀏覽:8597  來源:通信人在線  日期:2020-03-02

在語音編碼技術中,合成語音質量可以說是語音編碼性能的最根本指標。評價合成語音質量的方法很多,多年來人們提出的許多方法歸納起來可以分為主觀評價方法和客觀評價方法兩類。常用的主觀評價方法有3種:平均意見得分(MOS)、判斷韻字測試(DRT)和判斷滿意度測量(DAM)。客觀評價常采用改進的巴克譜失真測度(MBSD)評價方法。對于低速率(4.8Kb/s以下)語音編碼技術常采用激勵型線性預測編碼算法。下面給出幾種低速率(4.8Kb/s以下)語音編碼技術的合成語音質量的主觀和客觀評價指標,它們是LPC-10(二元激勵線性預測語音編碼)、FS-1016(碼激勵線性預測語音編碼)、AMR(混合激勵線性預測語音編碼)、新FS-1015(混合激勵線性預測語音編碼)和INMAARSA-M(改進型多帶激勵語音編碼)5種編碼標準。

1、主觀評價指標

1分別給出了上述5種編碼標準聲碼器在無噪聲時的主觀評價(MOSDRTDAM)測試結果。

15種編碼標準聲碼器在無噪聲時的合成語音質量主觀測試結果

2、客觀評價指標

改進的巴克譜失真測度(MBSD)評價方法的條件是:測試語音文件的噪聲電平分別為無噪聲、電平為15dB、噪聲電平為20dB,輸入語音電平分別為-9dB-19dB-29dB,每個輸入電平4個文件(男女聲各占1/2),與噪聲電平組合為36個測試文件。平均MBSD的測試結果詳見下表2-1~2-5。表中的噪聲電平是對噪聲幅度直接取對數得到的,輸入電平是對輸入語音信號幅度歸一化后再取對數得到的。

2-1LPC-10聲碼器合成語音質量客觀測試的平均MBSD測試結果

2-2FS-1016標準語音編碼器合成語音質量客觀測試的平均MBSD測試結果

2-3AMR標準4.75kb/s語音編碼器合成語音質量客觀測試的平均MBSD測試結果

2-4:新FS-1015標準語音編碼器合成語音質量客觀測試的平均MBSD測試結果

2-5INMARSAT-M標準語音編碼器合成語音質量客觀測試的平均MBSD測試結果

由表中的測試結果可知:噪聲電平越大,其MBSD的值也越大,即噪聲越強,合成語音失真越大,這與實際是相吻合的。

欲更多了解語音編碼性能評價指標概念的請進入

附錄
聯合國兒童基金會助學
© 2004-2025 通信人在線 版權所有 備案號:粵ICP備06113876號 網站技術:做網站
主站蜘蛛池模板: 清水河县| 五华县| 江永县| 花莲县| 云龙县| 剑川县| 长葛市| 舒兰市| 云阳县| 日土县| 河曲县| 徐水县| 启东市| 罗江县| 安宁市| 宣汉县| 马山县| 周口市| 义乌市| 黄骅市| 汉沽区| 喀什市| 蓝山县| 吉水县| 英超| 安康市| 巫溪县| 象山县| 弥勒县| 井冈山市| 文安县| 霍山县| 三原县| 双城市| 天门市| 贡觉县| 泽库县| 阿荣旗| 南京市| 望江县| 淄博市|