- 軟件大?。?span>10.00M
- 軟件語言:中文
- 軟件類型:國產軟件
- 軟件類別:免費軟件 / 音頻處理
- 更新時間:2017-06-29 15:29
- 運行環(huán)境:WinAll, WinXP, Win7, Win8, Win10
- 軟件等級:
- 軟件廠商:
- 官方網站:暫無


304KB/中文/0.0
18.08M/中文/10.0
651KB/中文/10.0
4.68M/中文/6.6
510.00M/中文/10.0
宏樂聲紋對比控件是一款對比聲紋來識別聲音的音頻處理軟件。這是一款非常實用的軟件,可以用到生活中的方方面面。歡迎需要的用戶來綠色資源網下載使用。
宏樂聲紋對比控件可以對比任意兩個聲音句子的紋理,并獲得兩個聲紋的近似度的百分值。讓軟件設計者根據識別的結果控制各種設備或操縱軟件執(zhí)行相應的功能。
用戶可以將不同的特征文件與數據庫一一對應保存,然后通過對比函數從數據庫取出不同的特征文件與當前的錄音結果對比,從而知道當前的聲紋與數據庫內的哪一個聲紋最吻合。
我們還為掌上電腦,或學習機提供DLL評分插件。通過它,可以獲得學生跟讀老師句子的吻合程度。
該控件還附帶一個精美的可變色按鈕控件,利用它可以美化程序的界面。
1.Rocord 〔錄制〕(true 或 false) true 開始錄音(控件在句結束后自動停止錄音并識別)。
2.Establish 〔設置〕(true) 將當前的錄音特征設置為對比特征。
3.Percentage 〔評分〕 獲取當前對比結果的分數值(0 表示根本不吻合,有數值表示相似度的百分比。)
4.AutoRecord〔自動錄音〕(true 或 false) true 則啟動適時錄音,源源不斷的將錄音的內容進行對比分析。Falae 則關閉自動錄音。
5.Comp 〔對比特征〕從V9.0版本起,這個指令不再對比bin格式特征文件名,而是對比當前啟用庫的一個特征名稱!可用44.UserLib(啟用庫名稱)函數來選擇庫。
6.EstablishVoiceFileNameToComp 〔設聲音文件為對比〕(WAV格式聲音文件路徑名稱) 將一個任意格式的WAV文件分析后獲取的聲紋特征設置為對比內容。(注意:用聲音文件來對比,如果還沒有聲音庫,請用16位單聲道8000采樣的格式記錄聲音,這樣可以省略格式轉換的過程。)
7.CompVoiceFile 〔對比聲音文件〕(WAV格式聲音文件路徑名稱) 將一個任意格式的WAV文件(而不是錄音內容)來對比。(可直接拖放Wav文件到本控件測試)
8.Noise 〔測噪音〕(true) 這個函數一般不用,因為控件會在錄音結果
9.Volume 〔音量〕 獲取當前錄音結果的音量 (最大值為100)
10.Painting 〔繪圖〕(true 或 false) true 則繪圖,false 則不繪圖。
11.RecordCharacterFileName 〔錄音特征文件名〕(bin格式文件名) 獲取當前錄音結果的特征文件名全稱。(特征文件的長度為2310字節(jié){如果選擇身份鑒別長度為2320字節(jié)},可以將這個文件用不同的名稱命名保存到數據庫中對應某個聲音文件,便于單獨或批量對比。通常這個文件名是控件包路徑+"\總特征.bin")
12.CompCharacterFileName 〔對比特征文件名〕(bin格式文件名) 獲取對比特征文件名的全稱。(通常這個文件名為控件包路徑+"\總對比特征.bin")
13.OpenF12 〔允許F12鍵錄音〕(true 或 false) true 則允許F12鍵代替鼠標錄音。(按下F12開始錄音,放開F12結束錄音。結束錄音的同時分析聲紋的相似度)
14.DiscriminateBody 〔鑒別身份〕 (true 或 false) 選擇 true 則比較嚴格的校對個人的聲紋,選擇 false 則適合男女老幼的各種音色。
15.Reverse 〔反向〕(true 或 false) true 則反向,用于相位相反的麥克風接口。
16.Play (播放錄音) (true) 播放現場錄音的(學生)聲音,或 CompVoiceFile 函數調入的聲音文件。
17.Play_Comp (播放對比) (true) 播放用于對比的(老師)聲音。
18.Re_Recognition 〔重新識別〕(true 或 false) true ,主要用于“反向”之后的不重錄音而直接識別。
19.OCX_Path 〔控件路徑〕(true 或 false) true ,讀取控件所在的路徑全稱。
20.IsOver 事件,這個事件在分析完畢后自動啟用。能調用OCX控件的用戶在設計時雙擊本控件可以看到IsOver事件,然后在這個事件中插入分析完成后響應的代碼。
21.Max_Record_Timer(沒有響應的最大秒數) (1~60) 人工錄音方式時啟動錄音后如果一直沒有聲音數據提交,將在這個值到后無條件停止錄音提交數據進行分析(默認值是6秒)。
22.PeakValue (峰值校驗 ) (true 或 false) true 則校驗峰值誤差(校驗峰值誤差有時會因為環(huán)境噪音太大導致聲音串首尾定位不準而評分失敗)。
23.ALC (自動電平 ) (true 或 false) true 則啟用自動電平控制,能在聲音較小時放大,聲音太大時衰減到比較合理的電平。
24.WordNoumber (字段數) () 一個數值,顯示詞句切割出的段數(個別詞會無法分割而連接在一起,所以這個值并不代表字數,可以理解為嘴唇開合的次數),用于將數據庫分類,減少識別時搜索的范圍。[注意:使用它分類要考慮有可能誤差正負1個值;比如獲得的字段數是3,應該在2、3、4字段庫尋找特征文件]
25.Zero (允許零分 ) (true 或 false) true是默認值,在不吻合的因素太多時評分的值為零,但在老師與學生聲紋誤差較大時會也可能導致錯評為零分的現象,此時應該禁用它。
26.Word_Max_Timer(t) t是提交詞匯的反應秒數(停頓提交詞匯的時間),范圍必須在0.125秒~3秒之間。(默認值是0.66秒)
27.Auto_Clips (自動剪輯) (true 或 false) 默認為true;對應于控件的“自剪”復選框。true則錄音按鈕點擊開始錄音,當音量小到只有噪音時提交錄音結果并分析。false則錄音的開始與結束是手工控制,按下錄音按鈕[或使用Rocord_Start(true)函數]開始錄音,放開錄音按鈕[或使用函數Rocord_End(true)]結束錄音并提交分析。
28.Rocord_Start (開始錄音) (true) 在“自剪”復選框(自動剪輯)不選時,啟動錄音。
29.Rocord_End (結束錄音) (true) 在“自剪”復選框(自動剪輯)不選時,結束錄音并分析。
30.Filters_Infrasound (濾除次聲波) (true 或 false) false是默認值,濾除次聲波的功能已經在句子剪裁器中使用,通常對比現成的WAV文件才使用它,濾除非語音成分的超低音部分,主要排除板載聲卡的零點電平漂移或口風或風扇等帶來的低頻噪音。
31.FrequencyFitsTogetherRate (頻率吻合率) 對應最上方的版塊,頻率曲線吻合的百分值
32.PeakMatchingRate (峰值吻合率) 對應中間的版塊,峰值曲線吻合的百分值。
33.FrequencyChartFitsTogetherRate (頻譜吻合率) 在身份鑒別狀態(tài)下,它顯示頻譜的吻合百分值。
34.ReasonDoesNotMatch (不吻合原因) 在評分失敗后給出原因,鼠標點擊分數可以看到這個提示。
35.CutRatio (切割比例) 頭尾切割與最大值的倍數,值在10~50之間,這個值影響數據頭尾定位的切割(默認值=25)
36.FrequencyComp(頻率鑒別選擇) 頻率鑒別選擇,它控制最上方的頻率變化曲線版塊是否參與分析, 可以用 FrequencyComp(True) 或 FrequencyComp(False) 指令控制它。
37.Save(保存特征) 保存特征,并給特征命名;可用 Save("") 啟動輸入板;或直接命名一個特征,如Save("1234")。
38.CompAll(批量對比(特征庫的所有內容)) 用當前的錄音與對比特征庫內所有內容進行對比,可用 CompAll("") 指令啟動批量對比。
39.AutoCompAll(自動批量對比) 分析完錄音后自動啟動批量對比,可用 AutoCompAll( true ) 啟用它 用AutoCompAll( false ) 禁用它。
40.MaxNumber(有分數的結果個數) 有分數的結果個數,可用 MaxNumber(0) 讀取它。
41.Answerp(取第幾個答案) 取第幾個分數 ,可以用 AnswerP(1) 獲得最高分 用 AnswerP(2) 獲得第二高分,其他以此類推。
42.AnswerT(取第幾個答案) 取第幾個特征結果名稱.
測試的技巧主要是先調整好麥克風的靈敏度,然后點擊“錄音”,發(fā)音停頓則結束錄音并評分。此時會看到一條亮青色的變化曲線;之后點擊“保存特征”,記錄到特征庫中,同時會看到亮青色的曲線變?yōu)榛疑?/p>
如果只是單獨對比兩個聲音特征請將“批量”復選框設為不選,然后在特征列表中選中要對比的內容,這是會看到灰色的曲線對應特征而變化,點擊“錄音”按鈕,錄入一個句子,則可看到評分的結果。
V9以上的版本默認錄音結束后對比當前特征庫的所有特征,并將對比結果從高分到低分順序排列。
這些過程完全可以用軟件通過相應的函數來控制;具體請參閱函數說明。
錄音時麥克風不能正對準口中央,你會發(fā)現用于語音識別的耳麥麥克風都是偏離嘴巴的。同時不易遠距離錄音,當有效的聲音與環(huán)境噪音達不到5倍以上,識別將不理想;最重要的是如何獲得連續(xù)的頻率曲線,如果破碎,要分析原因。對于一個詞組或句子來說,曲線斷續(xù)是正常的,因為一些語音成分沒有頻率特征,比如聲母T、F等,對應它的部分是一個缺口,這里指的破碎是指對應一個字中的曲線是否連續(xù)。
峰值曲線的切割是自動的,但要注意錄音時是否有干擾的噪音,請留意曲線的頭尾是否正常切割,再將它保存到特征庫中。
特征庫是需要長期訓練的,合理的方法是設為對比以后,重錄一次,看看分數是否足夠高,不高的要重錄。
(如果特征曲線總是出不來,請嘗試“反向”功能,通常在面板插入的麥克風插孔需要“反向”)
為了提高識別率,不同時出現的特征庫要盡可能的分類。假設正在操控一個窗體,而窗體上只有幾個按鈕,這種情況下應該為該窗體單獨建立一個小特征庫,庫內只有相應的幾個按鈕的特征,這樣識別起來就會很準。
當庫內特征較多時,不可避免會出現識別結果不止一個或需要的結果不排在第一位的現象,這時應該類似拼音輸入法,讓同音字或詞組有個選擇的機會。
請描述您所遇到的錯誤,我們將盡快予以修正,謝謝!
*必填項,請輸入內容