NLP之ASR:基于pyaudio利用python進(jìn)行語(yǔ)音生成、語(yǔ)音識(shí)別總結(jié)及其案例詳細(xì)攻略
T1、調(diào)用win系統(tǒng)自帶程序?qū)⑽淖洲D(zhuǎn)為語(yǔ)音讀出
T2、利用python的pyaudio庫(kù)進(jìn)行實(shí)時(shí)錄制,生成wav文件
T3、利用BAT、科大訊飛等的語(yǔ)音識(shí)別API(上傳到BAT、科大訊飛等語(yǔ)音服務(wù)器)API將自定義文字,轉(zhuǎn)換生成wav、mp3等文件
T1、利用BAT、科大訊飛等語(yǔ)音識(shí)別API(上傳到百度語(yǔ)音服務(wù)器)API將生成wav、mp3等文件,識(shí)別轉(zhuǎn)為文本內(nèi)容
T2、后期更新……
相關(guān)文章
百度語(yǔ)音調(diào)用流程
百度語(yǔ)音之錯(cuò)誤碼及常見(jiàn)原因
pyaudio:基于pyaudio利用Python編程從電腦端錄制音頻保存到指定文件夾+將錄音上傳服務(wù)器+錄音進(jìn)行識(shí)別并轉(zhuǎn)為文本保存
ASR:基于pyaudio利用python進(jìn)行語(yǔ)音生成、語(yǔ)音播放、語(yǔ)音識(shí)別總結(jié)及其案例詳細(xì)攻略
聯(lián)系客服