產(chǎn)品特點(diǎn):
1.支持語音檢出(VAD)能力:能夠在夾雜噪音的環(huán)境下連續(xù)采集語音信號(hào),并進(jìn)行過濾,保留有效語音,對(duì)有效語音進(jìn)行識(shí)別和轉(zhuǎn)寫。
2.語音識(shí)別引擎具備聲學(xué)模型、語言模型、熱詞模型、自動(dòng)標(biāo)點(diǎn)系統(tǒng)。聲學(xué)模型采用端到端神經(jīng)網(wǎng)絡(luò)模型對(duì)聲學(xué)進(jìn)行建模,語言模型采用ngramLM進(jìn)行建模,用于計(jì)算搜索候選的文本概率,引擎同時(shí)支持自動(dòng)智能標(biāo)點(diǎn),能夠?qū)ψR(shí)別的文本自動(dòng)添加標(biāo)點(diǎn)。
3.支持多個(gè)語種語音識(shí)別能力:根據(jù)需要提供中文等語種的語音識(shí)別能力。
4.支持實(shí)時(shí)語音識(shí)別能力:支持對(duì)實(shí)時(shí)音頻流的識(shí)別,并實(shí)時(shí)轉(zhuǎn)寫成文字,支持16kHz/8kHz采樣率,16bit位深,單通道pcm/wav音頻格式。
5.支持錄音文件轉(zhuǎn)寫能力:支持上傳音頻文件轉(zhuǎn)寫成文字,支持16kHz/8kHz采樣率,16bit位深,單通道pcm/wav/mp3/mp4等格式的音頻。
6.錄音文件轉(zhuǎn)寫支持文稿模式和字幕模式兩種輸出格式。
7.語音識(shí)別引擎具備如下效果和性能:
(1)中文語音識(shí)別(標(biāo)準(zhǔn)普通話)正確率最高可達(dá)98.6%;
(2)識(shí)別結(jié)果響應(yīng)時(shí)間標(biāo)準(zhǔn)測(cè)試集≤500毫秒。
8.支持開啟詞級(jí)別的對(duì)齊結(jié)果,詞信息時(shí)間精度為毫秒。
9.支持逆文本標(biāo)準(zhǔn)化,將語音識(shí)別結(jié)果中的日期、數(shù)字等對(duì)象以標(biāo)準(zhǔn)化格式展示。
10.支持自動(dòng)智能標(biāo)點(diǎn),智能判斷對(duì)識(shí)別的文本添加標(biāo)點(diǎn)。
11.支持熱詞接口:提供中文熱詞導(dǎo)入及編輯功能,通過熱詞提升轉(zhuǎn)寫效果。
12.支持敏感詞接口:可手動(dòng)配置敏感詞,提供敏感詞屏蔽、標(biāo)注等功能。
13.支持語氣詞過濾功能,可手動(dòng)添加語氣詞過濾規(guī)則,開啟語氣詞過濾后在識(shí)別結(jié)果中自動(dòng)刪去匹配的語氣詞。
14.軟著和專利:要求具備語音識(shí)別系統(tǒng)的軟件和專利。
15.部署要求:為了保證數(shù)據(jù)安全性和相應(yīng)速度,要求提供所有的語音識(shí)別引擎軟件本地離線部署和使用,所使用的技術(shù)和軟件自主可控。
國(guó)產(chǎn)化軟硬件支持:支持國(guó)產(chǎn)化CPU和國(guó)產(chǎn)化操作系統(tǒng),具備國(guó)產(chǎn)化操作兼容性適配證書。