婷婷激情丁香六月开心五月,最新欧美精品一区二区三区,最新国产精品精品视频 视频,亚洲国产成人爱av网站,中文字幕av无码一区二区三区电影

首頁>> 公司信息>>新聞詳情

網(wǎng)絡(luò)讀報(bào)TTS應(yīng)用方案

2008-09-24 11:00 《4PS呼叫中心國際標(biāo)準(zhǔn)研究中心》 咨詢電話:17317241681(微信同號(hào))


 

  言:

 1.1介紹

       隨著數(shù)字化技術(shù)的普及,報(bào)刊出版業(yè)也朝著數(shù)字化的方向邁進(jìn),網(wǎng)絡(luò)上的數(shù)字化報(bào)刊開始不斷出現(xiàn),而數(shù)字化多媒體所具有的聽說讀寫的特點(diǎn),更為數(shù)字報(bào)刊注入了新的活力。讀者除了可以看到報(bào)刊的內(nèi)容外,還可以通過數(shù)字化語音合成技術(shù)聽到報(bào)刊中的內(nèi)容。這樣讀者可以不用逐字去讀文章,就能對(duì)文章的內(nèi)容充分了解。

      

       語音合成技術(shù),又稱TTS(Text-To-Speech),可以使計(jì)算機(jī)象人一樣將提供的文字通過放音設(shè)備讀出來,或者轉(zhuǎn)化為WAV 或其它格式的語音文件存儲(chǔ)起來。語音合成技術(shù)具有連續(xù)流暢、自然度高、音庫大小可調(diào)節(jié)、音色可轉(zhuǎn)換的特點(diǎn), 并且特別支持中英文的混讀,使TTS可以更加廣泛地應(yīng)用于報(bào)刊雜志等現(xiàn)代文本的閱讀。

 

 

二 捷通jTTS產(chǎn)品簡介

 

2.1核心的系統(tǒng)結(jié)構(gòu)

jTTS 4.0 多語種語音合成平臺(tái)系統(tǒng)結(jié)構(gòu)如上圖所示。jTTS 4.0多語種語音合成平臺(tái)是以一種開發(fā)式的架構(gòu)進(jìn)行設(shè)計(jì)的,其核心是一套統(tǒng)一的對(duì)外編程接口(APIApplication Programming Interface),即jTTS API 4.0,以及統(tǒng)一的多語種引擎管理模塊,即jTTS_ML.DLL。多語種的引擎(例如中文引擎jTTS_CH.DLL,英文引擎jTTS_EN.DLL等)在多語種引擎管理模塊的調(diào)度下進(jìn)行實(shí)際的合成工作,而目前尚未提供的其他語種的引擎也可以方便地加入到這個(gè)體系結(jié)構(gòu)中來。

2.2  jTTS_ML.DLL

jTTS_ML.DLL是主要模塊,在這個(gè)模塊中完成多數(shù)統(tǒng)一的工作。包括:

l         各個(gè)語種引擎和音庫的管理、加載、卸載、選擇。

l         與外部設(shè)備相關(guān)而與具體引擎無關(guān)的工作,例如打開文件,聲卡或文件輸出等。

l         各個(gè)語種幾乎相同的工作,例如SSML TAG的處理等。

2.3  jTTS4.OCX

jTTS4.ocx是在jTTS_ML.DLL之上的一個(gè)ActiveX控件,主要作用是以COM接口的方式提供了TTS的功能,方便Web頁面開發(fā)或者VB等編程語言的開發(fā)。由于COM接口支持的開發(fā)工具非常廣泛、語言類型多種多樣,因此用戶可以通過使用jTTS4.ocx組件來開發(fā)TTS應(yīng)用程序,以達(dá)到適應(yīng)多種開發(fā)環(huán)境、簡化開發(fā)過程的目的。使用此控件可以實(shí)現(xiàn)向文件或聲卡輸出,所有的設(shè)置、回調(diào)等功能也和jTTS_ML.DLL所提供的功能基本類似,但是它沒有底層合成(即Session)的概念,也不能直接獲得語音數(shù)據(jù)流。

2.4  核心引擎

jTTS_CH.DLL, jTTS_JP.DLL, jTTS_EN.DLL等則為各個(gè)語種的TTS實(shí)際引擎。引擎和音色庫的基本概念如下:

l         每個(gè)引擎可以支持多個(gè)語種。

l         可以有多個(gè)引擎支持同一個(gè)語種,例如上圖中的jTTS_CH2.DLL也支持中文。

l         每個(gè)引擎可以有多個(gè)音色(一般也對(duì)應(yīng)了多個(gè)音庫),每個(gè)音色都有一個(gè)唯一的GUID。

l         每個(gè)音色只能支持一種語種。

l         每個(gè)音色可以支持多個(gè)領(lǐng)域(Domain),不同音色可以支持不同的領(lǐng)域范圍。

l         每種方言(例如廣東話)是作為一個(gè)獨(dú)立語種出現(xiàn)。

所有引擎(但不一定是所有音庫)必須安裝在同一個(gè)大目錄下,如下圖所示:

系統(tǒng)會(huì)在某個(gè)目錄(例如在上圖中,應(yīng)該是jTTS 4.0\Bin)下遞歸地搜索所有子目錄。自動(dòng)查找所安裝的語種引擎、音色庫和領(lǐng)域資源包。這樣的結(jié)果是,整個(gè)系統(tǒng)是一種模塊化的結(jié)構(gòu),對(duì)用戶來說,可以自由地安裝某個(gè)引擎、某種音庫和某種領(lǐng)域資源包。

2. 5  外掛DLL

系統(tǒng)采用外掛DLL的方式來提高擴(kuò)展性。外掛DLL包括兩種:一種是文本抽取DLL,另一種是語音格式轉(zhuǎn)換DLL

在閱讀文件時(shí)(通過jTTS_PlayjTTS_PlayToFile),可以通過外掛的DLL來進(jìn)行文本的抽取,然后利用TTS的功能進(jìn)行合成,例如閱讀DOC文件或者Email。而得到語音數(shù)據(jù)后,可以利用外掛的語音格式轉(zhuǎn)換DLL來得到系統(tǒng)本身不支持的語音格式。

2. 6  jTTSService.exe

語音合成服務(wù)器jTTSService.EXE提供了對(duì)基于網(wǎng)絡(luò)的TTS服務(wù)的支持,讓用戶可以采用網(wǎng)絡(luò)合成方案或集群網(wǎng)絡(luò)合成方案進(jìn)行合成。此語音合成服務(wù)器軟件作為Windows系統(tǒng)上的一個(gè)服務(wù)(Service)或Linux系統(tǒng)上的一個(gè)守護(hù)程序(daemon)實(shí)現(xiàn),監(jiān)聽網(wǎng)絡(luò)端口號(hào),如果有連接,則通過jTTS Service Protocol 4.0版本為客戶端提供語音合成的服務(wù)。

2. 7  jTTSLib.exe

圖形化的資源管理工具,提供各語種的資源庫(例如音庫、詞庫、外部規(guī)則庫等)進(jìn)行維護(hù)的功能。

2. 8  jTTSSysInfo.exe

新提供的jTTS SysInfo實(shí)用工具,可以檢查用戶的應(yīng)用環(huán)境:合成系統(tǒng)名稱版本、操作系統(tǒng)名稱版本、授權(quán)信息、各引擎和音庫狀況等等,也可以讓用戶打開日志文件。借助此工具,可以在便于進(jìn)行遠(yuǎn)程的信息搜集和支持,更加快速的定位問題發(fā)生的可能原因,提供專業(yè)的技術(shù)支持和服務(wù)。

2. 9  jTTSResource.exe

系統(tǒng)提供了一個(gè)便捷的平臺(tái)資源管理工具,可以對(duì)背景音樂進(jìn)行添加、刪除和修改。系統(tǒng)在初始化時(shí)將自動(dòng)檢測(cè)已經(jīng)配置過的資源情況。

 

3.0 TTS音庫分類:

   目前jTTS擁有多種中文普通話音庫包括:zhaqian、xiaonan、 liukun haobo(男聲)。同時(shí)還有英文音庫jenifer,和其它多種語言的音庫。

 

  網(wǎng)頁上的數(shù)字報(bào)刊語音合成技術(shù)應(yīng)用方案:

3.1 技術(shù)實(shí)現(xiàn)方式

網(wǎng)站上的語音合成應(yīng)用過程如下,用戶先選擇網(wǎng)頁上的文字,然后點(diǎn)擊提交,網(wǎng)站服務(wù)器就會(huì)使用后臺(tái)的語音合成引擎合成相應(yīng)的語音文件到本機(jī)上,之后用戶再通過media player的播放功能以流媒體的形式播放網(wǎng)站服務(wù)器上的這個(gè)語音文件。得到最后的報(bào)紙聲音結(jié)果。(如圖:)

 

對(duì)于B/S結(jié)構(gòu)的合成應(yīng)用來說,網(wǎng)站服務(wù)器需要擁有合成語音用組件或應(yīng)用程序,如果是組件可以讓網(wǎng)頁使用該組件,如果是應(yīng)用程序,需要網(wǎng)頁以命令行得形式運(yùn)行此程序進(jìn)行合成。無論是哪種情況都需要這個(gè)組件調(diào)用捷通TTS引擎。如圖:

如果在網(wǎng)頁里設(shè)置語速、基頻或音量等信息選項(xiàng),上層組件還可以獲得這些信息,并提交給jtts_ml.dll接口,這樣用戶瀏覽新聞時(shí)可以獲得不同的語音合成效果。

 

四、實(shí)施方案

4.1 實(shí)施方式

對(duì)于網(wǎng)頁應(yīng)用來說,合成效率十分重要,一個(gè)網(wǎng)站可能同時(shí)有幾十或上百人訪問,tts引擎需要有一定的同步合成處理能力。我們推薦使用捷通jtts-4.5網(wǎng)絡(luò)專業(yè)版,目前TTS的合成效率是800/秒,同步線數(shù)使用 5-10線即可。當(dāng)用戶提交要合成的文本給網(wǎng)站后,TTS引擎會(huì)在內(nèi)部開辟線程為多個(gè)用戶同時(shí)進(jìn)行合成,以保證每個(gè)客戶都能在第一時(shí)間內(nèi)聽到報(bào)刊內(nèi)容。同時(shí)為了提高效率,網(wǎng)站的制作可以采用緩存機(jī)制,將合成過的報(bào)刊聲音文件緩存在服務(wù)器端,以便其它用戶再次收聽時(shí),能夠更快的聽到報(bào)刊的內(nèi)容。

在網(wǎng)站的服務(wù)器端除了將jTTS音庫和網(wǎng)頁服務(wù)器放在一起外,還可以將jTTS音庫和引擎單獨(dú)裝在一臺(tái)服務(wù)器上來用。由于jtts_ml.dll可以通過網(wǎng)絡(luò)與合成引擎通訊來得到語音合成結(jié)果,所以可以把語音合成部分和網(wǎng)頁服務(wù)器部份分到兩臺(tái)機(jī)器上用,減少網(wǎng)頁服務(wù)器的運(yùn)行負(fù)載。(如圖:)

網(wǎng)頁可以使用media player的播放功能,以流媒體的方式來播放tts合成到網(wǎng)站服務(wù)器的語音資源文件,并可以實(shí)現(xiàn)開始播放、暫停播放和停止播放功能(如圖:)

 

五、安裝與配置

5.1 安裝

  我們將產(chǎn)品分為本地方案軟件和網(wǎng)絡(luò)方案軟件,建議采用網(wǎng)絡(luò)方案。網(wǎng)絡(luò)方案軟件除包括基本運(yùn)行時(shí)刻庫、開發(fā)工具包以外,還增加語音合成服務(wù)器軟件。無論哪種方案,用戶都需要在方案軟件安裝完畢后,另行安裝所需的音庫和資源包。根據(jù)用戶所需音庫和資源包的不同情況,音庫和資源包有可能需要多次地分別獨(dú)立安裝。

 

 

5.2 產(chǎn)品特點(diǎn)

jTTS 4.0版本功能:

1.  支持多語種,支持多領(lǐng)域的設(shè)置

2.  支持音色的查找、訪問、加載等

3.  支持SSML (語音合成標(biāo)記語言, Speech Synthesis Markup language

4.  可以直接播放文本文件,也支持外掛抽取文本的DLL以支持其它格式。

5.  支持GB(包括GB2312, GBK, GB18030)、Big5、Shift-JIS、ISO-8859-1Unicode、Unicode  Big EndianUTF8等各種字符集,自動(dòng)識(shí)別具有BOM標(biāo)記的Unicode文本。

6.  支持同步、異步合成一個(gè)Session,通過被動(dòng)的回調(diào)函數(shù)方式給用戶傳遞數(shù)據(jù)。在原有版本的主動(dòng)獲取語音數(shù)據(jù)的基礎(chǔ)上又提供了一個(gè)選擇。

7.  支持背景音樂。

8.  可以外掛語音格式轉(zhuǎn)換程序。

 

目前我們除了中文引擎外,可以提供英文引擎、日文引擎、廣東話引擎等。所支持的語言和音庫的情況列表如下:

 

名稱

標(biāo)識(shí)

語種

性別

共0條評(píng)論網(wǎng)友評(píng)論
  • 全部評(píng)論
共0條記錄(共頁)

        
總機(jī):021-51601170 直線:021-58307717,17317241681(微信同號(hào)) 電子郵件:cct@51callcenter.com  瀘ICP備10026114號(hào)-4  行業(yè)交流俱樂部QQ:2919157212
地址:上海市浦東新區(qū)牡丹路60號(hào)東辰大廈810室  郵編:201204 上海趨天網(wǎng)絡(luò)技術(shù)服務(wù)有限公司 版權(quán)所有(2002-2018)
  • <abbr id="aez1j"></abbr>