免费看片黄色-久久精品成人av-天天操天天爱天天爽-无码内射中文字幕岛国片-成人在线视频免费-国产一级一区-国产在线aaa-国产精品情侣-一区二视频-中文字幕亚洲无线码在线一区-日韩一区二区三区在线免费观看-久久精品二区-国产手机av片在线观看-免费看成人-男人的天堂影院-黄色片子视频-热久久中文字幕

公司新聞
行業(yè)新聞
AI智能語音模塊之AI智能語音合成技術

行業(yè)新聞|2023-08-21|YIPPEE

    語音合成是通過機械和電子方法產(chǎn)生人工語音的技術。一般來說,語音合成就是讓機器模仿人類說話。也就是說,輸入一段文字,后輸出一段聲音。

    語音合成是一個將文本轉(zhuǎn)化為語音的過程,類似于人類的嘴巴。目前,語音合成技術主要應用于地圖導航、語音助手、教育、娛樂等軟件應用,以及智能揚聲器、家用電器、機器人等硬件設備。

    AI智能語音模塊語音合成系統(tǒng)通常包括兩個模塊:前端和后端。前端模塊主要分析輸入文本,提取后端模塊所需的語言信息。對于中文合成系統(tǒng),前端模塊一般包括文本正則化、分詞、詞性預測、多音字消歧、節(jié)奏預測等子模塊。根據(jù)前端分析結果,后端模塊通過一定的方法生成語音波形。后端模塊一般分為兩條技術主線:基于統(tǒng)計參數(shù)建模的語音合成,基于單元選擇和波形拼接的語音合成。

    現(xiàn)階段的語音合成系統(tǒng)可以分為三種類型:1。參數(shù)語音合成系統(tǒng)。2.拼接語音合成系統(tǒng)。3.基于波形的統(tǒng)計合成系統(tǒng)。其中,參數(shù)語音合成系統(tǒng)和拼接語音合成系統(tǒng)是目前各大公司的主流在線合成系統(tǒng),基于波形的統(tǒng)計合成系統(tǒng)的方法還處于研究階段,是目前研究的熱點。

    1參數(shù)語音合成系統(tǒng)的特點是,在語音分析階段,語音波形需要通過聲碼器轉(zhuǎn)換為頻譜、基頻、時長等語音或節(jié)奏參數(shù)。在建模階段建模語音參數(shù),在語音合成階段,時域語音信號由聲碼器預測的語音參數(shù)還原。參數(shù)語音合成系統(tǒng)的優(yōu)點是模型尺寸小,模型參數(shù)調(diào)整方便,合成語音相對穩(wěn)定。

    2、拼接語音合成系統(tǒng)的特點是將原始錄音剪切成基本單元存儲,而不是參數(shù)化原始錄音。在合成過程中,通過一些算法或模型計算每個單元的目標成本和連接成本,后通過Viterbi算法和PSOLA或WSOLA等信號處理方法“拼接”合成語音。因此,拼接語音合成的優(yōu)點是音質(zhì)好,不受語音單元參數(shù)化音質(zhì)的損失。但是,在數(shù)據(jù)庫小的情況下,合成語音韻需要穩(wěn)定,因為有時候選擇不到合適的語音單元。

    3WaveNet波形統(tǒng)計語音合成的主要單元是卷積神經(jīng)網(wǎng)絡。該方法的特點是使用神經(jīng)網(wǎng)絡直接預測合成語音波形的每個采樣點,而不是參數(shù)化語音信號。優(yōu)點是音質(zhì)比參數(shù)合成系統(tǒng)好,略差于拼接合成,但比拼接合成系統(tǒng)更穩(wěn)定。缺點是合成時間慢,因為需要預測每個采樣點。

察隅县| 安福县| 镇安县| 汽车| 鸡东县| 孟连| 靖边县| 阳原县| 商丘市| 六枝特区| 大荔县| 富蕴县| 长阳| 普安县| 河池市| 翁源县| 永泰县| 兴城市| 贵南县| 沐川县| 荔波县| 增城市| 界首市| 呼和浩特市| 象州县| 河池市| 宜黄县| 全州县| 土默特右旗| 迭部县| 英吉沙县| 大丰市| 凤翔县| 利津县| 弋阳县| 大关县| 望都县| 共和县| 蒲江县| 三门峡市| 南通市|