用于语音处理的方法与系统

用于语音处理的方法与系统


2024年4月30日发(作者:神舟电脑官网商城)

(19)中华人民共和国国家知识产权局

(12)发明专利说明书

(21)申请号 CN2.3

(22)申请日 2011.07.13

(71)申请人 三星电子(中国)研发中心;三星电子株式会社

地址 210019 江苏省南京市庐山路188号新地中心17-19F

(72)发明人 陈晓晓 李远友 向春

(74)专利代理机构 北京铭硕知识产权代理有限公司

代理人 韩明星

(51)

G10L15/02

G10L15/06

(10)申请公布号 CN 102881283 A

(43)申请公布日 2013.01.16

权利要求说明书 说明书 幅图

(54)发明名称

用于语音处理的方法与系统

(57)摘要

提供了一种用于语音处理的方法和

系统,所述系统包括:语音特性参数获取

模块,用于获取表现第一语音和第二语音

的语音特性的语音特性参数;语音模版生

成模块,用于将第一语音的语音特性参数

生成为语音模版;语音处理模块,用于根

据语音模版调整第二语音的语音特性参

数,并将调整后的语音特性参数应用于第

二语音。

法律状态

法律状态公告日

2021-10-29

2014-05-28

2013-02-27

2013-01-16

法律状态信息

专利权人的姓名或者名称、地址

的变更

授权

实质审查的生效

公开

法律状态

专利权人的姓名或者名

称、地址的变更

授权

实质审查的生效

公开

权 利 要 求 说 明 书

1.一种语音处理系统,所述系统包括:

语音特性参数获取模块,用于获取表现第一语音和第二语音的语音特性

语音模版生成模块,用于将第一语音的语音特性参数生成为语音模版;

语音处理模块,用于根据语音模板调整第二语音的语音特性参数,并将

2.如权利要求1所述的系统,还包括:语音获取模块,用于获取第一语

3.如权利要求1所述的系统,还包括:存储模块,用于存储语音模板。

4.如权利要求1所述的系统,其中,所述语音特性包括语音的音量、音

调和音色特性中的至少一个。

音和/或第二语音。

调整后的语音特性参数应用于第二语音。

的语音特性参数;

5.如权利要求2所述的系统,其中,所述语音获取模块从预先存储的语

6.如权利要求2所述的系统,其中,所述语音获取模块使用录音设备录

7.如权利要求4所述的系统,其中,所述语音特性参数包括下述参数中

8.如权利要求1所述的系统,其中,语音特性参数获取模块直接设置形

9.如权利要求3所述的系统,其中,语音处理模块对从存储的语音模板

制第一语音和/或第二语音。

音中选取第一语音和/或第二语音。

的至少一个:表现音量特性的音量大小参数、表现音调特性的基音的频率和

幅度参数、表现音色特性的预定数量的泛音的频率和幅度参数。

成语音模板所需的第一语音的各语音特性参数,使得设置的语音特性参数被

语音模板生成模块生成为语音模板。

中选择的语音模板所包含的语音特性参数进行调整,并根据调整后的语音特

性参数由语音模板生成模块生成与选择的语音模板不同的另一

语音模板。

10.一种语音处理方法,所述方法包括:

获取表现第一语音和第二语音的语音特性的语音特性参数;

将第一语音的语音特性参数生成为语音模版;

根据语音模板调整第二语音的语音特性参数,并将调整后的语音特性参

11.如权利要求10所述的方法,还包括:获取第一语音和/或第二语音。

12.如权利要求10所述的方法,还包括:存储语音模板。

13.如权利要求10所述的方法,其中,所述语音特性包括语音的音量、

14.如权利要求11所述的方法,其中,从预先存储的语音中选取第一语

音和/或第二语音。

音调和音色特性中的至少一个。

数应用于第二语音。

15.如权利要求11所述的方法,其中,使用录音设备录制第一语音和/

16.如权利要求13所述的方法,其中,所述语音特性参数包括下述参数

或第二语音。

中的至少一个:表现音量特性的音量大小参数、表现音调特性的基音的频率

和幅度参数、表现音色特性的预定数量的泛音的频率和幅度参

数。

17.如权利要求10所述的方法,其中,直接设置形成语音模板所需的第

18.如权利要求12所述的方法,其中,对从存储的语音模版中选择的语

一语音的各项语音特性参数,使得设置的语音特性参数被生成为语音模板。

音模板所包含的语音特性参数进行调整,并根据调整后的语音特性参数生成

与选择的语音模板不同的另一语音模板。

说 明 书

技术领域

本发明涉及一种用于语音处理的方法与系统,更具体地讲,涉及一种能

背景技术

近年来,随着语音处理技术的快速发展,人们对语音的认识越来越深入,

并出现了多种关于语音的应用,例如,语音识别、录音、鹦鹉学舌等。由于

各种语音应用的出发点有所不同,因而这些应用各具特色,并能够满

人群的不同需求。

够使用语音模板对语音进行处理的方法与系统。

足各类

尽管在现有技术中已出现了关于语音处理中的语音变声的许多应用和方

法,但是大多数变声应用只能以预先确定的模式对语音进行处理,而难以对

多样性的、变化性的语音进行有效处理和变声,使得用户无法根据实

来对语音进行灵活处理。因此,随着数字装置的广泛应用以及

户需求的不断变化,现有的变声应用已无法满足当前和

这种情况下,需要一种能够灵活地根据用户的需

变声的方法和系统。

际需求

数字装置的用

未来发展的需要。在

求来对语音进行处理以实现

发明内容

本发明的目的在于提供一种能够根据用户需求来生成语音模板并使用语

音模板对语音进行处理的方法与系统,从而使得用户能够更加灵活和有效地

对语音进行处理,其中,可通过提取语音信号的语音特性参数来产生

板。 语音模

根据本发明的一方面,提供了一种语音处理系统,所述系统包括:语音

特性参数获取模块,用于获取表现第一语音和第二语音的语音特性的语音特

性参数;语音模版生成模块,用于将第一语音的语音特性参数生成为

版;语音处理模块,用于根据语音模板调整第二语音的语音特

调整后的语音特性参数应用于第二语音。

语音模

性参数,并将

所述系统还可包括:语音获取模块,用于获取第一语音和/或第二语音。

所述系统还可包括:存储模块,用于存储语音模板。

所述语音特性可包括语音的音量、音调和音色特性中的至少一个。

所述语音获取模块可从预先存储的语音中选取第一语音和/或第二语音。

所述语音获取模块可使用录音设备录制第一语音和/或第二语音。

所述语音特性参数可包括下述参数中的至少一个:表现音量特性的音量

语音特性参数获取模块可直接设置形成语音模板所需的第一语音的各项

语音处理模块对从存储的语音模板中选择的语音模板所包含的语音特性

根据本发明的另一方面,还提供了一种语音处理方法,所述方法包括:

大小参数、表现音调特性的基音的频率和幅度参数、表现音色特性的预定数

量的泛音的频率和幅度参数。

语音特性参数,使得设置的语音特性参数被语音模板生成模块生成为语音模

板。

参数进行调整,并根据调整后的语音特性参数由语音模板生成模块生成与选

择的语音模板不同的另一语音模板。

获取表现第一语音和第二语音的语音特性的语音特性参数;将第一语音的语

音特性参数生成为语音模版;根据语音模板调整第二语音的语音特性

并将调整后的语音特性参数应用于第二语音。 参数,

所述方法还可包括:获取第一语音和/或第二语音。

所述方法还可包括:存储语音模板。

所述语音特性可包括语音的音量、音调和音色特性中的至少一个。

可从预先存储的语音中选取第一语音和/或第二语音。

可使用录音设备录制第一语音和/或第二语音。

所述语音特性参数可包括下述参数中的至少一个:表现音量特性的音量

可直接设置形成语音模板所需的第一语音的各项语音特性参数,使得设

对从存储的语音模板中选择的语音模板所包含的语音特性参数进行调

通过使用本发明的语音处理方法和系统,可更灵活地按照用户的需求对

置的语音特性参数被生成为语音模板。

大小参数、表现音调特性的基音的频率和幅度参数、表现音色特性的预定数

量的泛音的频率和幅度参数。

整,并根据调整后的语音特性参数生成与选择的语音模板不同的另一语音模

板。

语音进行处理,使得语音处理的结果更加逼真和多样,实现丰富用户的娱乐

生活的目的。

将在接下来的描述中部分阐述本发明另外的方面和/或优点,还有一部分

附图说明

通过下面结合附图进行的详细描述,本发明的上述和/或其它目的、特点

图1是示出根据本发明的示例性实施例的语音处理系统的框图;

图2是示出根据本发明的示例性实施例的语音处理方法的流程图;

图3是示出根据本发明的另一示例性实施例的语音模板生成方法的流程

图4是示出根据本发明的又一示例性实施例的语音模板生成方法的流程

具体实施方式

以下,将参照附图更充分地描述本发明的示例性实施例,示例性实施例

在附图中示出。然而,可以以许多不同的形式实施示例性实施例,并且不应

被解释为局限于在此阐述的示例性实施例。相反,提供这些实施例从

开将会彻底和完整,并将完全地将示例性实施例的范围传达给

人员。在附图中,相同的标号表示相同的部分。

图。

图;

和优点将会变得更加清楚,其中:

通过描述将是清楚的,或者可以经过本发明的实施而得知。

而本公

本领域的技术

图1是示出根据本发明的示例性实施例的语音处理系统100的框图。参

照图1,根据本发明的示例性实施例的语音处理系统100包括:语音特性参

数获取模块120、语音模版生成模块130以及语音处理模块140。

参照图1,语音特性参数获取模块120可用于获取表现至少一种语音特

音量是指人耳对所听到的声音大小强弱的主观感受,其客观评价尺度是

性(例如,语音的音量、音调以及音色特性等)的语音特性参数。仅作为示

例,下面将描述使用PCM流格式的语音音频信号(以下,简称为“PCM音

频信号”)来获取表现音量、音调和音色特性中的至少一种语音特性的语音特

性参数的方法。

声音的幅度大小。因此可使用PCM音频信号的幅度来

表现语音的音量大小。

音调通常指具有特定且稳定音高的信号,是声音听起来调子的高低,主

要取决于频率。频率高的声音人耳的反应是音调高,频率低的声音人耳的反

应是音调低。音调主要由声音的基频决定,因此,可以通过提取

号的基音的频率(即,基频)和幅度来获取音调参数。 PCM音频信

音色是声音的特色,每一个人的语音有不同的音色,因此可以根据其音

色辨别出不同的人,音色的不同取决于不同的泛音,在每一种乐器、不同的

人以及所有能发声的物体发出的声音中,除了一个基音外,还有许多

率的泛音伴随,正是这些泛音的频率和幅度的不同组合决定了

因此,可通过提取音频信号的预定数量的泛音的频率和

参数。

不同频

不同的音色。

幅度来获取音色特性

常用的语音特性还可以概括为基音、共振峰、线性预测倒谱系数、Mel

频率倒谱系数等数字参数,通过目前现有的一些主流技术,如基于LPCC的

特征提取技术、基于MFCC的特征提取技术、短时傅里叶变换(处理平稳信

号的传统方法)技术,可获取表现语音特性的至少一个以下参数:表现音量

特性的音量大小参数、表现音调特性的基音的频率和幅度参数、表现音色特

性的预定数量的泛音的频率和幅度参数。

在提取操作完成之后,语音特性参数获取模块120可将获取的语音特性

语音模版生成模块130根据从语音特性参数获取模块120获得的多个语

音特性参数来生成语音模版,并将生成的语音模版存储在存储模块150中,

其中,所述语音模版是指表现特定语音的多种语音特性的语音特性参数的集

合,所述语音特性可包括,但不限于,音量、音色和音调特性中的至

可选择地,根据另一实施例,语音模版生成模块130也可直接

模板输入到语音处理模块140来对一语音进行处理。

参数发送到语音模板生成模块130以生成语音模板,或者保留所述参数,以

利用这些参数随后对该语音进行处理。

少一个。

将生成的语音

此外,还可通过语音特性参数获取模块120按照形成语音模板所需的各

种参数来直接设置各个语音特性参数,并将设置的语音特性参数传递到语音

模板生成模块130,以生成自定义的语音模版。具体地讲,在本发明

例中,可由用户直接设置音量大小,基音的频率和幅度以及预

的频率和幅度,并将设置好的语音特性参数发送到语音

以生成用户期望的语音模板。

的实施

定数量的泛音

模板生成模块130,

此外,还可通过对已有的语音模板的参数进行修改来生成新的语音模板。

语音处理模块140用于对待处理的语音进行处理。可根据用户需求选择

通过这种方式,可容易增加能够生成和应用的语音模版的种类,从而实现更

丰富的语音处理效果。

用户期望的语音模版,并将选择的语音模板输出到语音处理模块140,以使

用户能够根据所选择的语音模版对语音进行处理。详细地说,语音处理模块

140可根据选择的语音模版中记录的语音特性参数来对由语音特性参

模块120从待处理的语音提取的语音特性参数进行调整,并将

特性参数应用于待处理的语音,从而使待处理的语音具

性。

数获取

调整后的语音

有用户期望的语音特

例如,可将待处理的语音的基音频率和幅度分别调整为与选择的语音模

版中记录的基音的频率和幅度一致,可将待处理的语音的各个泛音的频率和

幅度分别调整为与选择的语音模版中记录的各个对应的泛音的频率和

致,还可将待处理的语音音量大小调整为与选择的语音模版中

小一致,从而使获取的语音的音量、音调和音色特性与

音量、音调和音色特性一致,实现模仿语音模版

幅度一

记录的音量大

语音模版能够表现的

所表现的语音的效果。

仅作为示例,假设通过语音特性参数获取模块120获得的待处理语音的

参数如下:基音的频率和幅度参数为(f0,C0),并

每个泛音的频率和幅度参数分别为且提取了16组泛音参数,

(f1,C1)、(f2,C2)、......、

(f16,C16), 音量大小为V,其中,

f0,f1,...f16是频率参数,C0

C1,...C16是幅度参数。 用户使用语音模板1

语音特性参数为:基对待处理的语音进行处理,其中,语音模板1中包含的

音的频率和幅度分别为(fR0,CR0),泛音的频率和幅度

参数为(fR1,CR1)、(fR2

CR2)、......、(fR16,CR16),音量大小为

VR,其中, fR0

fR1,...fR16是频率参数,CR0

CR1,...CR16是幅度参数。为使待处理的 语音在

进行处理之后能够与语音模板中的语音特性参数所表现出的语音特点

相同或相似,分别将待处理语音的基音、泛音以及音量参数调整为模板中的

记录的基音、泛音以及音量参数,具体地讲,使得待处理的语音的语

值分别被调整为:f0=fR0、音参数

f1=fR1、f2=fR2、...、

f16=fR16,C0=CR0

C1=CR1、...、 C2=CR2

C16=CR16,并使得待处理的语音的音量大小V调整为

VR,也就是说,

在完成对待处理语音的语音特性参数的调整之后,将调整过的语音参数

应用于待处理的语音,从而完成变声过程。具体地讲,在本实施例中,通过

使用与提取语音特性参数信息的操作相应的逆操作,将调整后的语音

数应用到待处理的语音,从而完成对待处理的语音的变声处理。

使得音量大小V=VR

特性参

应该理解,上述方法仅是示例性的,应用语音模板对待处理的语音进行

处理的方法不限于于此,可根据用户需要或是预定的设置来应用语音模板对

待处理的语音进行处理。或者用户可不使用语音模板对待处理的声音

声,而是在语音处理模块140中直接调整提取的待处理的语音

性参数来完成待处理的语音的变声过程。

进行变

的各个语音特

此外,还可在语音处理模块140中实现对经过处理的语音进行调整和美

化处理,从而使得所述语音能够获得更加逼真的音效。作为示例,这里仅描

述通过使用调整泛音参数来调整语音的音色效果的方法。

无论人声、歌声,还是乐器的语音,它们都不是一个单音,而是一个复

合音。也就是由语音的基音和一系列的泛音所构成。这些泛音都是基音频率

的倍数,并对音色的特性有非常重要的影响。泛音可分为低频泛音、

音和高频泛音。如果低频泛音的幅度较强,音色就表现得混厚;

幅度比较强,音色就表现得圆润、自然、和谐;高频泛音的幅

色就表现得明亮、清透、解析力强。

中频泛

中频泛音的

度比较强,音

泛音的数量和泛音幅度的不同构成音色的频率特性曲线。这条曲线就体

现了音色的表现力。音色的频率特性曲线各不相同。将基音到第16个泛音

强度在坐标上连成一条直线,这条直线就被称为最佳美声线。音色的

性曲线越接近这条直线,所述音色的低、中、高频泛音的比例

其音色的表现力也最好。

频率特

也最为均衡,

可以通过四段均衡器对音色进行频率处理,来提高音色的艺术表现力。

HF:6kHz-16kHz,影响音色的表现力、解析力;

MID HF:600Hz~6kHz,影响音色的明亮度、清晰度;

MID LF:200Hz~600Hz,影响音色和力度和结实度;

LF:20Hz~200Hz,影响音色的混厚度和丰满度。

如果高频段频率过弱,音色就变得色彩、韵味、个性的失落;如果高频

可将音频分为4个大的频率段,即:

段频率过强,音色就会变得尖噪、嘶哑、刺耳。如果中

音色就变得暗淡、朦胧;如果中高频段的频率过

如果中低频段的频率过弱,音色会变得空

高频段的频率过弱,

强,其音色就会变得呆板。

虚、无力、软绵绵的;如果中低频 段的频率过强,音色会变得生硬、

将会变得单薄、苍白;如果

失去活力。如果低频段的频率过弱,音色

低频段的频率过强,音色会变得浑浊不清。

要使音色有美感,就要泛音丰富、有层次。提升某一频段后,还要考虑

对其他频段的影响,要总体地考虑歌声的清晰度和丰满度。例如,女声在高

频部分容易产生S音(嘶声),则可在7-10KHz衰减3dB来消除S音;

音域比女声低一个8度音程,频率低一个倍频,在100Hz衰减3dB

以增加清晰度。通过这种方式,可完成对音色信息的调整。

男语

左右,可

如上所述,尽管已描述了通过调整泛音来对语音做进一步的调整和美化

此外,根据本发明的示例性实施例,语音处理系统100还可包括:语音

获取模块110和存储模块150。如图1所示,语音获取模块110用于获取待

理的语音,在本发明的示例性实施例中,语音获取模块110可至少使

语音获取方式来获取待处理的语音:可通过语音获取装置(例

从外界录制语音;还可直接从预先存储的语音中选择待处理的

获取之后,语音获取模块110可将待处理的语音输出到

块120。存储模块150用于存储生成的语音模板,

提供给语音处理模块140,以帮助完成对待处理

的方法,但本发明不限于此,还可使用其他方法实现对语音的调整和美化。

用两种

如,麦克风)

语音。在完成

语音特性参数获取模

并将用户选择的语音模板

的语音的变声处理。

此外,根据本发明的示例性实施例,所述语音处理系统100还可包括播

放模块(未示出)来播放语音。

图2是示出根据本发明的示例性实施例的语音处理的流程图。以下将参

在步骤201,语音获取模块110可利用录音装置从外界录制待处理的语

在步骤203,语音特性参数获取模块120将待处理的语音解码为可用于

在步骤205,确定是否将在步骤203中提取的语音特性参数生成为语音

在步骤207,在语音模版生成模块130中根据接收的语音特性参数生成

在步骤209,确定是否对获取的语音进行处理,如果需要对获取的语音

在步骤211,从存储模块150选择用户期望的语音模版,然后将选择的

语音模版与在步骤203中提取的语音特性参数一起输入到语音处理模块140。

进行处理,则进入步骤211。

相应的语音模版,并将所述语音模版保存在存储模块150中。可选择地,根

据另一实施例,也可直接将语音模版生成模块130生成的语音模板输入到语

音处理模块140来对一语音进行处理。

模版。如果确定生成语音模版,则进入步骤207;如果确定不将所述语音特

性信息生成为语音模版,则进入步骤209。

语音特性参数提取的格式(例如,PCM流格式),然后对解码的语音进行分

析,以提取各语音特性参数(例如,音量、音调和音色特性中的至少一种的

语音特性参数)。

音,或者从预先存储的语音中选择待处理的语音,然后将获取的待处理的语

音输出到语音特性参数获取模块120。

照图2描述使用本发明的语音处理方法完成对语音的处理的过程。

在步骤213,根据步骤211中选择的语音模版对待处理的语音的语音特

此外,还可在步骤213实现对语音的美化调整处理,例如,可通过调整

图3是示出根据本发明的另一示例性实施例的生成语音模板的流程图。

如图3所示,在步骤301,在语音特性参数获取模块120直接设置生成

语音模板所需的各项语音特性参数,具体地说,仅作为示例,在本发明的示

例性实施例中,可直接设置音量大小、基音的幅度和频率以及泛音的

频率。

语音的音色(即,泛音的频率和幅度参数)以使所述变化后的语音音效更加

逼真。

性参数进行调整,已结合图1描述了详细的参数调整过程,因此在此不再对

其进行描述。将调整后的语音特性参数应用到待处理的语音以获得新的语音,

从而实现模仿语音模版的语音效果的目的。

幅度和

在步骤303,确定语音特性参数的设置是否完成。

如果在步骤303确定完成了语音特性参数的设置,则在步骤305,在语

图4是示出根据本发明的又一示例性实施例的生成语音模板的流程图。

如图4所示,在步骤401,从存储模块150选择语音模板。

音模板生成模块130使用设置的各个语音特性参数来生成相应的语音模板,

并在步骤307将生成的语音模板保存在存储模块150。如果在步骤303语音

特性参数的设置还没有结束,则可继续设置参数,或者根据另一实施例,可

选择直接结束图3中示出的处理

在步骤403,通过语音处理模块140修改选择的模板中的各语音特性参

在步骤405,确定语音特性参数的修改是否完成。

如果在步骤405确定已完成对选择的语音模板的语音特性参数的修改,

应该理解,在完成对选择的语音模板的语音特性参数的修改之后,也可

尽管已经参照其示例性实施例具体显示和描述了本发明,但是本领域的

技术人员应该理解,在不脱离权利要求所限定的本发明的精神和范围的情况

下,可以对其进行形式和细节上的各种改变。

不生成的新的语音模板,而是直接在所选择的语音模板上保存修改后的语音

特性参数,从而实现调整语音模板的效果。

则在步骤407,在语音模板生成模块130中使用修改后的各个语音特性参数

来生成新的语音模板,并将所述新的语音模板保存在存储模块150中。如果

在步骤405语音特性参数的修改还没有结束,则可继续修改语音特性参数,

或者根据另一实施例,可选择直接结束图4中示出的处理。

数。


发布者:admin,转转请注明出处:http://www.yc00.com/num/1714463349a2451369.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信