语音操控方法和装置

语音操控方法和装置


2024年5月2日发(作者:htc野火a510e)

(19)中华人民共和国国家知识产权局

(12)发明专利说明书

(21)申请号 CN2.8

(22)申请日 2013.10.22

(71)申请人 上海云视科技有限公司

地址 201103 上海市徐汇区宜山路2016号合川大厦9楼

(72)发明人 张毅军 徐征

(74)专利代理机构 上海专利商标事务所有限公司

代理人 施浩

(51)

G10L15/22

权利要求说明书 说明书 幅图

(10)申请公布号 CN 103500578 A

(43)申请公布日 2014.01.08

(54)发明名称

语音操控方法和装置

(57)摘要

本发明公开了一种语音操控方法和

装置,提升了移动互联和三网融合的各类

应用的操作便捷度。其技术方案为:对语

音进行采样后传输至机顶盒;机顶盒对采

样的语音进行识别后转化成文字;机顶盒

对转化后的文字进行语义识别,将文字分

解成控制命令、应用名称和参数三部分;

机顶盒基于分解出的应用名称查询是否已

经在激活状态,根据控制命令控制应用的

状态,并将参数送入应用进行操作。

法律状态

法律状态公告日

法律状态信息

法律状态

权 利 要 求 说 明 书

1.一种语音操控方法,包括:

对语音进行采样后传输至机顶盒;

机顶盒对采样的语音进行识别后转化成文字;

机顶盒对转化后的文字进行语义识别,将文字分解成控制命令、应用名称和参数

机顶盒基于分解出的应用名称查询是否已经在激活状态,根据控制命令控制应用

2.根据权利要求1所述的语音操控方法,其特征在于,语音识别和语义识别由机

3.根据权利要求1所述的语音操控方法,其特征在于,应用的操作由机顶盒的应

用管理器调用对应的应用来实现,应用管理器的调用由机顶盒的语音

顶盒的语音识别层实现。

的状态,并将参数送入应用进行操作。

三部分;

控制层完成。

4.根据权利要求1所述的语音操控方法,其特征在于,控制命令所控制的应用的

状态包括打开/激活、关闭、失活、升级、卸载。

5.一种语音操控装置,包括用户端装置和机顶盒,其中:

用户端装置包括采样模块,对语音进行采样后传输至机顶盒;

机顶盒包括语音识别模块、语义识别模块和应用调用模块,其中:

语音识别模块对采样的语音进行识别后转化成文字;

语义识别模块对转化后的文字进行语义识别,将文字分解成控制命令、应用

应用调用模块基于分解出的应用名称查询是否已经在激活状态,根据控制命

6.根据权利要求5所述的语音操控装置,其特征在于,控制命令所控制的应用的

名称和参数三部分;

令控制应用的状态,并将参数送入应用进行操作。

状态包括打开/激活、关闭、失活、升级、卸载。

说 明 书

技术领域

本发明涉及语音操控技术,尤其涉及针对移动互联网和三网融合的各类应用的语

背景技术

移动互联网技术和三网融合技术,使得业务及内容大爆发,这些业务和内容展现

在最终用户手中后,用户的操控便利性是一个很大的难题。遥控器、鼠标、

重力感应等操控手段层出不穷,但相对最自然的操控,还是语

音识别技术不断成熟,利用语音进行操控的方式

音操控方法和装置。

手指滑动、

音控制。目前,由于语

在各种终端中也不断出现。

如何通过语音有效的操控机顶盒是目前亟待解决的问题。

发明内容

本发明的目的在于解决上述问题,提供了一种语音操控方法和装置,提升了移动

本发明的技术方案为:本发明揭示了一种语音操控方法,包括:

对语音进行采样后传输至机顶盒;

机顶盒对采样的语音进行识别后转化成文字;

机顶盒对转化后的文字进行语义识别,将文字分解成控制命令、应用名称和参数

互联和三网融合的各类应用的操作便捷度。

三部分;

机顶盒基于分解出的应用名称查询是否已经在激活状态,根据控制命令控制应用

根据本发明的语音操控方法的一实施例,语音识别和语义识别由机顶盒的语音识

根据本发明的语音操控方法的一实施例,应用的操作由机顶盒的应用管理器调用

根据本发明的语音操控方法的一实施例,控制命令所控制的应用的状态包括打开/

本发明还揭示了一种语音操控装置,包括用户端装置和机顶盒,其中:

用户端装置包括采样模块,对语音进行采样后传输至机顶盒;

机顶盒包括语音识别模块、语义识别模块和应用调用模块,其中:

语音识别模块对采样的语音进行识别后转化成文字;

语义识别模块对转化后的文字进行语义识别,将文字分解成控制命令、应用

应用调用模块基于分解出的应用名称查询是否已经在激活状态,根据控制命

令控制应用的状态,并将参数送入应用进行操作。

名称和参数三部分;

激活、关闭、失活、升级、卸载。

对应的应用来实现,应用管理器的调用由机顶盒的语音控制层完成。

别层实现。

的状态,并将参数送入应用进行操作。

根据本发明的语音操控装置的一实施例,控制命令所控制的应用的状态包括打开/

本发明对比现有技术有如下的有益效果:本发明的方案是在语音识别之后进行语

义识别,将语音命令分解成控制命令、应用名称和参数,然后调用相应的应

理。相较于传统技术,本发明可以推广到接受语音操控的数码

顶盒、OTT、PAD、车载GPS等可以接受语音

激活、关闭、失活、升级、卸载。

用进行处

终端,包括但不限于机

输入的用户终端。

附图说明

图1示出了本发明的语音操控方法的较佳实施例的流程图。

图2示出了本发明的语音操控装置的较佳实施例的原理图。

具体实施方式

下面结合附图和实施例对本发明作进一步的描述。

图1示出了本发明的语音操控方法的较佳实施例的流程。请参见图1,本实施例

步骤S10:对语音进行采样后传输至机顶盒。

步骤S12:机顶盒的语音识别层对采样的语音进行识别后转化成文字。

步骤S14:机顶盒的语音识别层对转化后的文字进行语义识别,将文字分解成控

制命令、应用名称和参数三部分。

的语音操控方法的实施步骤详述如下。

例如,“打开电视到CCTV-1”,“打开”为控制,“电视”为电视应用,“CCTV-1”

为传入电视应用的参数。为可动态增加应用的个数,此过程需要检索应用注

册数据库。

对于一个应用来说,控制状态有:打开/激活:应用未运行在内存中,打开后变成

激活状态,或者应用处于失活挂起状态后,转变成当前应用状态;关闭:将

转为关闭状态,释放资源;失活:从当前运行状态变成非当前

升级:应用进行升级操作;卸载:删除应用;挂

用户看来基本用不上,因此只需要

指定应用

状态,但仍然在内存中;

起;后台。挂起和后台这两种在普通

考虑前5种状态。

从用户的角度看,用户的控制命令大致有这么几种:“看”电视,“玩”游戏,

“查”天气,“查”资料,“打”电话,“发”短信,“输入”姓名,“保存”通信录。

些控制语言是在语音识别并转化成“控制”“应用”“参数”这个过程中需

基本上都是“打开/激活”的意思。 要涉及到的。

应用名称是语音识别的第二部分,比如,“看电视到CCTV1”,其中的“电视”就

是应用名称。应用名称在语音控制命令中有可能会被缩略,比如,用户会用

代替说“看电视到CCTV1”,这时,需要根据控制参数来模糊

不到应用名称的,可以跳出浏览器的搜索引擎来,

如“瑞士的首都是什么?”等命令。

“看CCTV1”

判断应用名称。有些查

直接按照查询信息的方式处理。例

参数是针对某一个应用的,传进去的是一个字符串,由特定应用去处理这个字符

串,比如“看电视到CCTV1”的“CCTV1”就是应用参数。又比如“发微信给张

其中“张三”就是参数。还有一种参数,是在当前应用中的。例如,在

的时候,用户发指令“找魔戒三”,应用本身则应该在影

后开始搜索。

三”,

当前应用是VOD

片搜索中输入“魔戒三”,之

步骤S16:机顶盒基于分解出的应用名称查询是否已经在激活状态,根据控制命

机顶盒的语音控制层获取语音识别层交给的控制命令、应用名称和参数后,调用

应用管理器。应用管理器根据应用是否已经在激活状态,控制应用的状态,

送入应用进行操作。应用根据应用参数的处理,由各应用自己

令控制应用的状态,并将参数送入应用进行操作。

并将参数

响应并展现。

图2示出了本发明的语音操控装置的较佳实施例的原理,请参见图2,本实施例

用户端装置1包括采样模块10,对语音进行采样后传输至机顶盒2。机顶盒2包

括语音识别模块21、语义识别模块22和应用调用模块23。语音识别模块

语音进行识别后转化成文字。语义识别模块22对转化后的文

分解成控制命令、应用名称和参数三部分,其中

开/激活、关闭、失活、升级、卸

否已经在激活状态,

的语音操控装置包括用户端装置1和机顶盒2。

21对采样的

字进行语义识别,将文字

控制命令所控制的应用的状态包括打

载。应用调用模块23基于分解出的应用名称查询是

根据控制命令控制应用的状态,并将参数送入应用进行操作。

上述实施例是提供给本领域普通技术人员来实现和使用本发明的,本领域普通技

术人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种种修改

因而本发明的保护范围并不被上述实施例所限,而应该是符合

新性特征的最大范围。

或变化,

权利要求书所提到的创


发布者:admin,转转请注明出处:http://www.yc00.com/num/1714634941a2485043.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信