2024年5月2日发(作者:htc野火a510e)
(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(21)申请号 CN2.8
(22)申请日 2013.10.22
(71)申请人 上海云视科技有限公司
地址 201103 上海市徐汇区宜山路2016号合川大厦9楼
(72)发明人 张毅军 徐征
(74)专利代理机构 上海专利商标事务所有限公司
代理人 施浩
(51)
G10L15/22
权利要求说明书 说明书 幅图
(10)申请公布号 CN 103500578 A
(43)申请公布日 2014.01.08
(54)发明名称
语音操控方法和装置
(57)摘要
本发明公开了一种语音操控方法和
装置,提升了移动互联和三网融合的各类
应用的操作便捷度。其技术方案为:对语
音进行采样后传输至机顶盒;机顶盒对采
样的语音进行识别后转化成文字;机顶盒
对转化后的文字进行语义识别,将文字分
解成控制命令、应用名称和参数三部分;
机顶盒基于分解出的应用名称查询是否已
经在激活状态,根据控制命令控制应用的
状态,并将参数送入应用进行操作。
法律状态
法律状态公告日
法律状态信息
法律状态
权 利 要 求 说 明 书
1.一种语音操控方法,包括:
对语音进行采样后传输至机顶盒;
机顶盒对采样的语音进行识别后转化成文字;
机顶盒对转化后的文字进行语义识别,将文字分解成控制命令、应用名称和参数
机顶盒基于分解出的应用名称查询是否已经在激活状态,根据控制命令控制应用
2.根据权利要求1所述的语音操控方法,其特征在于,语音识别和语义识别由机
3.根据权利要求1所述的语音操控方法,其特征在于,应用的操作由机顶盒的应
用管理器调用对应的应用来实现,应用管理器的调用由机顶盒的语音
顶盒的语音识别层实现。
的状态,并将参数送入应用进行操作。
三部分;
控制层完成。
4.根据权利要求1所述的语音操控方法,其特征在于,控制命令所控制的应用的
状态包括打开/激活、关闭、失活、升级、卸载。
5.一种语音操控装置,包括用户端装置和机顶盒,其中:
用户端装置包括采样模块,对语音进行采样后传输至机顶盒;
机顶盒包括语音识别模块、语义识别模块和应用调用模块,其中:
语音识别模块对采样的语音进行识别后转化成文字;
语义识别模块对转化后的文字进行语义识别,将文字分解成控制命令、应用
应用调用模块基于分解出的应用名称查询是否已经在激活状态,根据控制命
6.根据权利要求5所述的语音操控装置,其特征在于,控制命令所控制的应用的
名称和参数三部分;
令控制应用的状态,并将参数送入应用进行操作。
状态包括打开/激活、关闭、失活、升级、卸载。
说 明 书
技术领域
本发明涉及语音操控技术,尤其涉及针对移动互联网和三网融合的各类应用的语
背景技术
移动互联网技术和三网融合技术,使得业务及内容大爆发,这些业务和内容展现
在最终用户手中后,用户的操控便利性是一个很大的难题。遥控器、鼠标、
重力感应等操控手段层出不穷,但相对最自然的操控,还是语
音识别技术不断成熟,利用语音进行操控的方式
音操控方法和装置。
手指滑动、
音控制。目前,由于语
在各种终端中也不断出现。
如何通过语音有效的操控机顶盒是目前亟待解决的问题。
发明内容
本发明的目的在于解决上述问题,提供了一种语音操控方法和装置,提升了移动
本发明的技术方案为:本发明揭示了一种语音操控方法,包括:
对语音进行采样后传输至机顶盒;
机顶盒对采样的语音进行识别后转化成文字;
机顶盒对转化后的文字进行语义识别,将文字分解成控制命令、应用名称和参数
互联和三网融合的各类应用的操作便捷度。
三部分;
机顶盒基于分解出的应用名称查询是否已经在激活状态,根据控制命令控制应用
根据本发明的语音操控方法的一实施例,语音识别和语义识别由机顶盒的语音识
根据本发明的语音操控方法的一实施例,应用的操作由机顶盒的应用管理器调用
根据本发明的语音操控方法的一实施例,控制命令所控制的应用的状态包括打开/
本发明还揭示了一种语音操控装置,包括用户端装置和机顶盒,其中:
用户端装置包括采样模块,对语音进行采样后传输至机顶盒;
机顶盒包括语音识别模块、语义识别模块和应用调用模块,其中:
语音识别模块对采样的语音进行识别后转化成文字;
语义识别模块对转化后的文字进行语义识别,将文字分解成控制命令、应用
应用调用模块基于分解出的应用名称查询是否已经在激活状态,根据控制命
令控制应用的状态,并将参数送入应用进行操作。
名称和参数三部分;
激活、关闭、失活、升级、卸载。
对应的应用来实现,应用管理器的调用由机顶盒的语音控制层完成。
别层实现。
的状态,并将参数送入应用进行操作。
根据本发明的语音操控装置的一实施例,控制命令所控制的应用的状态包括打开/
本发明对比现有技术有如下的有益效果:本发明的方案是在语音识别之后进行语
义识别,将语音命令分解成控制命令、应用名称和参数,然后调用相应的应
理。相较于传统技术,本发明可以推广到接受语音操控的数码
顶盒、OTT、PAD、车载GPS等可以接受语音
激活、关闭、失活、升级、卸载。
用进行处
终端,包括但不限于机
输入的用户终端。
附图说明
图1示出了本发明的语音操控方法的较佳实施例的流程图。
图2示出了本发明的语音操控装置的较佳实施例的原理图。
具体实施方式
下面结合附图和实施例对本发明作进一步的描述。
图1示出了本发明的语音操控方法的较佳实施例的流程。请参见图1,本实施例
步骤S10:对语音进行采样后传输至机顶盒。
步骤S12:机顶盒的语音识别层对采样的语音进行识别后转化成文字。
步骤S14:机顶盒的语音识别层对转化后的文字进行语义识别,将文字分解成控
制命令、应用名称和参数三部分。
的语音操控方法的实施步骤详述如下。
例如,“打开电视到CCTV-1”,“打开”为控制,“电视”为电视应用,“CCTV-1”
为传入电视应用的参数。为可动态增加应用的个数,此过程需要检索应用注
册数据库。
对于一个应用来说,控制状态有:打开/激活:应用未运行在内存中,打开后变成
激活状态,或者应用处于失活挂起状态后,转变成当前应用状态;关闭:将
转为关闭状态,释放资源;失活:从当前运行状态变成非当前
升级:应用进行升级操作;卸载:删除应用;挂
用户看来基本用不上,因此只需要
指定应用
状态,但仍然在内存中;
起;后台。挂起和后台这两种在普通
考虑前5种状态。
从用户的角度看,用户的控制命令大致有这么几种:“看”电视,“玩”游戏,
这
“查”天气,“查”资料,“打”电话,“发”短信,“输入”姓名,“保存”通信录。
些控制语言是在语音识别并转化成“控制”“应用”“参数”这个过程中需
基本上都是“打开/激活”的意思。 要涉及到的。
应用名称是语音识别的第二部分,比如,“看电视到CCTV1”,其中的“电视”就
是应用名称。应用名称在语音控制命令中有可能会被缩略,比如,用户会用
代替说“看电视到CCTV1”,这时,需要根据控制参数来模糊
不到应用名称的,可以跳出浏览器的搜索引擎来,
如“瑞士的首都是什么?”等命令。
“看CCTV1”
判断应用名称。有些查
直接按照查询信息的方式处理。例
参数是针对某一个应用的,传进去的是一个字符串,由特定应用去处理这个字符
串,比如“看电视到CCTV1”的“CCTV1”就是应用参数。又比如“发微信给张
其中“张三”就是参数。还有一种参数,是在当前应用中的。例如,在
的时候,用户发指令“找魔戒三”,应用本身则应该在影
后开始搜索。
三”,
当前应用是VOD
片搜索中输入“魔戒三”,之
步骤S16:机顶盒基于分解出的应用名称查询是否已经在激活状态,根据控制命
机顶盒的语音控制层获取语音识别层交给的控制命令、应用名称和参数后,调用
应用管理器。应用管理器根据应用是否已经在激活状态,控制应用的状态,
送入应用进行操作。应用根据应用参数的处理,由各应用自己
令控制应用的状态,并将参数送入应用进行操作。
并将参数
响应并展现。
图2示出了本发明的语音操控装置的较佳实施例的原理,请参见图2,本实施例
用户端装置1包括采样模块10,对语音进行采样后传输至机顶盒2。机顶盒2包
括语音识别模块21、语义识别模块22和应用调用模块23。语音识别模块
语音进行识别后转化成文字。语义识别模块22对转化后的文
分解成控制命令、应用名称和参数三部分,其中
开/激活、关闭、失活、升级、卸
否已经在激活状态,
的语音操控装置包括用户端装置1和机顶盒2。
21对采样的
字进行语义识别,将文字
控制命令所控制的应用的状态包括打
载。应用调用模块23基于分解出的应用名称查询是
根据控制命令控制应用的状态,并将参数送入应用进行操作。
上述实施例是提供给本领域普通技术人员来实现和使用本发明的,本领域普通技
术人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种种修改
因而本发明的保护范围并不被上述实施例所限,而应该是符合
新性特征的最大范围。
或变化,
权利要求书所提到的创
发布者:admin,转转请注明出处:http://www.yc00.com/num/1714634941a2485043.html
评论列表(0条)