语音操控方法和装置

admin•2025-09-17 09:57:39•数码科技•阅读105

语音操控方法和装置

2024年5月2日发(作者：htc野火a510e)

(19)中华人民共和国国家知识产权局

(12)发明专利说明书

(21)申请号 CN2.8

(22)申请日 2013.10.22

(71)申请人上海云视科技有限公司

地址 201103 上海市徐汇区宜山路2016号合川大厦9楼

(72)发明人张毅军徐征

(74)专利代理机构上海专利商标事务所有限公司

代理人施浩

(51)

G10L15/22

权利要求说明书说明书幅图

(10)申请公布号 CN 103500578 A

(43)申请公布日 2014.01.08

(54)发明名称

语音操控方法和装置

(57)摘要

本发明公开了一种语音操控方法和

装置，提升了移动互联和三网融合的各类

应用的操作便捷度。其技术方案为：对语

音进行采样后传输至机顶盒；机顶盒对采

样的语音进行识别后转化成文字；机顶盒

对转化后的文字进行语义识别，将文字分

解成控制命令、应用名称和参数三部分；

机顶盒基于分解出的应用名称查询是否已

经在激活状态，根据控制命令控制应用的

状态，并将参数送入应用进行操作。

法律状态

法律状态公告日

法律状态信息

法律状态

权利要求说明书

1.一种语音操控方法，包括：

对语音进行采样后传输至机顶盒；

机顶盒对采样的语音进行识别后转化成文字；

机顶盒对转化后的文字进行语义识别，将文字分解成控制命令、应用名称和参数

机顶盒基于分解出的应用名称查询是否已经在激活状态，根据控制命令控制应用

2.根据权利要求1所述的语音操控方法，其特征在于，语音识别和语义识别由机

3.根据权利要求1所述的语音操控方法，其特征在于，应用的操作由机顶盒的应

用管理器调用对应的应用来实现，应用管理器的调用由机顶盒的语音

顶盒的语音识别层实现。

的状态，并将参数送入应用进行操作。

三部分；

控制层完成。

4.根据权利要求1所述的语音操控方法，其特征在于，控制命令所控制的应用的

状态包括打开/激活、关闭、失活、升级、卸载。

5.一种语音操控装置，包括用户端装置和机顶盒，其中：

用户端装置包括采样模块，对语音进行采样后传输至机顶盒；

机顶盒包括语音识别模块、语义识别模块和应用调用模块，其中：

语音识别模块对采样的语音进行识别后转化成文字；

语义识别模块对转化后的文字进行语义识别，将文字分解成控制命令、应用

应用调用模块基于分解出的应用名称查询是否已经在激活状态，根据控制命

6.根据权利要求5所述的语音操控装置，其特征在于，控制命令所控制的应用的

名称和参数三部分；

令控制应用的状态，并将参数送入应用进行操作。

状态包括打开/激活、关闭、失活、升级、卸载。

说明书

技术领域

本发明涉及语音操控技术，尤其涉及针对移动互联网和三网融合的各类应用的语

背景技术

移动互联网技术和三网融合技术，使得业务及内容大爆发，这些业务和内容展现

在最终用户手中后，用户的操控便利性是一个很大的难题。遥控器、鼠标、

重力感应等操控手段层出不穷，但相对最自然的操控，还是语

音识别技术不断成熟，利用语音进行操控的方式

音操控方法和装置。

手指滑动、

音控制。目前，由于语

在各种终端中也不断出现。

如何通过语音有效的操控机顶盒是目前亟待解决的问题。

发明内容

本发明的目的在于解决上述问题，提供了一种语音操控方法和装置，提升了移动

本发明的技术方案为：本发明揭示了一种语音操控方法，包括：

对语音进行采样后传输至机顶盒；

机顶盒对采样的语音进行识别后转化成文字；

机顶盒对转化后的文字进行语义识别，将文字分解成控制命令、应用名称和参数

互联和三网融合的各类应用的操作便捷度。

三部分；

机顶盒基于分解出的应用名称查询是否已经在激活状态，根据控制命令控制应用

根据本发明的语音操控方法的一实施例，语音识别和语义识别由机顶盒的语音识

根据本发明的语音操控方法的一实施例，应用的操作由机顶盒的应用管理器调用

根据本发明的语音操控方法的一实施例，控制命令所控制的应用的状态包括打开/

本发明还揭示了一种语音操控装置，包括用户端装置和机顶盒，其中：

用户端装置包括采样模块，对语音进行采样后传输至机顶盒；

机顶盒包括语音识别模块、语义识别模块和应用调用模块，其中：

语音识别模块对采样的语音进行识别后转化成文字；

语义识别模块对转化后的文字进行语义识别，将文字分解成控制命令、应用

应用调用模块基于分解出的应用名称查询是否已经在激活状态，根据控制命

令控制应用的状态，并将参数送入应用进行操作。

名称和参数三部分；

激活、关闭、失活、升级、卸载。

对应的应用来实现，应用管理器的调用由机顶盒的语音控制层完成。

别层实现。

的状态，并将参数送入应用进行操作。

根据本发明的语音操控装置的一实施例，控制命令所控制的应用的状态包括打开/

本发明对比现有技术有如下的有益效果：本发明的方案是在语音识别之后进行语

义识别，将语音命令分解成控制命令、应用名称和参数，然后调用相应的应

理。相较于传统技术，本发明可以推广到接受语音操控的数码

顶盒、OTT、PAD、车载GPS等可以接受语音

激活、关闭、失活、升级、卸载。

用进行处

终端，包括但不限于机

输入的用户终端。

附图说明

图1示出了本发明的语音操控方法的较佳实施例的流程图。

图2示出了本发明的语音操控装置的较佳实施例的原理图。

具体实施方式

下面结合附图和实施例对本发明作进一步的描述。

图1示出了本发明的语音操控方法的较佳实施例的流程。请参见图1，本实施例

步骤S10：对语音进行采样后传输至机顶盒。

步骤S12：机顶盒的语音识别层对采样的语音进行识别后转化成文字。

步骤S14：机顶盒的语音识别层对转化后的文字进行语义识别，将文字分解成控

制命令、应用名称和参数三部分。

的语音操控方法的实施步骤详述如下。

例如，“打开电视到CCTV-1”，“打开”为控制，“电视”为电视应用，“CCTV-1”

为传入电视应用的参数。为可动态增加应用的个数，此过程需要检索应用注

册数据库。

对于一个应用来说，控制状态有：打开/激活：应用未运行在内存中，打开后变成

激活状态，或者应用处于失活挂起状态后，转变成当前应用状态；关闭：将

转为关闭状态，释放资源；失活：从当前运行状态变成非当前

升级：应用进行升级操作；卸载：删除应用；挂

用户看来基本用不上，因此只需要

指定应用

状态，但仍然在内存中；

起；后台。挂起和后台这两种在普通

考虑前5种状态。

从用户的角度看，用户的控制命令大致有这么几种：“看”电视，“玩”游戏，

这

“查”天气，“查”资料，“打”电话，“发”短信，“输入”姓名，“保存”通信录。

些控制语言是在语音识别并转化成“控制”“应用”“参数”这个过程中需

基本上都是“打开/激活”的意思。要涉及到的。

应用名称是语音识别的第二部分，比如，“看电视到CCTV1”，其中的“电视”就

是应用名称。应用名称在语音控制命令中有可能会被缩略，比如，用户会用

代替说“看电视到CCTV1”，这时，需要根据控制参数来模糊

不到应用名称的，可以跳出浏览器的搜索引擎来，

如“瑞士的首都是什么？”等命令。

“看CCTV1”

判断应用名称。有些查

直接按照查询信息的方式处理。例

参数是针对某一个应用的，传进去的是一个字符串，由特定应用去处理这个字符

串，比如“看电视到CCTV1”的“CCTV1”就是应用参数。又比如“发微信给张

其中“张三”就是参数。还有一种参数，是在当前应用中的。例如，在

的时候，用户发指令“找魔戒三”，应用本身则应该在影

后开始搜索。

三”，

当前应用是VOD

片搜索中输入“魔戒三”，之

步骤S16：机顶盒基于分解出的应用名称查询是否已经在激活状态，根据控制命

机顶盒的语音控制层获取语音识别层交给的控制命令、应用名称和参数后，调用

应用管理器。应用管理器根据应用是否已经在激活状态，控制应用的状态，

送入应用进行操作。应用根据应用参数的处理，由各应用自己

令控制应用的状态，并将参数送入应用进行操作。

并将参数

响应并展现。

图2示出了本发明的语音操控装置的较佳实施例的原理，请参见图2，本实施例

用户端装置1包括采样模块10，对语音进行采样后传输至机顶盒2。机顶盒2包

括语音识别模块21、语义识别模块22和应用调用模块23。语音识别模块

语音进行识别后转化成文字。语义识别模块22对转化后的文

分解成控制命令、应用名称和参数三部分，其中

开/激活、关闭、失活、升级、卸

否已经在激活状态，

的语音操控装置包括用户端装置1和机顶盒2。

21对采样的

字进行语义识别，将文字

控制命令所控制的应用的状态包括打

载。应用调用模块23基于分解出的应用名称查询是

根据控制命令控制应用的状态，并将参数送入应用进行操作。

上述实施例是提供给本领域普通技术人员来实现和使用本发明的，本领域普通技

术人员可在不脱离本发明的发明思想的情况下，对上述实施例做出种种修改

因而本发明的保护范围并不被上述实施例所限，而应该是符合

新性特征的最大范围。

或变化，

权利要求书所提到的创

发布者：admin，转转请注明出处：http://www.yc00.com/num/1714634941a2485043.html

应用语音控制识别操控

admin

建站资讯
云讯科技开放平台产品接入操作指南API接口文档
云讯科技开放平台产品接入操作指南API接口文档
admin
2024-6-13
1130
建站资讯
重大商务英语翻译第三次翻译作业-词类转换A
重大商务英语翻译第三次翻译作业-词类转换A
admin
2024-6-13
760
建站资讯
有关于英语常用介词的英语短语
有关于英语常用介词的英语短语
admin
2024-6-17
990
建站资讯
ajax中的success方法
ajax中的success方法
admin
2024-6-18
710
建站资讯
解密Android测试中的UI自动化测试框架
解密Android测试中的UI自动化测试框架
admin
2024-6-19
500
建站资讯
android控制ui界面的方法
android控制ui界面的方法
admin
2024-6-19
990
网站建设
Android移动应用开发基础教程教学大纲
Android移动应用开发基础教程教学大纲
admin
2024-6-19
880
建站资讯
Android移动应用开发基础教程(微课版)习题答案
Android移动应用开发基础教程(微课版)习题答案
admin
2024-6-19
930
建站资讯
基于Ajax和Servlet实现无刷新动态Web应用
基于Ajax和Servlet实现无刷新动态Web应用
admin
2024-6-21
590
建站资讯
DWCS5属性的英文翻译[资料]
DWCS5属性的英文翻译[资料]
admin
2024-7-2
670
网站建设
HTML5中的Article和Section元素认识及使用
HTML5中的Article和Section元素认识及使用
admin
2024-7-4
540
网站建设
利用Cordova进行跨平台移动开发
利用Cordova进行跨平台移动开发
admin
2024-9-6
500
网站建设
最新AI智能问答AI绘画软件系统，TTS & 语音对话，文档分析、GPT-4o多模态识图理解，一站式AIGC解决方案
一、前言人工智能语言模型和AI绘画在多个领域都有广泛的应用。以下是一些它们的主要用处： 语言模型问答内容生成写作辅助：帮助撰写文章、博客、报告、剧本等。代码生成：
admin
9月前
270
网站建设
ChatGPT高级语音助手正式上线！OpenAI：50多种语言、9种声线可选
①OpenAI终于要面向其所有付费用户开放ChatGPT的类人高级人工智能（AI）语音助手功能——“高级语音模式”（AVM）；②
admin
9月前
260
网站建设
部分阉割版Win7无法正常使用TTS语音的解决办法（转载）
参考资料： http:blog.sinasblog_88bdc35c0102vd0e.html http:wwwblogsleritp3486854.html 最近在项目中用到了微软的TTS语音功能&
admin
6月前
230
网站建设
win7讲述人安装包_Win7如何使用语音朗读？Win7开启语音播报讲述人的方法
Win7电脑如何使用语音朗读功能？现在智能手机都有语音播报功能，而操作电脑时却没有该功能，很多用户表示很不习惯，于是咨询小编电脑是否有语音播报功能&am
admin
4月前
350
网站建设
Win7系统TTS语音修复安装包介绍
Win7系统TTS语音修复安装包介绍【下载地址】Win7系统TTS语音修复安装包介绍 Win7系统TTS语音修复安装包专为解决Windows 7操作系统下TTS语音功能无法使用的问题而设计。部分用户因系统非正版导致TTS语音缺失&
admin
1月前
290
网站建设
如何用Java语言对接WiFi语音播报器
如何用Java语言对接WiFi语音播报器呢？本文描述了使用Java语言调用HTTP接口，对接WiFi语音播报器，。可选用产品：可根据实际场景需求
admin
1月前
230
网站建设
【重磅推荐】2024年文本转语音工具汇总，总有一款满足你的需要
文字转语音工具对比名称分类适合人群是否收费VPot FREEPC端工具音视频创作者完全免费TTS-VuePC端工具音视频创作者完全免费ClipchampPC端工具音视频创作者完全免费EdgeTTS by MansonPC端工具音视频创作
admin
1月前
180
网站建设
综合设计II-异构多核：基于DM8168的语音信号处理（一）环境配置
目录 1、提前准备（1）安装VMware和Ubuntu （2）windows与Linux剪切板互通（3）虚拟机与主机的文件传输共享文件夹配置 (4)对磁盘进行扩充（5）提前安装的东西 2、开始环境配置（1）下载环境配置文件到共享文
admin
1月前
190

发表回复

评论列表（0条）

暂无评论

语音操控方法和装置

发表回复

评论列表（0条）

联系我们

400-800-8888

语音操控方法和装置

相关推荐

发表回复

评论列表（0条）

联系我们

400-800-8888