- 相关推荐
基于LD3320的语音识别系统在家庭电路中的模拟应用
摘 要:本研究旨在为行动不便的残障人士或者老年人的家居生活提供便利和帮助,使他们能够通过语音识别系统对家用电器、照明系统、门窗开关等实现智能控制。通过查找资料,对比参数、价格、识别率等方面的信息,最终采用了基于LD3320的语音识别系统进行家庭电路控制模拟应用。系统由四部分构成,即:YS-LD语音识别模块、STM32单片机控制单元、LED显示单元、继电器输出单元。LD3320语音识别芯片感应语音――通过STM32单片机运算分析――发出信号――控制继电器――电器工作。经过测试,本套系统的语音辨识率高达90%,造价仅155元,并且无需用户自行建立语音模型及开发语音识别算法,降低了应用开发的技术门槛,有利于推广应用。
关键词:语音控制;单片机;语音识别芯片;
一、课题背景
学校常会组织我们到贵阳市盲聋哑学校送爱心,与残障孩子亲密互动,今年也不例外。那些残章的孩子来到这个世界,只能用他们仅存的方式去感知世界万物,在他们的世界里只有一种颜色,那就是黑色。我不禁想,在学校还有老师的照拂,可他们总有一日要长大,要开启自己的人生旅程。要是我能为他们做哪怕一点点事,就算只是为他们的家庭生活提供一些帮助也是好的。我想,如果能利用我在机器人社中学到的传感器、电子电路、单片机等专业知识,对家庭电路进行智能化改造,让家庭的电路“聪明”起来,使他们能够听得懂主人的指令而进行相应的操作,那就可以对有残障的人和对一些不良于行的病人或老人的家庭生活都能提供很大的便利。于是,有了我的这个设计――基于LD3320的语音识别系统在家庭电路中的模拟应用。
二、模型设计
(一)模块功能
(二)模型组成
(三)主要电子元件工作原理与功能说明
1、LD3320语音识别芯片
LD3320语音识别芯片采用的是ASR(Auto Speech Recognitio)技术,是YS-LD语音识别模块的核心。它是对大量的语音数据经语言学家语音模型分析,建立数学模型,并经过反复训练提取基元语音的细节特征,以及提取各基元间的特征差异,得到在统计概率最优化意义上的各个基元语音特征,最后才由资深工程师将算法以及语音模型转换成硬件芯片并应用在嵌入式系统中。
LD3320有两种使用模式,即“触发识别模式”和“循环识别模式”。可以通过编程,设置两种不同的使用模式。
触发识别模式:系统的主控MCU在接收到外界一个触发后,启动LD3320芯片的一个定时识别过程,在这个定时过程中说出要识别的语音关键词语。这个过程结束后,需要再次触发才能再次启动一个识别过程。
循环识别模式:系统的主控MCU反复启动识别过程。如果没有人说话就没有识别结果,则每次识别过程的定时到时后再启动一个识别过程;如果有识别结果,则根据识别作相应处理后再启动一个识别过程。
根据本案模型的设计特点,采用语音触发识别模式。LD3320芯片最多支持50个识别条目,每个识别条目是标准普通话的汉语拼音(小写),每2个字(汉语拼音)之间用1个空格间隔。例如表1,只需要把识别的关键词语以汉语拼音字符串的形式传送进芯片,该芯片已封装了基于标准普通话的语音模型数据和语音识别算法,无需进行任何语音训练即可投入开发应用。
2、STM32单片机控制单元
本案模拟系统主控单元采用意法半导体ARM-Cortex架构的STM32F1系列超低功耗单片机作为控制核心。
该单元完成几大功能:
向LD3320模块提供时钟振荡信号,以驱动片上DSP(数字信号处理器 )工作;
通过SPI(串行外设接口)串行通信方式向LD3320模块写入预定义的控制命令拼音串,并读取语音模块返回的识别结果编码;
根据识别结果驱动负载电路(LED单元(发光二极管)、继电器单元)的动作。
当LD3320模块完成一次识别过程后,通过中断请求方式通知主控单元处理,主控单元获知中断请求后会暂时中止当前的任务执行,转而跳转到中断服务例程(ISR Route),在该例程中通过SPI总线从LD3320模块读取识别编码,根据识别编码的不同执行对应控制功能。通过点亮、熄灭指令对应发光二极管或驱动继电器接通主回路得到运行结果。
3、LED显示单元
本案模拟系统用六个共阳极发光二极管(LED)来模拟家庭中厨房、工作间、卧室、走廊、卫生间、阳台的灯泡开关状况,工作时主控单片机则根据语音命令,采用输出低电平方式进行驱动点亮。
4、继电器输出单元
继电器输出单元可接收主控单片机的高低电平控制信号以接通或断开主回路。主回路根据实际需求可以用于大电压,交、直流供电的负载驱动。本案模拟系统用继电器单元实现家庭电扇的通断控制。
(四)系统软件开发环境
本案模拟系统的软件开发只针对STM32F103主控单元进行,软件代码完成以下功能:
LD3320底层驱动(对其内部寄存器的读写、时序的控制);
STM32F103硬件单元和用户变量的初始化;
用户语音命令拼音串的写入;
中断服务ISR(完成负载电路的驱动控制)。
软件开发基于ARM公司的Keil开发环境,完成从代码编辑到编译、调试、烧写一系列过程。
(五)设备成本
三、设备实测
(一)控制命令
LD3320语音识别芯片中最多可以写入50条语音控制指令,可以根据用户需要定制个性化的语音控制功能。本案设备的设计初衷是为了探索LD3320语音识别芯片在家庭电路中的模拟应用,故只写入了比较基本的18条指令。
(二)设备测试
在写入程序,完成硬件连线并加电复位后,系统即进入运行状态。向系统说出控制命令(尽可能用普通话, 不过实测时对贵阳本地方言还是有较高识别率),比如说“厨房打开”、“走廊关闭”、“电扇启动”、“运行流水灯”等命令后,系统会根据识别结果执行对应动作,点亮/熄灭LED或者通/断电扇运行。
为了更好的检测语音识别效果,实验中选择多个不同音色的人在家庭(比较安静)环境下分别进行测试,每个词语测试50遍。部分非特定人的语音命令测试的正确识别数据比例见表4:由上表可知,在家庭(比较安静)环境下,对于语音命令的平均识别率可达到90%以上。
四、设备优势与应用展望
(一)设备优势
1、本案设备成本低、语音辨识率高、响应快速,可以直接安装于家庭电路中实现语音智能控制。
2、由于LD3320 可以动态编辑的识别关键词语列表,因此其可以应用的范围大大超过了那些不可以改变识别列表的芯片。
3、可以根据用户的需求进行控制命令写入,实现可定制、个性化的智能控制。
(二)应用展望
1、应对家庭生活突发状况
在本语音识别系统中只是初步尝试了对用电器通、断电控制,而在现在社会中有很多的空巢老人,他们独自生活,如果在家中出现意外或突发疾病,随时都有可能危及生命。如果在本案系统中可以添加“紧急呼叫”的语音控制,当出现突发状况时可以使用该功能触发电话自动拨打物管、救护车、亲属等重要联系人。或者该控制与小区物管相连,每当有人有紧急呼叫时,物管的终端紧急呼叫灯亮起,并触发扬声器发出警报声,使物管人员迅速到场解决问题。
2、实现家用电器的语音控制
(1)电磁炉/微波炉/智能家电操作
在现在的家电中,各种各样的设置越来越繁复。用户在使用过程中,还要不断地对家电进行功能切换。在引入LD3320 芯片后,可以用语音直接控制这些家电。比如用语音来控制电磁炉把火力调整到“煎炸”或者是“慢炖”。
(2)数码像框
数码像框中存放了许多的照片和视频,同时又具有多种播放的方式。一般是通过按键或者遥控器的方式来对其进行操作,但是这样的操作并不方便。在引入了LD3320 提供的语音识别功能后,用户可以最自然地用语音去点播想要显示的照片,或者改变数码像框的显示方式。使得这样的数码产品更加具有人性化的操作界面。
3、机顶盒/彩电遥控器
随着数字电视的普及,家庭中可以收看到的电视节目也越来越丰富。大家也就苦于在众多的频道中迅速选择到自己想要看的频道。在把LD3320 语音识别芯片集成进机顶盒/彩电遥控器后,用户只需要对着遥控器说出想要看的电视频道的名字,就可以快速地选择。比如用户可以说出“奥运体育”,就可以转到体育频道来观看精彩的体育比赛了。
4、智能玩具/对话玩具
在电视购物中曾经出现过可以人机对话的玩具,比如金福猪,金福狗等。这些玩具采用的语音识别只能支持固定的10 条左右的语音命令,比如“你好”,“我想听歌”等等。采用LD3320 芯片,可以利用其动态编辑识别关键词语列表的性能,让玩具实现及其复杂的对话脚本。避免了玩具的严重同质化。
(三)公共服务设施的语音控制
1、自动售货机、地铁自动售票机等销售型服务设施
在自动售货机、地铁自动售票机等销售型服务设施中安装语音操作模块。人们可以对着售货机说出要买的商品,比如“可口可乐”或者“面巾纸”投币后商品就自动售出。在北京、上海等大都市中,外地旅客较多,对地铁线路不熟悉导致买票时不知道票价也不知道如何购买。有了语音操作界面后,只需要对着售票机说出要去的地方或者想要到达的站点,根据屏幕提示放入纸币,就可以方便地买到车票。
2、公共照明系统、辅助设施的语音控制
在公共场合帮助残疾人士、行动不便的老人或小孩非接触地去控制公共照明系统或辅助设施(地下通道轮椅台等)的运行。
3、楼宇电视的广告点播
目前分众传媒等公司的楼宇广告设施,遍布几乎所有的写字楼,也在广告投放上取得了良好的效果。但是目前用户在接受广告时,都是被动地去接受信息。对于其中感兴趣的广告,只能是等待下次再看到时进行仔细地了解,没有办法进行主动式地广告查询。
引入LD3320 语音识别芯片后,用户可以用语音去方便地查询想要了解的广告信息。比如操作楼宇广告“重新播放”“上一条”来重新观看一条广告。或者“汽车”来点播想要看的汽车广告。
这样的语音操作,不需要增加额外的键盘输入和触摸屏输入,又可以让用户与广告充分互动,取得更佳的效果。
五、结语
使用LD3320 芯片可以在一定程度上完成这样的语音控制系统,给人们的生活带来更便利的语音交互界面。作为一种新的人机交互界面,会逐步地走入人们的日常生活,在适合用语音控制的地方给人们提供更多的便利。
参考文献:
[1]陈喜春.基于LD3320语音识别专用芯片实现的语音控制,[J]. 电子技术设计与应用. 2011年11月
[2]金鑫,田犇,阙大顺. 基于的LD3320语音控制系统设计实现.[J].电脑与信息技术.2011年12月.第19卷第6期
[3]洪家平.LD3320的嵌入式语音识别系统的应用.[J].单片机与嵌入式系统应用.2012年.第2期
【基于LD3320的语音识别系统在家庭电路中的模拟应用】相关文章:
AMBE-1000在语音压缩中的应用03-19
语音处理芯片AC48105在低速语音编码设备中的应用03-18
语音参数提取在聋儿学习中的应用03-07
SPCE061A在语音遥控器中的应用03-25
串口服务器在车号识别系统中的应用03-16