基于 RTL8723DS +A113 开发的智能音箱模块设计方案
一、前言
本文引用地址:http://www.amcfsurvey.com/article/202208/436895.htmAI智能音箱是人工智能与传统音箱结合的产物。其基本原理是用户使用自然语言与机器(即音箱)交流,音箱通过识别用户的语音指令完成相应任务,如点播音乐、收听新闻、设置日程、查询信息等。当今AI智能音箱,已被认为是物联网时代的入口,在去年成为了各大厂商争相投入的风口。因它不仅仅是一台单纯的音乐播放器,在其背后支撑的 AI 技术才是整个产品的核心,也是各大公司觊觎物联网入口的最根本原因。经历了2017年的爆发式增长,到现在AI智能音箱已经成为最热门的硬件产品之一,因此各种客制化的产品如雨后春笋般的喷涌而出。
二、基于“RTL8723DS +A113”开发的智能音箱模块设计
鉴于市场的蓬勃发展,我们审时度势,推出基于“RTL8723DS +A113”开发的智能音箱模块设计,更加方便工程师的应用需求,注意 Amlogic/A113 开发手册目前只面向 Rokid 开发者提供。如未注册成为Rokid 开发者,请先至 Rokid 官网注册成为开发者,具体请访问https://developer.rokid.com/。
1)开发板套件基本参数介绍
1.1. Rokid语音整体方案 通过接入Rokid智能语音服务,您可以为配有麦克风和扬声器的联网硬件设备添加语音交互体验,使得您的手机、电视、音箱等智能设备轻松拥有语音交互的能力。
· Rokid语音整体方案,融合了从前端硬件的远场拾音、降噪、回声消除等技术,到语音识别、语义理解、自然语言合成等AI技术和iot物联网技术,提供硬件到软件全链路解决方案,助力开发者快速实现产品的智能化。
· Rokid语音整体方案,还针对行业或者特定场景,提供行业和场景解决方案,包括传统制造行业,运营商以及互联网行业和智能音箱解决方案、儿童故事机解决方案、智能电视解决方案
同时,平台还提供了包括内容类、工具类和互动类等不同类型的垂直语音技能。您的设备接入Rokid后,即可使用众多丰富有趣的 Rokid 公有技能,您也可以为自己的设备创建个性化的私有技能。
1.2. 接入方案类型
· 全链路通用方案:包括前端语音激活/降噪以及 Rokid 语音识别服务和语音合成服务的相关能力。
· 基础语音模块:基础语语音服务的输出,包括语音识别服务和语音合成服务。
· 全开源方案:YODAOS系统,可根据厂商或者个人开发者的需求,灵活修改,也欢迎开发者一起建设。
· CPU: Amlogic A113X A53x4 up to 1.5Ghz
· Memory: 256MB DDR3 + 512MB Nand Flash
· Mic Array: PDM mic x 4 Audio:line out 3.5mm
· Network:802.11 a/b/g/n/ac
· Bluetooth: BT 4.1/BLE LED: RGB
· LED x 12
· DC in:USB-Type C 5V
► 方案方块图
► 原理方框图
► 核心技术优势
1,支持实时快速、精确的云端识别和远场拾音, 5米距离识别准确率高达>92%。
2,识别输出支持流式格式,能够实时地得到当前识别的结果,根据字段判断是否返回最终结果。
3,为保证用户口音和生僻字、方言的识别,针对用户粒度配置误识别较高的纠错指令,通过app端的人工干预,进行识别的纠正。
4,支持通用领域识别和垂直领域定制识别,定期增加领域数据,快速迭代,持续提升识别率。
► 方案规格
· 模组尺寸小,满足小尺寸应用场景
· 工作温度-20℃+70℃;
· 工作电压3.8V-4.2V,建议4V供电;
· 支持数字音频和模拟音频,支持HR,FR,EFR,AMR语音编码;
· 支持802.11 b/g/n 2.4GHz
· 支持HT20/HT40模式
· 支持低功耗信标监听模式,低功耗接收模式,低功耗挂起模式
· 支持SWD调试端口访问保护和禁止模式
· Wi-Fi和BT共用同一天线
· 支持串口本地升级和远程固件升级(FOTA)
评论