基于语音识别的破袋处理智能垃圾桶设计
Design of an Intelligent Garbage Bin for Handling Broken Bags Based on Speech Recognition
摘要: 校园垃圾定点定时投放存在投放时间集中且短时投放量大的问题,对此本论文基于语音识别技术,设计了一种新型校园智能垃圾桶,旨在解决传统垃圾桶中环卫工人需要手动破袋分类垃圾的问题。通过分析用户语音指令,智能垃圾桶能够自动识别垃圾种类,并根据分类要求自动投放。实验结果表明,该系统在提高垃圾桶使用便捷性和用户体验方面取得了显著效果。本研究为智能垃圾桶设计领域提供了一种创新的解决方案,具有广泛的应用前景。文章应用STM32微控制器作为核心控制元件,采用SU-03T离线语音模组与STM32的通讯,完成智能垃圾桶的语音识别智能化分类处理,利用控制器来控制舵机旋转实现垃圾桶投放口分类、电推杆的上升下降实现垃圾的破袋、压缩以及湿垃圾袋的再分类。
Abstract: There is a problem of concentrated disposal time and large amount of short-term disposal of campus garbage. Based on speech recognition technology, this paper designs a new type of campus intelligent garbage bin, aiming to solve the problem of environmental sanitation workers needing to manually break bags and classify garbage in traditional garbage bins. By analyzing user voice commands, the intelligent garbage bin can automatically recognize the type of garbage and automatically dispose it according to classification requirements. The experimental results show that the system has achieved significant results in improving the convenience and user experience of using trash cans. This study provides an innovative solution for the field of intelligent trash can design, with broad application prospects. The article applies the STM32 microcontroller as the core control component, and uses the SU-03T offline voice module to communicate with STM32 to achieve intelligent speech recognition and classification processing of the intelligent garbage bin. The controller is used to control the rotation of the servo to achieve the classification of the garbage bin opening, the rise and fall of the electric push rod to achieve the breaking and compression of garbage bags, and the re-classification of wet garbage bags.
文章引用:高恬, 李如雪, 谢佳宏, 江立, 徐吟川. 基于语音识别的破袋处理智能垃圾桶设计[J]. 人工智能与机器人研究, 2024, 13(2): 450-458. https://doi.org/10.12677/airr.2024.132046

1. 引言

研究背景及意义

校园垃圾往往采用多个垃圾桶分类式投法,尤其湿垃圾还需要投放者手动破袋,将液体倒入湿垃圾桶后,再将垃圾袋分类至干垃圾桶中。开放式投递导致异味飘散,学生投放意愿降低,且80%的垃圾还需通过环卫工人再分类。

目前国内高校也引入了智能垃圾桶的使用 [1] 。南通大学的智能垃圾箱可以通过语音识别自动开盖分类,但垃圾桶靠太阳能板发电存在晚上不能使用的问题,且单件投放耗时长,对校园垃圾投放量大的问题不能很好的解决。复旦新能源垃圾桶可以通过感应自动开盖,并借助语音助手小诺对投放的垃圾进行指导分类。但感应会同时打开四个分类箱,最终还需投放者手动将干湿垃圾分类,投放至匹配的垃圾箱。中国计量大学设计的智能垃圾服务站采用人脸识别感应的方式实现自动开盖,然后将投放数据实时上传至校园数据平台实行监管,同样存在需要手动分类的问题。综上所述,校园智能垃圾桶的应用大部分都是在自动开盖和语音识别上辅助投放者进行垃圾投放,在功能上实现了自动开盖分类的功能。用户只需说出垃圾的种类,比如“干垃圾”、“湿垃圾”等,垃圾桶就会自动打开相应的分类口。通过对小区居民调查、校园走访,以及亲身体验,市面上的智能分类垃圾桶始终没有解决人们的一些痛点,人们在投放的过程中还是需要手动处理湿垃圾。

因此,本论文以湿垃圾破袋再分类为创新点,在前人运用AI语音识别自动开盖的基础上,做到将垃圾智能分类、湿垃圾破袋再分类。用户只需做到简单的上挂动作,配合语音就可以使垃圾得到合理的分类处理,解决了投放者需要手动拆袋的痛点问题。一口两桶的设计应用于宿舍区域,节省了分类时间。桶内的压缩装置解决了垃圾量大的问题,且湿垃圾桶的滤液可直接通过下水管道排出。当垃圾桶内垃圾体积满溢时,通过app提醒环卫工人回收,避免垃圾堆叠的情况,同时也减少了环卫工人的工作量,体现现代设备的智能化和使用的优越性。

2. 垃圾桶整体设计

图1为智能垃圾桶的三维模型展示,“如图1(a)所示”为静置状态下,当用户对智能垃圾桶使用唤醒词后,语音识别模块会自动识别用户指令,底部步进马达带动旋转支撑上的托盘旋转至对应匹配的桶。此时,语音识别提示放入垃圾袋,电磁插销向右弹开,露出约二十厘米口径的投放口,用户将垃圾袋悬停三秒后,电磁插销自动向左合上,实现挂袋。

挂袋操作完成后,若投放垃圾为干垃圾,则在匹配旋转对应的桶后,电磁插销自动弹开,垃圾袋掉入干垃圾桶后,旋转至初始状态,再由干垃圾桶上方固定的内推杆带动压块向下压缩。若投放垃圾为湿垃圾,在完成挂袋操作后,电磁插销保持闭合状态,并由电动连杆带动垃圾袋做向下的运动,“如图1(b)所示”。在下降过程中,湿垃圾袋触碰到湿垃圾桶内的破袋装置,停留三秒后,垃圾袋与液体分离,悬挂的垃圾袋做上升运动,同时旋转匹配干垃圾桶,电磁插销自动弹开,垃圾袋掉入干垃圾桶内,实现垃圾袋回收,最后再复原到初始状态。

Figure 1. 3D Model display of intelligent garbage bin

图1. 智能垃圾桶三维模型展示

2.1. 主要机构设计

1) 上挂升降装置“如图2所示”,电推杆电源选择24 V,带磁性环升降位置可调节。

Figure 2. Hanging lifting device

图2. 上挂升降装置

2) 回转装置“如图3所示”,舵机电源选择24 V。

Figure 3. Rotating device

图3. 回转装置

3) 湿垃圾桶的破袋过滤装置“如图4所示”。

Figure 4. Bag breaking filter device

图4. 破袋过滤装置

4) 干垃圾压缩装置“如图5所示”,压块18上设置压力传感器。

Figure 5. Dry garbage compression device

图5. 干垃圾压缩装置

2.2. 智能分类破袋工作流程

首先通过语音唤醒词,例如语音提示“湿垃圾”,系统会输出提醒“请投放湿垃圾”,此时电磁插销电磁铁6工作通电退出,5 s后断电伸出,湿垃圾袋5挂在电磁插销上,系统根据传感器识别判断湿垃圾的位置是否正确,如果不正确,舵机2带动托盘3转到湿垃圾4的位置后,电推杆12开始下降,垃圾袋底部与破袋锥16接触,继续下行直到设定位置,等待10 s后电推杆12回程。推杆回程回到设定位置后,舵机2开始旋转带动托盘3转180˚,旋转到位后湿垃圾袋的下方是干垃圾桶19,电磁插销10打开,湿垃圾袋掉入干垃圾桶内。

2.3. SU-03T离线语音模组

SU-03T是一款低成本、低功耗、小体积的语音识别模组 [2] ,它具备强大的软件开发定制能力,用户可以使用“智能公元”平台,配置模组的PIN脚、语音识别、输入和输出控制等各项能力,生成语音SDK,并在平台上直接编译、生成固件,实现零代码开发。基板及电路图“如图6所示”。

Figure 6. SU-03T substrate and circuit diagram

图6. SU-03T基板及电路图

2.4. STM32微控制器

本文智能垃圾桶设计选用STM32F103VET6指南者开发板作为主控芯片,“如图7所示”STM32F103VET6的主要特点:

1) 内核和性能:基于ARM Cortex-M3内核,最高运行频率为72 MHz,具有高性能和低功耗的优势。

2) 存储和存储器:具有512 KB的闪存和64 KB的SRAM,可以存储大量的应用程序和数据。

3) 外设:多个通用IO引脚(GPIO)用于连接外部设备和传感器。还包括多个串行通信接口(SPI, I2C, USART)和通用定时器(TIM)用于实现通信和定时功能。

4) ADC和DAC:具有12位模数转换器(ADC)和12位数模转换器(DAC),可以实现模拟信号的输入和输出。

Figure 7. STM32 Compass development edition

图7. STM32指南者开发版

5) 时钟和电源管理:支持多种低功耗模式和时钟源选择,可根据应用需求灵活控制功耗和性能。

6) 通信接口:支持USB、CAN、Ethernet等常用通信接口,方便与其他设备进行数据交互。

7) 开发工具和支持:意法半导体提供了丰富的开发工具和软件库,例如STM32Cube和HAL库,以便开发者进行快速开发和调试。

2.5. 电源设计

本文智能垃圾桶选用的电推杆、舵机、电磁插销选用的是电压是24 V,主控芯片、语音识别模块及相关传感器电压5 V,“如图8所示”锂电池移动电源能适配智能垃圾桶的电源设计。

Figure 8. 24 V lithium mobile power supply

图8. 24 V锂电移动电源

3. 软件控制

3.1. 系统控制

本系统硬件设计主要由:STM32微控器、SU-03T离线语音模组、舵机模块、电推杆、VS1053音频模块以及电源模块。SU-03T离线语音模组分析和识别语音信号将识别的结果,通过串口发送给STM32微控制器。微控制器通过外置的传感器接收输入状态后,自动运行舵机到指定位置,电推杆上升下降破袋、压缩,音频模块状态提醒。系统控制图“如图9所示”。

Figure 9. System control diagram

图9. 系统控制图

3.2. 语音识别

SU-03T离线语音模组用户可以使用“智能公元”平台 [3] ,配置模组的PIN脚、语音识别、输入和输出控制等各项能力,生成语音SDK,并在平台上直接编译、生成固件,实现零代码开发。该芯片集成了语音识别处理器和麦克风接口、声音输出接口。设置常用语音指令,直接说话可被识别,常应用于智能家居和语音控制嵌入式产品设计。智能垃圾分类语音识别模块输出“如图10图11所示”,为语音识别自定义串口设置。

3.3. STM32微控制器

本文选用STM32F103VET6指南者开发板作为主控芯片 [4] ,其扩展性强,外设丰富。在STM32主控芯片KEIL 5开发环境中,其容易操作的优点,非常适合STM32的开发使用。模块中包括了串口的初始化、语音识别模块的初始化等基本模块。

Figure 10. Speech recognition module

图10. 语音识别模块

Figure 11. Custom serial port settings for speech recognition

图11. 语音识别自定义串口设置

4. 硬件测试

4.1. 语音识别

目前垃圾桶的设计分为干垃圾和湿垃圾,用户可以简单使用干垃圾或湿垃圾的语音实现与垃圾桶的语音交互,也可以通过说出对应的垃圾具体名称由语音识别判断输出。

语音识别测试主要目的是为了设置最佳的参数以提供垃圾分类的准确性。

测试分别在30~40 dB较为安静环境和50~60 dB相对嘈杂环境对语音指令进行了100次测试 [5] 。若垃圾桶能根据语音指令正确匹配分类桶即判定本次语音识别成功,播报错误或无反应则判定本次语音识别失败。语音数据库针对宿舍生活垃圾共储存近百种垃圾数据。

测试数据显示,虽然嘈杂环境中对语音识别的成功率比安静环境下的要低,但整体平均识别每个语音指令的识别成功率均在84.0%以上,智能垃圾桶的语音识别系统较好地实现了语音交互的功能。

4.2. 破袋模拟测试,“如图12所示”

1) 选择市场标准塑料垃圾袋,尺寸为40 cm × 45 cm。

2) 按照垃圾袋的容积,分别装1/5、2/5、3/5、4/5的汤液进行破袋测试(分别5次)。

3) 电推杆下降到一个行程,再回到上死点,记录汤液残留出所需时间。

4) 残留状况目测确认(和人工正常倒出比较)。

Figure 12. Hanging picture on broken bag

图12. 破袋上挂图

以下为实验记录的数据“如表1所示”。

Table 1. Bag breaking experiment data

表1. 破袋实验数据

从以上数据可以分析出,破袋过程均可以正常刺破,时间不超过10秒钟,残留的状况和手动倾倒状态相差无几,这和设计的目标一致。

5. 结语

本文基于语音识别技术的智能分类破袋垃圾桶的设计,主要通过对垃圾桶说出“垃圾分类”指令,以此来唤醒SU-03T语音识别模块。在发出特定的垃圾语音信息后,STM32随即语音播报发出提醒指令,同时STM32主控模块驱动舵机旋转到对应的垃圾桶位置。电动推杆上升下降完成湿垃圾袋的破袋和湿垃圾袋的再分类动作。本文的创新点在于只要用户一个动作,就可实现湿垃圾的破袋和湿垃圾袋的再分类,完美解决了用户投放湿垃圾时需要手动破袋实现垃圾分类的痛点问题。经过对系统设计的功能测试表明,系统基本能够完成所需功能并具有较强的稳定性。

基金项目

上海市级大学生创新训练项目(cs2303011)。

NOTES

*第一作者。

#通讯作者。

参考文献

[1] 张文武. 基于语音识别的多功能智能垃圾桶设计[D]: [硕士学位论文]. 合肥: 合肥学院, 2022.
https://doi.org/10.27876/d.cnki.ghfxy.2022.000028
[2] 胡斌, 程浩轩, 吴俊豪, 等. 基于物联网技术的老人智能拐杖设备[J]. 机电工程技术, 2023, 52(9): 46-51.
[3] 王小祥. 语音无线控制设计[J]. 南方农机, 2018, 49(24): 130 141.
[4] 孙景伟, 丁学用. 基于智能语音识别的智能分类垃圾桶设计[J]. 无线互联科技, 2022, 19(3): 75-76.
[5] 陈广振, 李孟珍, 刘明亮, 等. 一种多功能智能垃圾桶设计与实现[J]. 黑龙江大学工程学报(中英俄文), 2023, 14(4): 48-54.
https://doi.org/10.13524/j.2097-2873.2023.04.49