前言:
**SCI精读是一项高投入、高回报的科研投资。 它初期看似缓慢,但从长远看,它是构建深厚学术功底、敏锐科研嗅觉和强大创新能力的唯一捷径。将精读养成习惯,它最终会从一项“任务”变成一种能带给你巨大成就感和乐趣的“能力”,介于此,本Up主开设sci领读课程,旨在让小伙伴们在快乐中快速具备论文写作能力!**本专栏为视频课程中的文章翻译!
B站干货戳这里!!!
解读视频戳这里!!!!
原文链接戳这里!!!# DHSW-YOLO:一种适应明亮和黑暗环境的鸭群日常行为识别模型
摘要
准确监测动物行为节律至关重要,目前弱光环境下的动物行为识别仍面临挑战。本研究以白羽番鸭(White Muscovy ducks, WMD)为研究对象,提出一种深度学习模型DHSW-YOLO(DH-SENet-WIoU-YOLO),用于检测明亮和黑暗环境下鸭群的日常行为,同时满足实时检测的速度要求。该模型基于YOLOv8网络结构,简化了YOLOv8的检测头,并引入SENet注意力机制和WIoU v3损失函数。结果表明,与原始YOLOv8相比,DHSW-YOLO的检测效果显著提升:平均精度均值(mAP)从92.2%提升至94.4%,模型大小减少2.8 MB,推理时间加快1.2 ms,参数数量减少8.7%。其中,DHSW-YOLO在明亮环境下的mAP为94.8%,黑暗环境下为93.6%,表明该模型能有效监测明暗环境下白羽番鸭的行为。研究提出的轻量化和优化方法切实可行,为鸭群行为节律自动化监测预警系统提供了技术参考。
关键词
白羽番鸭;行为检测;YOLO;注意力机制;行为节律
1 引言
在家禽福利养殖中,监测行为节律至关重要。鸡、鸭、鹅等家禽的行为节律能反映其健康状况(Ahmed等,2024)、生长情况(Wu等,2022)和福利水平(Vasdal等,2022)。监测家禽群体行为节律可帮助管理者及时决策和干预(Ahmed等,2024),减少损失(Coton等,2019)。家禽的基本群体行为往往呈现稳定节律(Bessei等,2023),若其进食、饮水、站立或俯卧等行为频率出现异常,可能意味着健康状况不佳(Ravishankar等,2022),或因环境应激产生应激反应(Liu等,2023;Oluwagbenga和Fraley,2023)。目前,家禽养殖中的行为监测主要依赖人工,缺乏时效性和管理效率,因此亟需一种能高效监测家禽群体基本行为节律的方法。本研究的目标是提出一种鲁棒性强的深度学习模型,替代人工在明亮和黑暗环境下实时检测鸭群日常行为。
目前,部分研究者采用可穿戴设备采集和识别动物行为,该方法已在猪(Alghamdi等,2022;Pan等,2023)、牛(Arcidiacono等,2021;Brouwers等,2023)、羊(Kleanthous等,2022;Turner等,2023)等大型动物中得到验证,基础行为检测效果良好。但在 poultry 等规模化养殖场景中,基于可穿戴技术的行为识别成本过高——家禽个体价值远低于其他大型动物,监测成本超出绝大多数家禽养殖场的预算。此外,佩戴传感器会引发家禽应激反应,水禽尤为明显(Anderson等,2023)。
与可穿戴设备相比,计算机视觉技术具有成本更低、对动物应激更小、效率更高等优势。近年来,随着计算机性能的提升和机器学习技术的发展,计算机视觉与畜禽养殖相结合的技术逐渐成为动物行为节律识别的研究热点(Guo等,未注明日期;Xiaohui等,2019;Zhang等,2023)。肖通过双目视觉系统,结合二维图像分割、三维图像重建等计算机视觉技术,提出了一种笼养鸡行为信息获取的检测方法(Xiao等,2019);李采用模板匹配、阈值分割等计算机视觉技术识别肉鸡的进食和饮水行为,平均准确率分别达到91%和94%(Li等,2020b)。上述研究的共同特点是需要人工设计特征提取算法,可能受研究者先验知识的限制。而深度学习模型擅长自动提取特征,可进一步提升家禽行为识别的准确性,相关最新研究成果如表1所示。杨在散养环境下对20只蛋鸡进行行为监测,采用俯视摄像头成功捕捉站立、俯卧、进食、饮水、啄食、梳理羽毛等行为,所用YOLOv5模型在日间光照条件下识别率达84.6%(Duanli等,2023);刘小虎在笼养环境下对2只鸭进行监测,通过侧视摄像头记录鸭的站立、俯卧、进食、饮水行为,应用Faster R-CNN模型在光照条件下实现93.0%的高识别率(Xiaohu等,2023)。上述研究表明,通过深度学习技术检测家禽行为可进一步提高识别精度,为本文的鸭群行为检测提供了技术参考,但均未涉及关灯后黑暗环境下的行为识别。而家禽在黑暗环境下的基本行为节律也需要监测(Schwean-Lardner等,2012;Yu和Li,2023)。
表1 相关最新研究成果
| 研究 | 养殖方式 | 摄像头视角 | 光照条件 | 行为类别 | 方法 | 平均精度均值(%) |
|---|---|---|---|---|---|---|
| Li等(2020a) | 笼养(6只雏鸡) | 俯视 | 明亮和黑暗 | 饮水 | Faster R-CNN | 88.2 |
| Duanli等(2023) | 散养(20只蛋鸡) | 俯视 | 明亮 | 站立、俯卧、进食、饮水、啄食、梳理羽毛 | YOLOv5 | 84.6 |
| Xiaohu等(2023) | 笼养(2只鸭) | 侧视 | 明亮 | 站立、俯卧、进食、饮水 | Faster R-CNN | 93.0 |
| Yue等(2023) | 笼养(2只鸭) | 侧视 | 明亮和弱光 | 休息、进食、梳理羽毛、踩踏、啄食 | YOLOv4 | 96.9 |
目前,弱光环境下的动物行为识别检测仍面临挑战。Li采用Faster R-CNN模型在笼养环境下监测6只雏鸡的饮水行为,实验在明亮和黑暗条件下进行,采用俯视摄像头,但准确率仅为88.2%(Li等,2020a),这可能是由于未对网络结构进行改进。通过改进网络结构可提高识别精度:凌杜提出一种基于改进YOLOv5的黑暗环境下鱼类养殖行为实时检测方法,引入CBAM注意力机制以放大不同深度特征并抑制无关特征,从而提高模型检测精度(Du等,2023);顾悦在YOLOv4中引入SimAM(Yang等,2021)模块,用于检测笼养环境下鸭的行为,实验在明亮和弱光条件下进行,采用侧视摄像头,模型识别率高达96.9%(Yue等,2023);季伟提出一种基于多尺度金字塔融合图像增强和MobileCenterNet模型的水下河蟹目标检测方法,采用改进的MobileNetv2骨干网络结合坐标注意力模块提取河蟹特征,既实现轻量化,又能使模型注意力集中于河蟹相关特征(Ji等,2023)。上述研究表明,在模型中引入注意力机制有助于提升弱光环境下的识别能力。此外,在损失函数改进方面,较少有研究者通过改进损失函数来提高模型在弱光环境下的精度。因此,本研究的重点是提出一种能适应明亮和黑暗环境的鸭群基本行为识别模型。
为构建一种鲁棒性强、可适应明亮和黑暗环境的鸭群基本行为(站立、俯卧、进食、饮水)识别模型,本文以最新的YOLOv8模型为基础,通过引入SENet注意力机制和改进损失函数,提升明暗环境下鸭群日常行为识别的准确性;通过优化检测头,降低模型计算复杂度和参数数量,提高模型识别效率。本研究提出的弱光环境鲁棒模型实现了鸭群行为的实时自动化监测,养殖户可通过鸭群行为自动化监测平台准确监测鸭群行为,及早发现健康问题并干预,从而提高养殖效率和动物福利。
本研究的主要贡献如下:
(1)在YOLOv8基础上,提出一种鲁棒性强的深度学习模型,可替代人工在明亮和黑暗环境下实时检测鸭群日常行为;
(2)提出一种基于DHSW-YOLO算法的鸭群日常行为统计方法,能准确监测鸭群特定事件和行为节律。
2 材料与方法
2.1 试验地点与数据采集设备
白羽番鸭数据采集于中国广东省云浮市飞雷肉鸭养殖场的6个室内养殖箱(图1(a))。每个室内养殖箱饲养12只健康白羽番鸭,初始日龄90天。养殖箱顶部安装日光灯,内侧壁两侧分别设有食槽和饮水管(图1(c))。实验采用两种光照模式:模式A模拟室外环境,16小时光照、8小时黑暗,每日21:05关灯,次日05:05自动开灯;模式B采用24小时连续光照(图1(b))。每种模式重复3组实验,为消除养殖位置干扰,两种模式的养殖箱交错布置。
实验数据采集时间为2023年3月28日至2024年4月26日,采用具备夜视功能的RGB摄像头(型号KS2A42,焦距3.6 mm)拍摄视频数据。摄像头安装于室内养殖箱顶部正中央,连接至计算机(图1(c)),其视场可覆盖整个养殖箱,且能在黑暗环境下采集视频数据。通过Python脚本文件采集视频数据,每小时保存一次,便于后续算法分析;视频分辨率设为1280×720,帧率为10帧/秒。
2.2 数据集构建
白羽番鸭视频数据采集完成后,从所有养殖箱的视频数据中每100帧提取一张图像,构建白羽番鸭行为识别数据集。为避免数据集中出现高度相似的图像样本,提取过程中采用SSIM算法(Wang等,2004)衡量图像间的相似度,当提取图像与上一张提取图像的SSIM值小于0.65时,保留当前提取图像。随后使用LabelImg标注工具对白羽番鸭的行为进行标注,本研究选取4种关键日常行为:站立、俯卧、进食、饮水,行为判断标准如表2所示,每种行为示例如图2所示。站立时,鸭身体直立,无其他部位接触地面,头部抬起且警觉;俯卧时,身体伏于地面,头部缩进身体,呈放松姿态。数据集分为训练集(1448张图像)、验证集(490张图像)和测试集(490张图像),训练集和验证集数据来自图1(a)中的A1、A2、B1、B2养殖箱,测试集数据来自A3、B3养殖箱,总图像数2448张,三者比例为6:2:2。数据集中共有29376个行为实例,其中站立16110个、俯卧9783个、进食1897个、饮水1270个。
(a)养殖箱布局 (b)光照策略 (c)养殖箱细节
图1 白羽番鸭数据采集示意图。(a)养殖箱布局;(b)光照策略:模式A模拟室外环境,16小时光照、8小时黑暗;模式B采用24小时连续光照;(c)养殖箱细节
表2 白羽番鸭行为判断标准
| 行为类型 | 行为定义 |
|---|---|
| 站立 | 单腿或双腿伸直站立,身体其他部位不接触地面,身体呈舒展状态 |
| 俯卧 | 身体俯卧或平躺于地面,腹部接触地面,头部通常向身体方向缩进,可见脚部 |
| 进食 | 头部伸入食槽,低头进食 |
| 饮水 | 嘴巴接触白色饮水泡器,颈部伸直 |
图2 各行为示例:(a)-(d)站立行为;(e)-(h)俯卧行为;(i)-(l)进食行为;(m)-(p)饮水行为(左列:光照条件;右列:黑暗条件)
2.3 白羽番鸭行为检测DHSW-YOLO算法构建
YOLO(You Only Look Once)是单阶段目标检测网络的代表,检测速度快,随着YOLO系列的演进,检测精度不断提升。YOLOv8是YOLO系列的最新模型,其网络结构主要包括骨干网络(Backbone)、颈部网络(Neck)和检测头(Head)三部分:骨干网络采用C2f模块进行轻量化设计,提升收敛速度和效果;SPPF模块对不同尺度下池化后的特征图进行拼接;颈部网络采用PAN(Liu等,2018)的思想,通过自下而上的特征提取和自上而下的特征融合实现特征增强;上采样(Upsample)模块采用最近邻插值算法,将特征图尺寸放大一倍;拼接(Concat)模块将骨干网络输出的特征图与上采样后的特征图融合,结合低层和高层语义信息;检测头采用解耦头结构,将分类头与检测头分离,缓解分类和回归任务的内在冲突。
为使模型更适用于白羽番鸭行为检测,尤其是黑暗环境下的弱光图像检测,本研究对YOLOv8模型进行改进,提出DHSW-YOLO模型(图3),具体改进如表3所示。
2.3.1 双检测头(DH)
原始YOLOv8可检测小、中、大三种尺度的目标,但本研究中的白羽番鸭日龄相同,体型相近,行为幅度差异较小,因此可减少网络的检测尺度。经计算,本研究数据集中白羽番鸭行为的最小像素尺寸为195×69,在40×40尺度特征图下交并比(IoU)最大;最大像素尺寸为263×309,在20×20尺度特征图下IoU最大。因此,本研究删除80×80检测头,保留40×40和20×20双检测头,该调整不仅提高了模型检测效率,还降低了计算量,为模型轻量化奠定基础。
2.3.2 SENet注意力机制模块
原始YOLOv8在目标检测中表现良好,但未能突出通道特征的重要性,在处理白羽番鸭间的重叠遮挡(尤其是黑暗环境下)时,可能导致关键特征丢失,降低模型识别精度。因此,本研究在原始YOLOv8的骨干网络后添加SENet模块(Hu等,2018),SENet模块结构如图4所示。
SENet模块分为三步:第一步为压缩(Squeeze)阶段,对输入的W×H×C特征图进行全局平均池化,将每个通道的特征压缩为1×1×C的C维向量,通道数保持不变;第二步为激励(Excitation)阶段,用于捕捉通道间的关系,通过两个全连接层从向量中提取各通道的权重——第一个全连接层将维度降至C/16,经ReLU函数激活;第二个全连接层将维度恢复至C,通过sigmoid函数将通道权重约束在0-1之间,使网络为每个通道学习自适应权重,权重越低表示该通道特征越不重要,需较少关注;最后为缩放(Scale)阶段,将得到的通道权重与原始输入特征层相乘,调整各通道的重要性,从而增强网络对关键特征的注意力。通过引入SENet模块,不仅提高了模型对白羽番鸭行为的识别能力,还显著增强了其对复杂环境的适应性。
2.3.3 智慧交并比(WIoU)
原始YOLOv8采用完全交并比(CIoU)(Zheng等,2020)作为边界框损失函数,CIoU损失考虑了重叠面积、质心距离和长宽比三个几何因素,其计算公式如式(1)-(3)所示。但在目标识别检测中,当锚框与目标框完全对齐时,长宽比惩罚系数恒为0,无法反映实际情况,可能导致漏检,此时CIoU退化为IoU;此外,CIoU对高质量样本和低质量样本(锚框与目标框的IoU值大小)采用相同的损失计算方式。本研究中黑暗环境下的图像亮度多为灰色,与明亮环境图像相比包含更多低质量样本,而距离、长宽比等几何指标会加剧对低质量样本的惩罚,导致模型泛化性能下降。
其中,b和(b^{g t})分别表示锚框和目标框的质心,(p(b, b^{g t}))表示锚框与目标框质心的欧氏距离,C为锚框和目标框最小外接矩形的对角线长度,α为权衡参数,v为两框长宽比的一致性,(w^{g t})和(h^{g t})分别表示目标框的宽度和高度,w和h分别表示锚框的宽度和高度。
因此,本研究采用新型WIoU(Tong等,2023)替代CIoU,选用WIoU v3版本(在WIoU v1基础上添加非单调聚焦系数得到)。WIoU v1的计算公式如式(4)-(6)所示:
其中,x和y为锚框中心点坐标,(x_{g t})和(y_{g t})表示目标框中心点坐标,(W_{g})和(H_{g})为锚框和目标框最小外接矩形的宽度和高度,(\mathscr{R}{WIoU })主要用于关注锚框与目标框的中心距离,与目标框重叠度越低的锚框,会得到越大的(\mathscr{R}{WIoU })。
为减少对低质量样本的梯度惩罚,Tong利用异常度β构建非单调聚焦系数γ,并将其应用于WIoU v1,得到具有动态非单调聚焦机制的WIoU v3(Tong等,2023),计算公式如式(7)-(9)所示:
其中,β为描述锚框质量的异常度,异常度β越高表示锚框质量越差,α和δ为超参数,与异常度β共同构建非单调聚焦系数γ。该系数既降低了高质量样本的竞争力,又减少了低质量样本产生的有害梯度,使WIoU v3能动态非单调地聚焦于普通样本,提高模型的泛化能力和整体性能。
图3 DHSW-YOLO网络结构
表3 DHSW-YOLO的具体改进
| 改进内容 | 预期效果 |
|---|---|
| 双检测头 | 使模型聚焦于图像中白羽番鸭最常见的目标尺寸,提高检测效率,减少计算冗余 |
| SENet注意力机制模块 | 增强模型在弱光条件下区分目标与背景的能力,提高检测精度 |
| 智慧交并比(WIoU) | 通过对低质量样本(弱光环境图像)分配更多权重,提高弱光环境下的行为检测精度 |
图4 SENet通道注意力机制模块
2.4 基于DHSW-YOLO算法的白羽番鸭日常行为统计
本研究利用上述DHSW-YOLO模型设计视频处理机制,监测16小时光照、8小时黑暗条件下白羽番鸭的日常行为统计。由于视频帧率为10帧/秒,结合计算资源成本和白羽番鸭动作的平均持续时间,本研究选取每秒第一帧图像表征白羽番鸭当前秒的行为,通过训练良好的DHSW-YOLO算法模型从该帧图像中提取鸭的日常行为。为防止漏检和鸭突发死亡情况,通过计算每帧图像中白羽番鸭各行为的发生次数占总行为次数的比例,表征当前秒白羽番鸭的行为;随后计算5分钟内白羽番鸭日常行为的累积占比P,最终将16小时光照、8小时黑暗条件下的P值绘制成日常行为图,观察白羽番鸭全天站立、俯卧、进食、饮水行为的分布情况。其中,5分钟内白羽番鸭日常行为的累积占比P用四个符号表示:站立(P_{stand})、俯卧(P_{prone})、进食(P_{eat})、饮水(P_{drink}),如式(10)-(13)所示:
其中,300表示5分钟包含300秒,s表示第s秒,(K_{s, stand })表示第s秒白羽番鸭站立行为的发生次数,(K_{s, prone })表示第s秒白羽番鸭俯卧行为的发生次数,(K_{s, eat })表示第s秒白羽番鸭进食行为的发生次数,(K_{s, drink })表示第s秒白羽番鸭饮水行为的发生次数。
3 结果与讨论
3.1 实验环境与评估指标
3.1.1 实验环境
DHSW-YOLO算法的训练和测试在Windows 10系统环境下进行,配置CUDA 11.7并行计算框架、CuDNN深度学习加速库和PyTorch 2.0.1深度学习框架;编程平台为PyCharm,编程语言为Python 3.10;硬件配置为Intel® Core™ i5-12400F处理器(2.50 GHz)、NVIDIA GeForce RTX 3060显卡和16 GB内存。训练过程中,模型输入尺寸设为640×640像素,确保模型能处理足够大的图像以捕捉鸭行为细节;共训练100个epoch,批次大小为16;采用随机梯度下降(SGD)算法优化模型,结合WIoU v3平衡高质量和低质量样本(α=1.9,δ=3);分类损失函数采用Focal Loss(gamma=1.5,alpha=0.25);训练过程中采用Mosaic数据增强策略;初始学习率设为0.01,动量为0.973,权重衰减为0.0005,采用余弦学习率调度策略管理损失衰减过程。
3.1.2 评估指标
为验证所提白羽番鸭行为检测模型的性能,选取模型大小(Model size)、推理时间(Inference time)、参数数量(Parameters)以及精确率(Precision)、召回率(Recall)、平均精度均值(mAP)作为评估指标,计算公式如式(14)-(16)所示,数值越高表明模型效果越好。
其中,模型大小表示模型占用的存储空间;推理时间表示模型识别一张图像所需的时间;参数数量表示评估模型的空间复杂度,即模型各网络层的总字节数;TP表示模型正确预测为正样本的正样本数量,FP表示模型错误预测为正样本的负样本数量,FN表示模型错误预测为负样本的正样本数量;精确率表示正确检测到的目标占所有检测到目标的比例;召回率表示正确检测到的目标占所有真实目标的比例;平均精度(AP)表示白羽番鸭每种行为的检测精度;mAP表示白羽番鸭所有行为类别的平均检测精度。本研究中mAP的IoU阈值设为0.5(mAP@0.5),该指标是广泛认可和使用的评估标准,便于与其他模型结果对比,更好地评估模型性能。
3.2 白羽番鸭日常行为检测模型的鲁棒性分析
为验证所提DHSW-YOLO算法对白羽番鸭行为识别的有效性,在包含明亮和黑暗环境的数据集上对该算法进行测试。实验结果显示,该算法的mAP为94.4%,精确率为91.6%,召回率为92.1%,模型大小为19.7 MB,推理时间为5.5 ms,参数数量为10.15 M。上述结果表明,该研究方法能在明亮和黑暗环境下准确、可靠地实时识别白羽番鸭行为,为不同光照条件下白羽番鸭的实时行为节律分析提供了技术支持。
3.2.1 白羽番鸭行为检测模型的消融实验
为进一步探究本研究对YOLOv8网络改进的有效性,设计6组消融实验,分析双检测头、WIoU损失函数和SENet注意力机制模块对白羽番鸭行为识别结果的影响。消融实验保持一致的硬件环境和模型训练参数设置,相关消融实验结果如图5和表4所示,其中图5展示了消融实验结果的mAP和验证损失曲线。
图5 消融实验结果。(a)平均精度均值(mAP);(b)验证损失(ValLoss)
为探究双检测头的有效性,在原始YOLOv8网络中删除80×80尺度特征的检测头,对删除的特征通道进行特征融合,保留40×40和20×20尺度特征的检测头。图5中仅保留双检测头的模型YOLOv8s-DH与原始模型YOLOv8s在mAP和验证损失曲线方面差异不大,训练前期损失略有波动,训练20轮后趋于稳定。表4中,YOLOv8s-DH的mAP与YOLOv8s相同,各行为的AP差异不大甚至略有提升,但白羽番鸭俯卧行为的AP下降0.9%,这可能是由于鸭俯卧时个体间存在遮挡或部分身体隐藏在食槽下方,导致视觉信息不完整,区分俯卧行为的有效特征较少,因此俯卧行为的识别结果略有下降。此外,通过删除80×80尺度特征的检测头,网络实现轻量化,YOLOv8s-DH的参数数量从11.13 M减少至10.12 M,确保了网络的检测效率,提高了网络的实时性,使网络更轻量化。参数数量的减少和推理速度的提升对模型的工程应用至关重要,轻量化模型更适合部署在边缘设备上,为未来白羽番鸭行为的实时监测提供了可能,且能在资源受限环境下快速响应。
表4 消融实验结果对比
| 模型 | 参数数量(M) | 平均精度均值(%) | 各行为AP(%) | |||
|---|---|---|---|---|---|---|
| 站立 | 俯卧 | 进食 | 饮水 | |||
| YOLOv8s | 11.13 | 92.2 | 93.0 | 91.0 | 92.9 | 92.1 |
| YOLOv8s-DH | 10.12 | 92.2 | 93.4 | 90.1 | 93.0 | 92.4 |
| YOLOv8s-SE | 11.17 | 93.4 | 94.2 | 92.0 | 94.4 | 93.0 |
| YOLOv8s-WIoU | 11.13 | 93.0 | 93.6 | 91.9 | 94.0 | 92.5 |
| YOLOv8s-SE-WIoU | 11.17 | 94.2 | 94.4 | 92.1 | 97.7 | 92.6 |
| DHSW-YOLO(本研究) | 10.15 | 94.4 | 94.6 | 92.2 | 98.5 | 92.3 |
注:粗体表示最优参数和结果
为验证SENet模块的有效性,在原始YOLOv8网络的SPPF模块后添加SENet模块。图5显示,添加SENet的模型YOLOv8s-SE比YOLOv8s具有更优的mAP和验证损失曲线;表4结果显示,YOLOv8s-SE的mAP为93.4%,比YOLOv8s提升1.2%,且在站立、俯卧、进食、饮水行为上的AP均比原始YOLOv8s有所提升,同时参数数量相近。这表明引入SENet模块区分通道特征的重要性,有助于构建更优的白羽番鸭行为识别模型。
为分析WIoU损失函数对原始YOLOv8的贡献,将原始YOLOv8模型中使用的CIoU损失函数替换为WIoU损失函数。图5显示,YOLOv8s-WIoU的mAP和验证损失曲线与YOLOv8s-SE差异不大,但优于原始YOLOv8s;表4实验结果显示,引入WIoU损失函数使模型mAP提升0.8%,且参数数量几乎不变。这可能归因于WIoU损失函数设计的动态非单调聚焦机制策略,通过减少对低质量样本的梯度惩罚,更多地关注普通样本,从而提高网络模型的泛化能力和整体性能。
上述结果表明,通过结合双检测头、SENet注意力机制模块和WIoU损失函数,基于YOLOv8s改进得到的DHSW-YOLO模型相比原始YOLOv8s模型,对白羽番鸭行为的识别更准确,同时更轻量化。
3.2.2 明亮和黑暗环境下与不同主流模型的结果对比
以往研究为各类动物识别任务中白羽番鸭行为检测提供了基础,但大多未涉及黑暗环境下的动物检测。在大多数算法中,黑暗环境下拍摄的图像始终是检测算法面临的挑战。本研究考虑了明亮和黑暗不同条件对模型的可能影响,构建了包含明亮环境图像和黑暗环境图像的自制数据集。为验证DHSW-YOLO算法在明亮和黑暗环境下的有效性,将其与Faster R-CNN、SSD、YOLOv5、YOLOv7、RT-DETR(Zhao等,2023)、YOLOv9(Wang等,2024)和原始YOLOv8等优秀目标检测算法进行对比。首先在训练集上分别训练这七种算法,然后在同一测试集上评估白羽番鸭行为检测性能,采用mAP、明亮环境平均精度均值(mAP-L)、黑暗环境平均精度均值(mAP-D)、模型大小、推理时间、参数数量六个指标进行评估,实验结果如表5所示。
表5 不同主流模型的结果对比
| 模型 | 平均精度均值(%) | 明亮环境平均精度均值(%) | 黑暗环境平均精度均值(%) | 模型大小(MB) | 推理时间(ms) | 参数数量(M) |
|---|---|---|---|---|---|---|
| Faster R-CNN | 92.7 | 93.5 | 91.2 | 108.0 | 159.0 | 137.19 |
| SSD | 90.5 | 91.5 | 89.2 | 92.1 | 113.1 | 26.29 |
| YOLOv5s | 90.8 | 92.0 | 88.4 | 8.0 | 7.0 | 7.03 |
| YOLOv7 | 91.8 | 92.3 | 89.4 | 74.8 | 18.6 | 36.49 |
| YOLOv8s | 92.2 | 92.9 | 90.5 | 22.5 | 6.7 | 11.13 |
| RT-DETR | 92.5 | 89.6 | 86.3 | 66.2 | 31.9 | 31.99 |
| YOLOv9s | 89.0 | 93.3 | 90.1 | 6.0 | 20.8 | 7.20 |
| DHSW-YOLO(本研究) | 94.4 | 94.8 | 93.6 | 19.7 | 5.5 | 10.15 |
注:粗体表示最优参数和结果;mAP-L和mAP-D分别为明亮和黑暗环境下图像的平均精度均值
对上述主流算法与所提算法的白羽番鸭行为检测测试结果进行分析,表5显示,在检测精度方面,本研究提出的DHSW-YOLO算法优于Faster R-CNN、SSD、YOLOv5s、YOLOv7、RT-DETR、YOLOv8s和YOLOv9s算法,其对白羽番鸭行为检测的mAP、mAP-L、mAP-D分别为94.4%、94.8%、93.6%,明亮和黑暗环境下的白羽番鸭行为检测精度差异较小,且优于其他六种算法。性能提升不仅得益于针对弱光环境优化的数据集构建,更重要的是算法层面的根本性改进——DHSW-YOLO算法通过引入SENet注意力机制和WIoU v3损失函数,显著增强了模型在弱光环境下的目标识别能力。在模型复杂度方面,DHSW-YOLO算法在模型大小、推理时间和参数数量上均优于Faster R-CNN、SSD、YOLOv7、RT-DETR、YOLOv8s和YOLOv9s算法,其模型大小和参数数量与YOLOv5s、YOLOv9s相近,而推理时间优于YOLOv5s和YOLOv9s,表明DHSW-YOLO算法具有良好的实时检测能力,有利于将模型迁移至边缘设备应用。因此,综合检测精度和模型复杂度,DHSW-YOLO模型能在保证实时检测的同时,可靠地检测明亮和黑暗场景下白羽番鸭的日常行为。
不同白羽番鸭行为的检测结果反映了模型对目标特征的识别能力,尤其是黑暗环境下对白羽番鸭的识别能力。本研究从数据集中随机选取2张明亮环境图像和2张黑暗环境图像,分别采用Faster R-CNN、SSD、YOLOv5s、YOLOv7、YOLOv8s、RT-DETR、YOLOv9s和DHSW-YOLO模型进行检测,检测结果如图6所示。
图6 不同主流模型在明亮和黑暗环境下的检测结果(包括重复检测、错误检测和漏检)
从图6的检测结果可以看出,Faster R-CNN、YOLOv8s和YOLOv9s对白羽番鸭行为的检测效果较好,但仍存在错误检测和重复检测情况;SSD、YOLOv5s、YOLOv7和RT-DETR在黑暗环境下的检测结果较差,其中SSD存在2次漏检和2次错误检测,RT-DETR存在9次错误检测,YOLOv5s和YOLOv7无漏检,但分别存在6次和5次错误检测。这可能是由于鸭身体局部部位重叠导致关键特征丢失,或鸭身体区域光线较暗,模型未突出关键特征,从而引发检测错误。本研究提出的DHSW-YOLO网络在YOLOv8s基础上进一步改进并进行轻量化优化,在保证检测效果的同时减少了参数数量,增强了对白羽番鸭区域关键特征的注意力。因此,综合检测精度、模型复杂度和检测结果,DHSW-YOLO模型对白羽番鸭行为的识别效果最佳,有利于后续白羽番鸭日常行为的统计分析。
3.2.3 模型的可视化分析
深度学习算法的可解释性是理解其工作原理的重要参考,GradCAM(Selvaraju等,2020)可将模型对白羽番鸭行为特征的关注区域以热力图形式展示。因此,为进一步验证DHSW-YOLO在白羽番鸭日常行为检测中的有效性,选取2张随机的明亮环境图像和1张黑暗环境图像,利用DHSW-YOLO模型生成输出层两种不同尺度(40×40和20×20)的热力图,可视化白羽番鸭不同身体部位在行为识别中的作用,结果如图7所示。
图7 输出层不同尺度的热力图。(a)本模型的检测结果;(b)DHSW-YOLO 40×40尺度热力图;(c)DHSW-YOLO 20×20尺度热力图
图7(a)为DHSW-YOLO模型的检测结果,图7(b)和(c)为DHSW-YOLO模型利用GradCAM在该图像上生成的输出层不同尺度(40×40和20×20)的热力图。与蓝色覆盖区域相比,红色和黄色覆盖区域是DHSW-YOLO模型更关注的区域,颜色越红表示该区域对模型的贡献越大。图7(b)和(c)显示,图7(c)中白羽番鸭身上的红色和黄色覆盖区域呈完整块状,可能表明模型更关注白羽番鸭本身的定位和检测;而图7(b)中白羽番鸭身上的红色和黄色覆盖区域呈较多小而密集的块状,可能表明模型更关注白羽番鸭日常行为的特征区域——例如,对于白羽番鸭的饮水和进食行为,图7(b)中白羽番鸭的头部和颈部是对行为识别贡献较大的区域,这与人工识别时的关注区域一致。
3.2.4 与相关最新研究成果的对比
本研究提出的DHSW-YOLO模型在明亮和黑暗环境下均表现出较高的鸭行为识别精度,丰富了该领域的研究成果(如表1所示)。Li等(2020a)在笼养环境下采用俯视摄像头,聚焦6只雏鸡在明亮和黑暗条件下的饮水行为,采用Faster R-CNN方法,mAP达88.2%。该研究为不同光照条件下的行为识别提供了有价值的参考,但研究范围仅限于单一行为和少量研究对象。Duanli等(2023)采用俯视摄像头,在散养环境下监测20只蛋鸡在明亮条件下的多种行为,采用YOLOv5方法,mAP达84.6%,但未解决弱光环境下的检测挑战,而这正是本研究的重要研究方向。Xiaohu等(2023)同样在笼养环境下采用侧视摄像头,利用Faster R-CNN方法检测2只鸭在明亮条件下的多种行为,mAP达93.0%,与Li等的研究类似,其研究范围有限,仅针对少量鸭和单一光照条件。Yue等(2023)通过引入MobileNetV2骨干网络和SimAM注意力模块改进YOLOv4模型,在笼养环境下采用侧视摄像头,能充分捕捉2只鸭在明亮和弱光条件下的行为,mAP高达96.9%。与上述研究相比,本研究在室内养殖环境下检测12只鸭在明亮和黑暗条件下的日常行为,由于弱光环境、鸭群密度增加以及鸭间遮挡等因素,检测场景更为复杂;此外,本研究采用俯视摄像头监测密度相对较大的鸭群,在弱光条件下鸭的遮挡问题更为突出。尽管面临这些挑战,DHSW-YOLO模型在明亮和黑暗条件下仍保持94.4%的高mAP,比Li等(2020a)、Duanli等(2023)和Xiaohu等(2023)的研究精度显著提高。在明亮和黑暗条件下检测多种鸭行为的研究中,Yue等(2023)的准确率达96.9%,这一高精度得益于其研究在仅饲养2只鸭的笼养环境中进行,侧视拍摄能无遮挡地捕捉鸭的全部行为,自然准确率更高;而本研究涉及更大的鸭群密度,存在遮挡问题,且弱光条件下遮挡更为严重,但仍保持94.4%的准确率,这一对比凸显了本模型在处理多鸭、明暗环境复杂场景时的鲁棒性。
3.3 明亮和黑暗环境下白羽番鸭行为节律分析
3.3.1 白羽番鸭整体行为占比分析
图8为通过DHSW-YOLO模型计算得到的模式A和模式B下白羽番鸭各行为的占比。图8显示,实验期间,模式A下白羽番鸭的整体行为占比为:俯卧48.78%、站立44.18%、饮水3.31%、进食3.72%;模式B下白羽番鸭的整体行为占比为:俯卧41.37%、站立52.10%、饮水2.78%、进食3.74%。
值得注意的是,模式A和模式B下,白羽番鸭饮水和进食行为的占比变化不大,但俯卧和站立行为的占比存在明显差异:模式B下白羽番鸭站立行为占比显著增加,而模式A下俯卧行为占比更高。这种行为差异与人工观察结果一致,主要归因于光照条件对白羽番鸭行为选择的影响——光照是影响家禽行为的最重要环境因素之一(Jiang等,2023)。上述分析凸显了本研究提出的DHSW-YOLO模型和2.4节所述白羽番鸭日常行为统计方法的准确性和可靠性。
(a)模式A下白羽番鸭实验期间的行为占比 (b)模式B下白羽番鸭实验期间的行为占比
图8 白羽番鸭实验期间各行为的占比
3.3.2 白羽番鸭昼夜节律分析
为便于观察白羽番鸭的昼夜节律,选取2023年4月7日、2023年4月16日和2023年4月25日的视频数据,按照2.4节所述统计方法,统计模式A和模式B下白羽番鸭的昼夜节律(图9),并通过方差分析(ANOVA)对白羽番鸭的昼夜节律进行分析,结果如表6所示。图9显示,模式A下,21:05-05:05关灯期间,鸭几乎全部表现为俯卧行为,站立行为极少,处于休息状态;05:05-21:05开灯期间,站立行为显著多于俯卧行为,表明鸭在此期间主要处于活动状态。而模式B下,各时间段俯卧和站立行为共存,无明显昼夜节律。
模式A下白羽番鸭的昼夜节律与21:05关灯、05:05开灯的光照策略一致,也与蛋鸡的昼夜行为相符(Shi等,2020)。此外,图9显示,2023年4月16日,模式A(图9(c))和模式B(图9(d))下白羽番鸭的站立行为均显著多于其他日期的俯卧行为,这可能是由于当日室内养殖设施温度过高(达33℃),超出环境控制系统的调节能力,导致鸭通过行为异常应对高温。
此外,统计分析显示,随着鸭日龄增长,模式A下俯卧行为的累积值((P_{prone}))从39525.13增至43482.03,站立行为的累积值((P_{stand}))从38148.48降至36674.94;模式B下也呈现类似趋势,表明随着鸭日龄增长,其休息时间增加,站立活动时间减少。
同时,表6结果显示,不同光照策略下俯卧行为的累积值((P_{prone}))存在显著差异(p=0.0181),这与图9中观察到的模式A关灯期间俯卧行为增加的趋势一致;此外,站立行为的累积值((P_{stand}))的p值为0.0191,表明不同光照策略下站立行为也存在显著差异。这是因为模式A和模式B下,白羽番鸭的行为在整个观察期间相对稳定,关灯期间俯卧行为显著增加,自然导致站立行为减少。
上述对白羽番鸭昼夜节律的分析和方差分析进一步证明了DHSW-YOLO模型和2.4节所述白羽番鸭日常行为统计方法的可靠性,也为后续白羽番鸭的群体管理和智慧养殖研究提供了参考。
(a)模式A昼夜节律(2023/4/07 17~24℃) (b)模式B昼夜节律(2023/4/07 17~24℃)
(c)模式A昼夜节律(2023/4/16 18~33℃) (d)模式B昼夜节律(2023/4/16 18~33℃)
(e)模式A昼夜节律(2023/4/25 17~28℃) (f)模式B昼夜节律(2023/4/25 17~28℃)
图9 不同模式下白羽番鸭的昼夜节律。(a)、(c)、(e)分别为2023年4月7日、2023年4月16日、2023年4月25日模式A下白羽番鸭的昼夜节律;(b)、(d)、(f)分别为2023年4月7日、2023年4月16日、2023年4月25日模式B下白羽番鸭的昼夜节律
表6 白羽番鸭昼夜节律的方差分析结果
| 响应变量 | 方差分析的变异来源(不同光照策略) |
|---|---|
| 俯卧行为累积值((P_{prone})) | p=0.0181 * |
| 站立行为累积值((P_{stand})) | p=0.0191 * |
注:ANOVA=方差分析;*表示显著(p<0.05,F检验);NS表示不显著(p>0.05,F检验)
3.3.3 白羽番鸭饮食节律分析
为便于观察白羽番鸭的饮食节律,选取2023年4月7日、2023年4月16日和2023年4月25日的视频数据,按照2.4节所述统计方法,统计模式A和模式B下白羽番鸭的饮食情况(图10),并通过方差分析(ANOVA)对白羽番鸭的饮食节律进行分析,结果如表7所示。图10显示,模式A下,21:05-05:05关灯期间,鸭进食行为极少,存在少量饮水行为,处于休息状态;05:05开灯进入光照条件后,白羽番鸭的饮水和进食行为比黑暗条件下显著活跃(图10(a)、(c)、(e)),且在09:00-10:00达到峰值,这可能是由于饲养员每天约9:00进行不定时喂食。模式B下,鸭的饮食节律比模式A不明显,可能是由于24小时光照打乱了其饮食节律,但模式B下进食行为同样在09:00-10:00达到峰值,与饲养员的喂食时间对应。
饮食节律也能反映环境变化。图10显示,2023年4月16日,模式A(图10(c))和模式B(图10(d))下白羽番鸭饮水行为的累积值((P_{drink}))和进食行为的累积值((P_{eat}))均显著高于其他时间。饮水和进食行为异常增加的原因是当日室内养殖设施温度过高(33℃),超出环境控制系统的调节能力,导致鸭通过大量饮水甚至进食来适应高温环境,这与3.3.2节的分析一致,即2023年4月16日高温导致鸭行为异常。
同时,表7显示,饮水行为累积值((P_{drink}))的p值为0.0796,接近传统显著性水平(p<0.05)但未达到统计显著性,表明不同光照策略下饮水行为的趋势不显著;而进食行为累积值((P_{eat}))的p值为0.1368,无统计差异。这一结果与图10的观察一致:尽管模式A下喂食时间段饮水和进食行为出现峰值,但总体而言,不同光照策略下白羽番鸭的饮水和进食行为未呈现显著的数值差异,这可能是由于两种光照模式下,白羽番鸭在获取水和食物方面保持一定的稳定性。
上述对白羽番鸭饮食节律的分析和方差分析,反映了DHSW-YOLO模型在监测白羽番鸭行为节律方面的敏感性和准确性,利用DHSW-YOLO模型进行监测可实现异常检测的早期预警,为后续白羽番鸭的群体管理和智慧养殖研究提供了参考。
(a)模式A饮食节律(2023/4/07 17~24℃) (b)模式B饮食节律(2023/4/07 17~24℃)
(c)模式A饮食节律(2023/4/16 18~33℃) (d)模式B饮食节律(2023/4/16 18~33℃)
(e)模式A饮食节律(2023/4/25 17~28℃) (f)模式B饮食节律(2023/4/25 17~28℃)
图10 不同模式下白羽番鸭的饮食节律。(a)、(c)、(e)分别为2023年4月7日、2023年4月16日、2023年4月25日模式A下白羽番鸭的饮食节律;(b)、(d)、(f)分别为2023年4月7日、2023年4月16日、2023年4月25日模式B下白羽番鸭的饮食节律
表7 白羽番鸭饮食节律的方差分析结果
| 响应变量 | 方差分析的变异来源(不同光照策略) |
|---|---|
| 饮水行为累积值((P_{drink})) | p=0.0796 NS |
| 进食行为累积值((P_{eat})) | p=0.1368 NS |
注:ANOVA=方差分析;*表示显著(p<0.05,F检验);NS表示不显著(p>0.05,F检验)
3.4 局限性
本研究提出DHSW-YOLO模型用于检测明亮和黑暗环境下白羽番鸭的日常行为,模型整体准确率达94.4%,但仍存在一定局限性:首先是光照策略的局限性,本文仅采用两种不同的光照策略,虽能反映模型在明亮和黑暗条件下的性能,但可能不足以确保模型在更广泛光照条件下的泛化能力——尽管模型在两种策略下的识别准确率已较高,但研究中光照与黑暗的突变未考虑自然界中光照强度的渐变(如黎明和黄昏),未来将通过更多梯度的光照条件构建模型,提高其鲁棒性;其次是鸭的品种和日龄局限性,本研究仅针对90-120日龄的白羽番鸭,可能限制模型在其他品种或日龄鸭中的鲁棒性,未来将采用其他品种和不同日龄的鸭构建鸭行为识别模型,增强模型的鲁棒性;此外,尽管可通过算法解决样本不平衡问题,但未来实验中将优先收集更多低频率行为的样本。
4 结论
本研究提出DHSW-YOLO模型用于监测鸭群行为,能准确识别弱光黑暗环境下白羽番鸭的日常行为。与原始YOLOv8相比,DHSW-YOLO的mAP达94.4%,模型大小减少2.8 MB,推理时间加快1.2 ms,参数数量减少8.7%,便于模型实时推理和及时预警。通过两种光照策略的验证,DHSW-YOLO能准确反映不同光照条件下白羽番鸭行为节律的差异,为管理者对鸭群行为的自动监测和及时预警需求提供了技术支持。