1. 项目概述:从通信信号中“看见”世界
作为一名在无线通信和感知领域摸爬滚打了十多年的工程师,我见证了这个领域从“通信就是通信,雷达就是雷达”的泾渭分明,到如今两者水乳交融的奇妙转变。我们手里的手机、家里的路由器、遍布城市的基站,这些原本只为传递比特流而生的设备,正在被赋予一双“慧眼”。这背后的核心技术,就是集成感知与通信(ISAC)。
简单来说,ISAC的核心思想是“一石二鸟”:让无线通信系统在完成数据传输本职工作的同时,利用其发射和接收的无线电波来感知物理世界。这听起来有点像科幻,但其物理基础却非常坚实。无线信号在空间中传播时,遇到的任何物体——无论是走动的人、呼吸的胸腔,还是落下的雨滴、上涨的河水——都会对信号产生微妙的调制。这些调制体现在信道状态信息(CSI)的幅度、相位变化,或是多普勒频移的谱线移动上。过去,这些变化被视为需要被“均衡”掉的信道损伤;而现在,我们意识到,它们其实是描绘物理世界的“墨水”。
这篇文章,我想和你深入聊聊ISAC如何从一个前沿概念,落地为从“感知人体”到“感知环境”的统一框架。我们不再满足于实验室里用特制设备做演示,而是探讨如何利用现成的、无处不在的4G/5G和Wi-Fi信号,在非视距、非协作的“恶劣”条件下,稳定地提取出有价值的环境与生命信息。这不仅仅是技术的炫技,更是为了解决真实世界的问题:如何用最低的成本、最广泛的覆盖,实现大范围的健康监测、灾害预警和环境管理。
2. ISAC的统一感知框架:信号如何“诉说”世界
在深入具体应用之前,我们必须先理解ISAC感知的“通用语言”。无论目标是人体还是环境,感知的物理本质都是相通的:目标物改变了电磁波的传播路径、速度或能量,我们在接收端通过解读这些改变来反推目标的状态。
2.1 核心物理模型:信道频率响应(CFR)的奥秘
一切感知的起点,是通信系统在进行信道估计后得到的信道频率响应(CFR)。对于一个多天线OFDM系统,第it个发射天线到第ir个接收天线、第j个子载波、第k个OFDM符号上的CFR可以建模为:
H_it,ir,j,k = [相位偏移项] * Σ [路径损耗 * 时延项 * 多普勒项 * 到达角项 * 出发角项]
这个公式看起来复杂,但拆解开来,每一项都对应着一种物理效应:
- 相位偏移项:包含了时钟不同步(TO/CFO)和硬件差异引入的“噪声”,这是双基站(Bistatic)感知中首先要克服的难题。
- 路径损耗:信号在传播中的衰减,对于环境感知(如降雨)至关重要。
- 时延项:
e^{-j2πΔf_j τ[l]},反映了信号经过第l条路径的传播时间。人体移动或水位变化会改变反射路径长度,从而改变时延τ。 - 多普勒项:
e^{-j2πf_D[l]kT_s},由目标与收发信机之间的相对径向运动引起。心跳、呼吸、行走、流水都会产生特征性的多普勒频移f_D。 - 到达角/出发角项:由天线阵列的几何结构决定,用于对目标进行空间定位。
关键洞察:人体感知和环境感知虽然应用场景迥异,但都依赖于从上述CFR模型中提取相同的核心特征——时延、多普勒、角度。区别在于,人体感知关注的是快速、周期性、近场的微变(如毫米级胸腔起伏),而环境感知则处理缓慢、大范围、远场的渐变(如厘米级水位变化)。前者需要高时间分辨率来捕捉动态,后者则需要高稳定性来滤除噪声。
2.2 从粗糙到精细:感知代理指标的演进
早期基于信号强度(如RSSI)的感知方案,因其易于获取而备受青睐。手机能直接读出信号格数,路由器也能上报RSSI。然而,RSSI是一个将所有多径信号能量粗暴叠加后的标量,信息损失极大。它就像只用耳朵听一个交响乐团的总体音量,你无法分辨出其中小提琴、大提琴各自的声音。
信道状态信息(CSI)的引入,是感知技术的一次革命。它相当于为每个子载波(可以理解为不同音高的声部)单独记录了其幅度和相位。这使得我们能够“听见”并分离出不同传播路径的“声音”。目前,从商用Wi-Fi网卡(如Intel 5300、Atheros系列)和开源软件无线电(如srsLTE)中提取CSI已成为可能,为精细感知提供了数据基础。
注意:尽管CSI提供了丰富的信息,但在实际部署中,尤其是利用运营商的公共蜂窝信号进行感知时,直接获取原始CSI仍然面临挑战。这涉及到基带芯片的开放程度和网络侧的合作。因此,许多环境感知研究退而求其次,使用网络侧更容易提供的参考信号接收功率(RSRP)等指标,并通过长期观测和机器学习来挖掘其与环境参数的相关性。
3. 人体感知实战:从定位到生命体征
让我们把镜头拉近,看看ISAC如何在不佩戴任何设备的情况下,“隔空”感知人体的活动与状态。这个过程就像用无线信号给空间做一次“CT扫描”。
3.1 第一步:攻克时钟不同步的“拦路虎”
在理想的雷达系统中,收发机共享同一时钟,相位是纯净的。但在ISAC的典型双基站场景下(例如用一个手机基站发射信号,另一个手机或专用设备接收),发射机和接收机的时钟是独立的。这会导致CSI相位中出现快速变化的随机偏移,完全淹没掉由人体微动引起的微小相位变化。
解决这个问题有几种主流思路,我结合自己的调试经验来谈谈:
- 跨天线互相关(CACC):这是最直观的方法。既然随机相位对同一时刻、同一位置的不同天线影响是相似的,那么将两根接收天线的CSI共轭相乘,公共的随机相位项理论上就被抵消了。但这里有个大坑:多普勒镜像。因为两根天线的信号功率相近,计算互相关后会产生对称的正负多普勒分量,你无法判断目标是靠近还是远离。我在早期实验中就曾被这个问题困扰许久。
- 跨天线信号比(CASR):计算两根天线CSI的比值。这个方法能同时消除随机相位和自动增益控制(AGC)的影响,且没有多普勒镜像问题。但它有个致命缺点:比值运算破坏了CSI中时延和角度信息的线性关系,给后续的联合参数估计带来了巨大困难。如果你的应用只关心多普勒(比如判断有没有人在动),CASR是个好选择;但如果需要精确定位,就得慎用。
- 改进的CACC变体与单天线方法:学术界也在不断改进。例如WiDFS 2.0提出的方法,利用静态路径分量在多根天线间构造差分项,既能消除随机相位,又能抑制镜像。而对于只有单根接收天线的极端情况(比如很多物联网设备),可以通过在时延域或频域构造参考信号来校准相位。我实测过,在带宽足够(>40MHz)时,单天线方法也能取得不错的效果,但分辨率确实不如多天线方案。
实操心得:选择哪种相位校准方法,取决于你的硬件配置(天线数量)和感知任务(是否需要测距/测角)。对于多数人体跟踪和活动识别,拥有至少3根接收天线的改进CACC变体是平衡性能与复杂度的优选。
3.2 第二步:提取多维特征点云
校准后的CSI,是一个包含时间、子载波(频率)、天线维度信息的数据立方体。我们的任务是从这个立方体中,提取出对应人体目标的“特征点云”。这个过程通常分三步走,可以类比为图像处理中的“边缘检测”:
- 多普勒维FFT:沿时间轴做FFT,将信号变换到多普勒频率域。人体运动(即使是静止时的呼吸)会产生特定的多普勒频移,这通常是分辨率最高的维度,能有效区分静止 clutter 和运动目标。
- 时延维MVDR波束成形:对每个多普勒单元,在天线对维度上应用最小方差无失真响应(MVDR)波束成形。这相当于一个空间滤波器,能增强来自某个特定时延方向的信号,抑制其他方向的干扰,从而提升时延分辨率。
- 角度维FFT:最后,在空间维度做FFT,估计信号的到达角(AoA)。结合时延和几何关系,就能将目标定位在二维或三维空间中。
经过这三步,我们得到了一个多普勒-时延-角度(DDA)三维特征张量。其中的每一个能量峰值,都对应一个潜在的散射点(可能是人体的某个部位,也可能是环境中的静态物体)。
3.3 第三步:基于位置的精炼感知
得到目标的位置信息后,感知的精度和鲁棒性可以大幅提升。位置成了一个强大的空间滤波器。
- 定位与跟踪:我们使用二维恒虚警率(2D-CFAR)检测算法,在“多普勒-角度”二维平面上找出能量显著高于背景噪声的点,形成初始点云。然后,将这些点云送入扩展卡尔曼滤波(EKF)或联合概率数据关联(JPDA)等跟踪算法。EKF会根据运动模型(如匀速或匀加速)预测目标下一时刻的位置,再用新的观测点去修正,从而形成平滑、连续的轨迹。我的经验是,在室内复杂多径环境下,单纯依赖时延或角度都容易出错,但将两者与多普勒信息在EKF框架下融合,能极大提升跟踪的稳定性。
- 生命体征监测:这是最让我感到神奇的应用。对于一个静坐的人,其胸腔因呼吸和心跳产生的微动(毫米级)会调制反射信号的相位。传统方法直接分析所有信号的相位,噪声极大。我们的做法是:首先,利用长时间窗口(如10秒)的高分辨率多普勒谱,找到对应“静止人体”的零频附近能量峰(呼吸频率通常0.1-0.5 Hz)。然后,锁定这个目标所在的“多普勒-时延-角度”三维单元,只提取该单元内残留CSI信号的相位序列。这个操作相当于把“探照灯”精准打在了人的胸腔上,极大抑制了环境噪声和其他身体部位的无关运动。最后,对相位序列做差分(消除身体缓慢晃动的影响),再经过0.1-0.5 Hz(呼吸)和0.8-2 Hz(心跳)的带通滤波,就能清晰地提取出呼吸和心跳波形。我们在5 GHz Wi-Fi环境下实测,心率误差可以控制在±3 BPM以内。
- 活动识别:一旦锁定目标,我们可以持续提取其“微多普勒”特征。不同活动(走、跑、挥手、跌倒)会导致四肢产生不同的运动速度组合,在多普勒-时间谱图上形成独特的“纹理”图案。例如,走路会产生周期性的、对称的多普勒谱,而跌倒则会产生一个短暂的、高能量的正向或负向频移。利用卷积神经网络(CNN)或时序模型(如LSTM)对这些谱图进行分类,就能实现高精度的活动识别。这里的一个关键技巧是自动活动分割,我们借鉴了语音活动检测(VAD)的思路,用预训练的语音分割网络来无监督地检测连续行为中的边界,效果比固定时间窗好很多。
4. 环境感知实战:让基站成为气象站和水文站
如果说人体感知是“显微镜”,那么环境感知就是“广角镜”。它的目标不再是几米范围内的精细动作,而是数百米甚至公里尺度上的宏观状态变化,如降雨、土壤湿度、河流水位。
4.1 环境感知的独特挑战与思路
环境感知面临几个与人体感知截然不同的挑战:
- 信号弱且变化慢:环境参数变化缓慢(如水位每小时变化几厘米),引起的信号变化非常微弱,且容易被温度漂移、设备增益波动等长期趋势淹没。
- 非视距(NLOS)主导:在广域监测中,收发节点之间很少有直射路径(LOS),信号主要通过反射、衍射、散射传播,路径复杂。
- 特征相关性复杂:降雨导致信号衰减,土壤湿度影响介电常数从而改变传播时延和反射系数,水位变化则通过改变水面反射路径的长度和相干性来影响信号。这些关系往往是非线性且需要现场标定的。
4.2 案例深潜:基于LTE信号的水位感知
这里我想分享一个我们团队在悉尼帕拉马塔河边的真实项目经历,它完美诠释了如何在NLOS、非协作条件下,用最“土”的办法实现环境感知。
4.2.1 实验部署与数据“嗅探”
我们的目标是用公共的LTE基站信号来监测潮汐引起的水位变化。我们在河岸边的室内(UTS Haberfield赛艇俱乐部)放置了一台软件定义无线电(SDR)接收机和两根简单的单极子天线,正对河流方向。在码头下,我们安装了一个高精度声纳水位计作为地面真值。关键点在于,接收机与周围所有基站均处于NLOS状态——没有直射信号,接收到的全是经过建筑、树木、水面多次反射、散射后的信号。
我们使用开源工具(如srsLTE)持续“嗅探”下行链路信号,成功捕获了来自7个不同小区、跨越4个频段(Band 1, 3, 5, 28)的参考信号接收功率(RSRP)。我们并没有与任何运营商合作,也没有基站的控制权,完全是被动接收。
4.2.2 特征分析与“涌现”的相关性
最初几天,我们只是枯燥地记录RSRP数据和声纳水位数据。当我们把时间序列画在一起时,有趣的现象出现了:某些频段(特别是低频段如Band 28)的RSRP波动,与潮汐水位曲线呈现出肉眼可见的负相关。水位上涨,RSRP下降;水位下降,RSRP回升。而高频段(如Band 1)的相关性则较弱且滞后。
为什么?我们分析,低频信号波长长,绕射能力强,其传播路径可能更多依赖于经水面的反射路径。水位变化直接改变了这条反射路径的长度和反射点的性质(水面粗糙度等),从而显著影响接收信号强度。高频信号则可能更多依赖其他固定的散射体,对水面变化不敏感。
4.2.3 从观察到预测:简单的线性模型也能工作
基于这个发现,我们构建了一个极其简单的特征集:过去12小时内,7个LTE载波的RSRP均值、方差、以及一些基础气象数据(如温度、气压)。然后,我们用一个线性回归模型去预测未来10分钟的水位。
结果令人惊讶:在12小时的测试集上,预测水位与声纳实测值的均方根误差(RMSE)仅为7.36厘米。这个精度对于许多区域性洪水预警应用已经具有参考价值。它证明了,即使使用最粗糙的信号强度指标(RSRP),在复杂的NLOS环境下,环境变化的信息依然被“编码”在了 ambient RF信号中,并且可以通过机器学习模型被有效地“解码”出来。
4.2.4 进阶:走向更精细的感知
当然,我们并不满足于此。在后续的研究中,我们向更深处探索:
- 使用更精细的特征:我们尝试从LTE信号中提取��始的CSI幅度和相位信息。通过高级的空时信号处理算法(如空间谱估计),我们成功从接收信号中分离出来自水面的反射分量,并构建了联合多普勒-角度谱。这使得我们不仅能估计水位,还能分析水流的表面流速。
- 多源信号融合:单一基站信号不稳定(可能因网络优化而突变)。我们正在尝试融合来自多个运营商、多个频段(LTE/5G)甚至Wi-Fi的信号,利用其空间和频率分集效应来提升感知的鲁棒性和分辨率。
- 物理信息驱动的机器学习:纯数据驱动的黑箱模型泛化能力差。我们正在将电磁波传播的物理方程(如水面反射模型)作为约束,嵌入到循环神经网络(RNN)中,构建“物理信息神经网络”。这样,模型在学习时不仅看数据,还要遵守物理定律,有望在未观测过的河流或天气条件下也能做出合理预测。
5. 核心挑战与未来之路
尽管前景广阔,但将ISAC从实验室推向规模化应用,还有几座大山需要翻越。以下是我在研究和项目落地中感触最深的几点:
5.1 弱视距与非视距场景下的人体感知
现有大多数人体感知算法都强烈依赖一个稳定、强大的直射路径(LOS)作为参考。但在真实的室内复杂环境或利用室外蜂窝信号进行室内感知时,LOS路径经常被遮挡甚至完全不存在。在只有非视距(NLOS)多径的情况下,如何从一堆杂乱无章的反射信号中,准确分离出微弱的、动态的人体反射信号,是极大的挑战。这需要发展更强大的多径分辨和干扰抑制算法,或许需要结合深度学习对复杂信道环境进行建模。
5.2 模型泛化与部署适配问题
这是一个非常现实的工程问题。你在实验室用特定品牌的Wi-Fi网卡、特定的天线布局、在某个房间训练出的活动识别模型,换到另一个房间、另一款路由器,性能就可能大幅下降。对于环境感知,不同地区的土壤成分、植被覆盖、建筑布局千差万别,一个地方的降雨-衰减模型很难直接用到另一个地方。
我的思路是追求“特征泛化”而非“数据泛化”。与其收集海量数据去覆盖所有场景,不如设计对硬件和环境不敏感的特征表示。例如,无论系统带宽和载频如何,人体运动的多普勒-时延-角度(DDA)点云的几何分布和运动模式是相对稳定的。我们可以尝试构建一个基于DDA点云抽象表示的预训练模型,再针对新场景进行少量数据的微调(Domain Adaptation)。联邦学习(Federated Learning)也是一个有前景的方向,可以在保护数据隐私的前提下,利用分布在不同地点的设备协同训练一个全局模型。
5.3 面向环境的任务对齐特征工程
人体感知的特征(微多普勒、相位周期)相对直观。但环境感知需要我们从信号中提取出与特定物理过程(如降雨衰减、土壤介电常数变化)直接相关的特征。这要求研究者兼具无线通信和地球科学的知识。例如:
- 降雨感知:需要关注信号衰减的动态斜率、链路不对称性,并结合经验性的A-R关系模型。
- 土壤湿度感知:需要关注信号相位的时延变化、地表反射系数的变化。
- 水位感知:需要关注水面反射路径的相干性、多普勒展宽等。
未来的方向是发展“物理信息特征提取”,将领域知识(如水文模型、电磁传播模型)与深度学习特征提取网络相结合,让模型学到的特征具有明确的物理意义,从而提升可解释性和跨场景泛化能力。
5.4 天线与硬件平台的适应性
环境感知的部署平台可能是固定的基站,也可能是无人机、车辆甚至可穿戴设备。这对天线提出了新要求:需要可重构、宽频带、低功耗,并且性能不能受平台姿态(如无人机倾斜)或环境(如天线被雨淋湿)的严重影响。新型天线技术,如基于超表面的可编程天线、流体天线系统、漏波天线等,提供了动态权衡感知与通信性能的可能。例如,广义联合耦合器(GJC)矩阵天线,就能以低功耗实现多波束生成,非常适合需要同时进行多方向感知的ISAC节点。
6. 写在最后:从碎片化应用到统一感知层
回顾ISAC的发展,早期工作多是“打补丁”式的:看到一个应用(比如用手势控制电视),就设计一套专门的信号处理流程。这导致了技术的碎片化。通过这篇梳理,我希望传达一个核心观点:尽管人体感知和环境感知在具体任务上差异巨大,但其底层信号处理内核是统一的——都是通过解读无线信道受物理世界调制后产生的变化来反演状态。
因此,ISAC的终极形态,不应是散落各处的“感知孤岛”,而应成为嵌入未来6G网络基础设施中的一个统一感知层。这个感知层提供标准化的信号采集接口、统一的多维特征提取能力(DDA点云、衰减统计量等)、以及可插拔的推理算法模块。不同的感知应用(人员计数、跌倒检测、降雨监测、洪水预警)可以像手机APP一样,运行在这个统一的基础之上,按需调用底层的感知能力。
这条路还很长,需要通信工程师、信号处理专家、数据科学家乃至领域专家(如气象学家、水文专家)的紧密协作。但可以预见,当我们的通信网络真正具备了“视觉”和“触觉”,它将成为构建智慧城市、数字孪生和无处不在智能的基石。而我们今天在相位校准、特征提取、模型泛化上踩过的每一个坑,都是在为那个万物皆可被“无线”感知的未来铺路。