在机器视觉领域,分辨率的提升可带来更精准的检测结果,而更高的帧率则支持更快的生产节拍。两者结合可显著提升检测质量与产能。为应对这一趋势,传统的 GigE 接口逐渐演进为更高带宽标准,如 10GigE,25GigE甚至100GigE。然而,随着图像数据量呈指数级增长,即使这些高速接口,在传统实现中也会面临带宽瓶颈与稳定性问题。
对于要求高带宽、高速率与高分辨率的应用场景——如半导体检测、医学实验及体育分析——确保图像采集无丢帧至关重要。任何丢帧都可能导致批次返工、实验中断,或错失关键瞬间。
传统 GigE 视觉系统的瓶颈
虽然传统 GigE 接口的视觉系统已被广泛采用,但在高带宽应用中仍存在以下挑战:
CPU 占用率高:图像数据包的处理会消耗大量 CPU 资源,限制了系统执行其他任务(如图像分析或机器学习推理)的能力。
帧丢失与不稳定:特别是在高帧率、高分辨率条件下,或多台相机并行运行时。
多相机系统延迟高:顺序数据处理造成响应滞后,降低系统实时性与效率。
图1: 在传统 GigE 数据传输流程中,处理器(CPU)必须在多重缓存间执行多次数据复制,图像才能重新组装到应用内存中
引入 RDMA 技术
RDMA(Remote Direct Memory Access,远程直接内存访问)是一种基于 RoCE v2协议的高效数据传输技术,已在数据中心被广泛采用。SVS相机现将该技术引入机器视觉领域。
基于 RoCE v2 的 RDMA 具备以下特点:
绕过 CPU 与 TCP/IP 协议栈:数据传输无需经过 CPU 或 TCP/IP 栈,消除了中间复制与缓存过程。
直接内存访问:图像数据可直接写入主机系统内存。
低延迟与高吞吐:在高负载情况下仍能保持稳定高效的数据传输。
降低 CPU 负载:显著减少处理数据包及写入数据流的处理器消耗,为分析或推理任务释放资源。

图 2: 基于RoCEv2协议的RDMA技术和传统数据传输的对比。
换句话说,RDMA 就像是在主机系统内存中开辟了一条“高速图像传输通道”,大幅减少了 CPU 占用,使更多计算能力可用于图像处理或 AI 推理。

图 3: 启用RDMA 的 GigE 数据传输流程图。在显著降低 CPU 资源占用的同时,实现了低延迟、高吞吐量与高稳定性的数据传输性能
RDMA 的优势
更高吞吐量:支持多相机并行读取及超高带宽数据流。
更高稳定性:防止帧丢失,确保检测不中断。
更低 CPU 占用:释放计算资源用于图像处理或 AI 任务。
更低延迟:实现更快的实时检测与反馈,低抖动并支持精准的多相机同步。
更长传输距离:基于光纤的 GigE 传输距离可达 10 公里。
面向未来的可扩展性:目前已在 25GigE 平台实现 RDMA,100GigE 支持将于明年初发布。RDMA 生态系统正快速发展,网络适配器带宽已达 400Gbit/s。
更高性价比:与同等带宽的 CoaXPress 系统相比,硬件成本更低。
实测数据:稳定性与性能的双提升
我们的内部测试表明,在多台 25GigE 相机并行运行下,启用 RDMA 后系统稳定性从“偶有丢帧”转为“持续稳定运行”,同时 CPU 负载显著下降。

测试显示:在长时间连续工作的生产环境中,使用RDMA功能的系统可更可靠地运行,维护成本与风险大幅降低。
典型应用场景
RDMA功能特别适合 高带宽、长距离、高速成像 的场景:
体育与安防
用于慢动作回放、轨迹跟踪、目标识别等应用。
优势:光纤长距离传输结合 PTP 时间同步,实现多点协同成像。

医疗与实验室成像
如 DNA 测序、细胞筛查等对延迟极其敏感的任务。
优势:低延迟保障每一帧关键影像的完整捕获。

半导体生产制造
适用于 PCB、封装、晶圆检测等高分辨率、高速场景。
优势:零帧丢失,稳定可靠的质量检测。

搭载RDMA功能的SVS相机型号
FXO 25GigE机型全面支持RDMA功能
此外,FXO 100GigE 系列 相机将于明年初推出,同样支持 RDMA。这些相机可分别在24.5MP和12.3MP分辨率下达到443帧/秒和661帧/秒的高速采图,同时保持优异的成像质量。

配置建议
使用 RoCE v2 时,相机与网卡(NIC)均需支持该协议。我们推荐:
NVIDIA Mellanox ConnectX-5 或 6 NIC;
对于 FXO 25GigE 系列,使用支持 25GigE 的 SFP28 模块;
对于 FXO 100GigE 系列,使用支持 100GigE 的 QSFP28 模块。
根据所需传输距离,可选择不同的光纤线缆方案。


