AI计算平台设计方案:901-基于3U VPX的图像数据AI计算平台
一、产品概述
设备基于3U VPX的导冷结构,集成FPGA接口预处理卡,GPU板卡、飞腾ARM处理卡,实现光纤、差分电口或者Camera link的图像接入,FPGA信号预处理,GPU AI计算,飞腾ARM的采集管理存储。
二、系统组成
系统组成包括:3U VPX机箱电源、3U VPX背板、 1块3U VPX V7采集处理板、1块3U VPX AGX orin GPU计算主板、1块3U VPX飞腾处理器计算板。
2.1基于XC7V690T的3U VPX信号处理板(274)
本板卡系我司自主研发的基于3U VPX导冷架构的信号处理板,适用于高速图像处理等。芯片采用工业级设计。该处理板包含1片Xilinx公司的Virtex7系列FPGA-XC7V690T-2FFG1761I。板载两组64位宽DDR3,每组容量4GB,一个HPC FMC接口。VPX接口连接4组x4 GTH,24组LVDS,一路RS422,一路1000Base-T。板卡的电气与机械设计依据VPX标准(VITA 46.0),支持导冷,能够满足用户在特殊环境下的使用需求。
板卡功能 | 参数内容 |
主处理器 | Xilinx XC7V690T-2FFG1761I |
板卡标准 | VPX VITA 46.0 |
电气规范 | PCIe 2.0,3.0 X4 |
FMC接口 | FMC ANSI/VITA 57.1 – 2008 ,ASP-134486-01 |
板载缓存 | 两组DDR3,每组512Mx64bit(4GB), MT41K512M8RH-125-IT |
加载Flash | BPI加载模式,BPI Flash 2Gb |
VPX接口 | P1: GTX x16, 支持PCIe、SRIO协议 |
仿真器接口 | 1x 6Pin JTAG接口,间距2.54mm |
LED | 两个,电源状态指示灯,FPGA状态指示灯(可编程) |
复位方式 | 外复位 |
板卡尺寸 | 100mm x 160mm x20mm |
板卡重量 | (含散热片) |
板卡供电 | +12V@4A |
板卡功耗 | 48W |
工作温度 | Industrial -20℃到+70℃ |
光纤收发子卡、2711子卡、Cameralink子卡
2.2 基于3U VPX的AGX Orin GPU计算主板(735) 、
Jetson AGX Orin 采用 NVIDIA Ampere 架构 GPU 和 Arm Cortex-A78AE CPU,以及新一代深度学习和视觉加速器。高速 IO、204GB/s 的内存带宽以及 32GB 的 DRAM 能够馈送多个并发 AI 应用程序管道。采用 Jetson AGX Orin,您现在可以部署更大型、更复杂的模型,解决自然语言理解、3D 感知和多传感器融合等问题。Jetson Orin算力高达275 TOPS,是上一代多个并发 AI推理管道性能的8倍,加上支持多个传感器高速接口,可为新时代机器人提供理想的解决方案.
GPU | 2048-core NVIDIA Ampere architecture GPU with |
CPU | 12-core Arm Cortex-A78AE v8.2 64-bit CPU |
显存 | 64GB 256-bit LPDDR5 204.8GB/s |
存储 | 64GB eMMC 5.1 |
DLA最大频率 | 1.6 GHz |
AI性能 | 275 TOPS |
DL加速器 | 2x NVDLA v2 |
视频加速器 | 1x PVA v2 |
视频编码 | 2x 4K60 (H.265), 4x 4K30 (H.265) |
视频解码 | 1x 8K30 (H.265), 3x 4K60 (H.265), 7x 4K30 (H.265) |
PCle | x8 PCle Gen4 |
显示接口 | HDMI |
网络 | RJ45 接口 (高达1 GbE) |
2.3 3U VPX飞腾处理器刀片计算机
2.3.1 产品概述
该产品是一款基于国产飞腾FT2000 4核或腾锐D2000 8核的高性能3U VPX刀片式计算机。产品提供了4个x4 PCIe 3.0总线接口,同时可配置为1个x16或2个x8 PCIe3.0接口,因此具有很强的扩展性,极大地满足多负载多节点的应用需求。产品结构完全符合VITA 46.0规范,有很强的可靠性、可维护性、可管理性,并与军用计算机的抗振动、抗冲击、抗宽温环境急剧变化等恶劣环境特性进行完美融合。
2.3.2 功能指标
● 3U 5HP VPX规格。
● 支持FT-2000/4 四核处理器和腾锐D2000 八核处理器
FT-2000/4标准版,2.6GHz,16W
腾锐D2000/8标准版,2.3GHz,25W
● 板载16GB双通道DDR4内存,频率2400MHz。
● 支持2个VGA接口,最大分辨率1920x1080@60Hz;其中1路VGA为后出接口。
● 支持4个x4 PCIe3.0接口,可配置成1个x16 PCIe 3.0或2个x8 PCIe 3.0。
● 前面板支持1路10/100/1000Mbps网络接口,后出2路10/100/1000Mbps网络信号,其中1路后出网口与前面板网口二选一切换。
● 板载1个mSATA接口,支持SATA3.0;后出2路SATA3.0信号,用于扩展存储。
● 前面板支持2个USB3.0接口;后出2路USB3.0接口信号。
● 提供2路RS232后出串口,其中1路可选RS422/RS485模式。
● 提供1路RS232后出CPU管理串口。
● 前面板带复位按键和LED指示灯。
● 单板管理功能(可选功能)。
● 支持银河麒麟、UOS、Centos、ubuntu、VxWorks系统。
(本项目使用ubuntu操作系统)
三、软件开发内容
3.2 TLK2711收发整体流程设计
在背板设计中,飞腾主板和GPU千兆网互联和RS232互联。考虑传输速度,使用千兆网进行传输。使用TCP/IP协议,飞腾处理器为TCP服务端,GPU为TCP客户端主动进行链接请求。
3.7 客户端界面
双通道TLK2711子卡界面
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。