高性能嵌入式计算(HPEC)在性能和功能上取得了巨大飞跃,实现了新的发展。 像第三代英特尔®™ 酷睿™ i7 这样的处理器使得 HPEC 成为了一个强大并具有成本效益的解决方案,消除了前几代产品的计算性能瓶颈。 然而,HPEC 平台仍然存在一大挑战,"我如何使处理器获得更多的高带宽数据?"如雷达、声纳及其他信号处理系统等可产生千兆字节数据的应用,这就需要高 GFLOP 运算能力。 本周控创在解决这个问题上迈出了重要一步,HPEC 的概念验证(POC)平台通过 PCI Express 3.0 提供了相当于 40 个千兆以太网(GbE)的数据传输率。该平台用较小的资源为下一代嵌入式雷达/声纳应用提供突破性的 I/O 数据带宽。POC 平台基于 VPX,VPX 以其高性能、对恶劣环境的适应能力和小尺寸而闻名。 作为一个完整的系统设计,控创 HPEC POC 将 3U VPX SBC VX3044VPX PCIe 交换机 VX3905 和高端 L2/L3 以太网交换机 VX3910 集成在同一个平台上。 控创 POC 超出寻常地选择了 PCIe 替代 10 千兆以太网这一用于高性能计算平台的常见串行结构。 以太网的优势在于广泛采用 TCP/IP 协议及出色的软件支持。 然而,有些应用需要更高的吞吐量,只能通过如 PCIe 3.0 这样的串行结构获得,但这些解决方案由于编程较为困难且通信协议支持极为有限,其发展已经受到阻碍。 让控创平台与众不同的是通过常见的TCP/IP 协议使用 PCIe 3.0 提供 40GbE 的等效数据传输速率。 通过使用控创 VXFabric* 中间件,它实现了 PCIe 3.0 和 TCP/IP 协议的结合,该中间件在 PICe 基础架构上实现 TCP/IP,将传输带宽速度提升到近 40 GbE。 这样,当 VPX 刀片上的第三代智能英特尔酷睿 i7 处理器运行完善的传输协议时,I/O 带宽与其功能十分匹配,并且将软件系统开发过程中的影响降到最小化,并在很少或不更改的情况下将旧应用程序转移快速到新平台。 这项技术能更容易地充分利用第三代智能英特尔酷睿 i7 的处理潜力。 控创 VX3906 这一业界首款 PCIe 3.0 VPX 交换机还可提供 PCIe 架构的路由功能。 与 PCIe 2.0 相比,该交换机将每通道的吞吐量增加了大约一倍,带来了极大的性能提升。 有了VXFabric,使用基于套接字编程接口的标准通信协议——TCP/IP 或 UDP/IP,可以保护应用软件投资。 旧软件就可以继续运行,而基于 TCP/IP 协议的新软件确保在未来几年内可得到支持。 原始设备制造商和开发人员可享有最佳的总拥有成本(TCO),并可从现有的应用程序部署中直接迁移。 VXFabric 可以在机箱内解决所有计算机节点通信间的点对点快速和低速延时。 VXFabric 还可为机架 VPX 主板之间提供高达每秒 4.2 千兆字节(GB/s)的数据吞吐量(超过 PCI Express)。 除了刀片服务器间的高性能互连,配有集成图形核心——Intel® HD Graphics 4000 的第三代智能英特尔酷睿 i7-3612QE 处理器(4M 缓存、4 执行核心、8 线程)还提供了巨大的处理能力。Intel® HD Graphics 4000 提供了 16 个图形执行单元(EU),并显著改善 3D性能,改进高达 2 倍 。在 22nm 制程中,这样的组合功耗更低,并且该集成可以实现更小的封装,可帮助提升刀片的功能密度——这对 HPEC 非常重要。 HPEC 应用需要较高的 GFLOP 的性能。 这是通过第三代智能英特尔酷睿 i7-3612QE 处理器与Intel HD Graphics 4000 的内核/GPU 组合实现的。通过使用英特尔®高级矢量扩展指令集(英特尔®AVX)技术,这种低电压的处理器拥有了非常优越的 GFLOPS /功耗比。 图形运算将应用程序的计算密集型部分转移到 Intel HD Graphics 4000上,而其余的代码仍然在CPU内核上运行,这样的方式提供了前所未有的应用性能。 CPU 内核对串行处理进行了优化,而图形执行单元的并行处理性能则更加高效。 许多雷达和声纳的应用可以被细分为串行和并行算法,然后利用这种组合进行运行。 图形执行单元提供了大规模并行处理子系统,该系统可专注于多线程和并行大型数据集,以提高 GFLOPS 的性能水平。 展望未来,第四代英特尔®酷睿™处理器系列会有更加出色的表现。 这些芯片引入了英特尔®高级矢量扩展(英特尔®AVX)2.0 指令集,将峰值浮点吞吐量增加了一倍,也使四核移动级处理器在2.4 GHz 下实现了高达 307 GFLOPS 的水平。 图形引擎也进行了升级,通过 OpenCL 1.2 编程提供了另外的 352 GFLOPS 初始性能——整体计算能力增加了一倍以上,而功耗只增加了几瓦。 同样值得关注的是,控创 POC 平台集成了丰富的软硬件并简化了开发过程。 POC 平台包括 Linux发行版、无盘工作站支持和并行工作负载管理软件。 另外继承了优化编译器、FFT 基准代码示例和压力测试应用程序框架作为为基准。 通过机箱管理板内容、全系统 PBIT 和系统级功耗/性能管理,实现了计算机运行状况管理。 处理器显卡将 GFLOPS 添加到 HPEC 控创 HPEC POC 的目标是帮助开发人员大大简化下一代雷达和声纳从设计到现场部署的过程,而我们也希望下一代雷达和巨大雷达和声纳的处理能力和带宽将会有巨大飞跃。 基于 VPX 的 PoC 是一种灵活的设计,可以为最苛刻的应用专门进行优化。 可配置的 PCI Express 交换矩阵互连可以通过最适合 HPEC 平台数据传输需求的方式进行路由。 其可支持 TCP/IP 的旧应用程序,使平台更加有吸引力,并使设计师可以想象将带宽提高 10 倍。 基于主流 IT 技术(TCP/ IP 协议、支持 PCIe、英特尔® 处理器),控创 HPEC POC 还研发解决了美军的智能采购方案,将采购流程变得更加迅速灵活。 相关主题控创是英特尔®智能系统联盟的Premier级会员。 联系控创>> Jerry GipperOpenSystems Media®,与英特尔®智能系统联盟特约 编辑部主任,OpenSystems Media, VITA Technologies