关键对话高效能沟通

2024-12-15

关键对话高效能沟通(共1篇)

1.关键对话高效能沟通 篇一

在《纲要》的指导下, 国家863计划从2006年起先后启动了一系列重大项目, 并获得了地方政府、企业、高校、科研院所等的积极响应和配合, 集中力量研究并突破了千万亿次高效能计算机、高端容错计算机系统、海量存储系统的关键技术, 研制了具有自主关键技术、达到国际先进水平的“天河1号”、“神威蓝光”、“曙光星云”等千万亿次高效能计算机、“浪潮天梭K1”高端容错计算机和“浪潮PB级海量存储系统”。相关产品的推广和应用将为我国经济建设、社会发展、科学进步、国家安全等做出卓越的贡献。

一、高效能可信计算机领域政策响应和任务部署情况

自《纲要》实施以来, 高效能可信计算机优先主题得到了中央各部门、地方、行业、企业的优先支持和项目安排。

1. 总体立项布局

2006年启动重大项目“高效能计算机及网格服务环境”。其战略目标之一是要研制成功具有自主关键技术的每秒1000万亿次浮点计算能力的高效能计算机, 使我国高性能计算机的研究、制造水平达到世界第三。2007年启动高端容错计算机重大项目。核心任务是研制32颗以上处理器的高端容错计算机主机, 系统可用度到99.999% (年平均停机时间小于5.26分钟) , 事务处理能力达到tpmc值大于220万, 开发具有自主知识产权并符合POSIX标准的容错操作系统, 完成多种行业应用软件的应用移植和优化, 在电信、金融等关键领域的生产性业务系统上实现规模化应用。2008年启动“海量存储系统关键技术”重大项目。项目重点支持“海量存储系统总体研究”、“海量存储系统研制”、“存储系统测试评价技术”等课题。2011年启动高效能计算机及应用服务环境重大项目。目标是研制世界领先的高效能计算系统, 并显著提升系统的国产化率。科技部于当年9月21日发布征集“十二五”863计划高效能计算机及应用服务环境重大项目中“应用服务环境”的部分课题建议书的通知。

2. 各部门、各地方的政策响应

自《纲要》发布以来, 国务院以及有技术发展优势的省份和地区对本优先主题的任务部署进行了积极的响应。例如, 国务院在《工业转型升级规划 (2011—2015年) 》中就提到了高性能计算机的研发, 要求“加快高性能计算机及服务器、网络产品、存储系统及打印输出设备、工业控制计算机、自主可信安全产品等重点产品的研发及产业化”。《广东省科学和技术发展“十二五”规划》强调在“高性能计算等关键领域突破和掌握一批核心技术, 加快技术成果转化, 形成具有自主知识产权的战略产品”。《深圳市高新技术产业发展“十一五”规划纲要》在重点发展的产品和技术中则特别提到了高性能服务器。

二、任务实施进展与成效

1. 技术领域主要成效

(1) 在高效能计算机研制方面, 成功研制了“天河1号”、“神威蓝光”、“曙光星云”等一系列具有自主关键技术的高效能计算机, 使我国高效能计算机的研制水平进入了世界领先行列, 2010年“天河1号”问鼎世界第一是这一进步的重要标志。

另外, 通过比较2006年和2012年的中国TOP100数据 (见表1) , 可以看到国内高效能计算机的平均性能与国际TOP500的平均性能差距在缩小, 由2006年的落后2年半, 变为2012年的落后不到一年, 这说明我国高性能计算系统的平均发展快于国际TOP500的平均发展速度;国产机器的市场占有率在不断提高, 由2006年的39%上升到了2012年的56%;而机器的应用领域也由2006年的11个变为2012年的18个。

(2) 在高端容错计算机方面, 鉴于信息安全与国家安全的重大需求, 国家863计划在“十一五”期间设立了“高端容错计算机”重大项目, 突破面向高端商业应用计算机系统的高可用性、高处理能力的关键技术, 建立有效的评测体系与评测环境。目前, 已研制成功了“浪潮天梭”高端容错计算机, 性能和可用性均达到了国际同类产品的先进水平, 填补了国内高端容错计算机的产品空白, 并且建立了高端容错计算评测体系与评测机构, 华为公司的H8000 RISC高端容错计算机也正在研制中。

数据来源:“2006年中国HPC TOP100”和“2012年中国HPC TOP100”。

(3) 在海量存储方面, 863计划“海量存储系统关键技术”重大项目立项时, 中国的自主技术仅能够达到两个存储控制器的级别, 技术水平落后国外大概20年。而在该项目验收时, 浪潮实现了国产海量存储系统的零突破, 在国内首创8控系统体系架构, 成为继EMC、IBM、日立之后第4个能够自主研制海量存储系统的公司。

2. 对科技创新和产业发展的促进作用

千万亿次高效能计算机、32路高端容错计算机、PB级海量存储设备的成功研制和应用标志着我国高效能可信计算方面的科技创新能力得到了显著的提升, 并产生了重大国际影响, 有效促进了我国高性能计算应用水平和科技创新能力的提高以及我国高效能可信计算机产业的发展, 同时也取得了显著的经济和社会效益。此外在项目研发过程中, 一批创新团队和创新基地也得到了建设。

(1) 促进了我国高效能计算应用水平和科技创新能力的提高

“天河1号”、“曙光6000”等高效能计算机的研制成功使我国成为继美国之后第2个具有研制千万亿次高性能计算机能力的国家;“浪潮天梭”高端容错计算机打破了国外IT巨头垄断, 奠定国产高端容错计算机产业基础, 填补了国内空白;浪潮PB级高性能海量存储系统实现了我国在高端存储领域从无到有的零的突破, 使中国成为继美、日之后世界第三个掌握高端存储核心关键技术的国家。

“天河1号”等一批国产高效能计算机的投入使用有力促进了我国高性能计算应用水平的提高。目前863计划研制的高效能计算机的用户覆盖了气候气象、油气勘探、航空航天、物理化学、材料科学、生命科学、药物设计、动漫渲染、市政工程、钢铁工业、汽车制造、机电装备、核电设备等众多领域, 有力支持了科学研究和重大工程项目的实施, 极大地促进了我国科技创新能力的提高。

(2) 促进了我国高效能可信计算机产业的发展

我国计算机产业在863计划成果支持下取得了长足发展。千万亿次高效能计算机的技术辐射, 促进了我国计算机服务器产业技术水平的快速提高;国产高端容错计算机推动了技术创新, 促进了服务器产业从中低端向高端跨越式发展, 实现结构优化升级;国产海量存储系统为国防、能源等关乎国家安全的关键行业提供了安全保障。同时可以有效降低高端存储产品的价格和服务费用, 并带动相关的行业应用软件、系统集成以及技术服务产业的发展空间。

曙光、联想、浪潮等计算机厂商已经可以和IBM、HP等国际著名的IT厂商在高性能计算机市场上同台竞争, 在中国100台最高性能的计算机中, 国产机的比例已经超过50%。

(3) 取得显著的经济和社会效益

国产高效能计算机的应用取得了显著的经济和社会效益。例如, 面向大飞机优化设计的并行应用加快了我国大飞机的研制过程, 有力支持了国家重大科技专项的实施。基于高性能计算的药物化合物的虚拟筛选, 大大加快了新药的研发过程, 对于创制国产新药, 保障人民身体健康有重要促进作用。3台千万亿次高效能计算机在天津、深圳、济南落户, 有力支持了地方科技、经济的发展。例如, “神威蓝光”对山东省的发展起到巨大的支撑作用。国产高端容错计算机也将带动国内相关的行业应用软件、系统集成以及技术服务产业的发展, 为国内IT厂商拓展一个每年100亿元左右的广阔市场。

(4) 创新团队建设和人才培养

通过产学研用结合, 建立了一批研发基地, 形成了由国家研究机构、企业、大学与用户组成的创新群体, 培养了大量的跨学科复合型人才, 这对于我国高效能可信计算事业的可持续发展具有重要意义。例如, 863计划“高端容错计算机”重大项目的研究课题分别由企业 (浪潮集团公司与华为技术有限公司) 牵头, 高校 (解放军国防科技大学) 、科研机构 (江南计算所) 和用户单位 (中国建设银行、中国移动、中国联通、中国农业银行) 参与, 共培养了800多人的核心技术团队, 为国产高端容错计算机的快速发展积聚人才, 为国产高端容错计算机持续发展奠定了雄厚的基础。

3. 关键技术提升与突破

自《纲要》实施以来, 在高效能可信计算机研制过程中已取得了一系列重要的技术突破, 并取得了许多标志性成果 (见表2) 。

(1) 异构融合的体系结构

“天河1号”和“曙光6000”采用CPU+GPU的异构融合体系结构, 通过操作系统的异构协同功能、编译器的交叉编译功能和运行时异构资源的协同管理实现了异构系统各部分的协同工作。异构融合体系结构较好地解决了性能、功耗和可靠性之间的矛盾, 走出了实现千万亿次级系统的一条新路。神威蓝光提出并实现了基于国产多核计算、商用辅助计算、国产众核计算等多种资源的多态复合体系结构, 为更大规模的万万亿次系统研制奠定了基础。

(2) 高性能节点设计实现技术

天河1号的CPU/GPU计算节点采用了CPU与GPU高层次高带宽紧耦合、深度睡眠高能效支撑、高带宽低延迟互连接口支持、高密度计算等多项创新技术, 达到了高性能、高能效、高带宽、低延迟、高密度的设计目标。神威蓝光的节点基于国产申威16核处理器, 采用高带宽高容量共享存储和节点维护监控等技术, 实现了高性能高密度的计算节点。曙光6000的龙芯计算分区采用了计算所提出的HPP体系结构和四核的龙芯3A处理器实现。每个HPP节点的8颗龙芯3A处理器和1颗X86处理器通过一个HPP控制器连接。X86处理器运行操作系统, 龙芯3A处理器运行应用程序, 较好解决了商用处理器与国产处理器的结合。

(3) 性能领先的系统高速互连技术

高性能互连是“天河1号”的一大亮点。国防科大团队基于自主设计的高阶路由芯片NRC和高速网络接口芯片NIC, 实现了光电混合的胖树结构高阶路由网络。采用自主高效通信协议、高速串行传输和高可靠流控与交换策略提高了网络通信带宽;通过基于虚地址的传输机制降低了通信延迟, 以硬件自动报文转发机制支持组播、广播等聚合通信。所实现的交换机链路双向带宽达到160Gbps, 点对点通信延迟1.57μs, 单背板交换密度61.44Tbps, 带宽性能两倍于市售的最好的Infini Bnad交换机。高性能系统互连大大提高了“天河1号”的整体性能, 改善了大型并行程序的运行稳定性和效率。

(4) 系统低功耗技术

低能耗是系统研制的重要目标, 也是关乎系统成败的关键因素。863计划“高效能计算机及网格服务环境”重大项目的研究团队在体系结构创新基础上, 通过器件和部件级的低能耗设计、软硬件结合的系统级能耗管理技术和编译器指导的应用层低能耗优化技术, 有效降低了系统的能耗。“神威蓝光”系统能耗为1.074兆瓦, Linpack程序实际运行的能效比达到每瓦7.41亿次浮点计算, 居世界同类系统的领先水平。“天河1号”系统满负荷运行的最大能耗为4MW, 也达到了每瓦6.35亿次浮点运算的能效水平。

(5) 高密度的系统组装技术

神威蓝光给人留下最深印象的是其紧凑的结构和超高的计算密度。系统突破了高密度组装技术, 实现了“运算节点板/冷板/电源板三合一”的组装模式, 有效地缩小了系统的体积。1000万亿次的系统仅由11个机柜构成, 其中, 9个机柜是计算子系统, 每个机柜安装1024个处理器, 计算性能高达128万亿次, 其余2个机柜是互连子系统。这样高的计算密度在世界上也是罕见的, 为更大规模高效能计算机的实现提供了宝贵的经验。

(6) 高效低耗的系统冷却技术

神威蓝光的高效低耗系统冷却技术颇具特色。为适应主机系统高密度组装的要求, 提高冷却系统的运行效率和可靠性, 针对各个不同的对象, 研发了与之相适应的冷却方式, 包括闭循环强制液体冷却、热管传导冷却、冗余热备份等先进技术, 保证了整机系统的高性能、高可靠和高能效。

(7) 高端容错计算机的系列关键技术

研制成功了基于Intel IA-64高端安腾四核Tukwila处理器的计算板, 传输速度高达6.4G/TS, 其成果为4路、8路、16路、32路高端容错产品的研制奠定了坚实的基础;研制成功了高端容错计算机主机FPGA验证系统, 验证了课题组创造性提出的双翼可扩展紧耦合大型服务器体系架构, 实现了只需要1级网络跳步就可以完成64路互连的国际领先技术, 并申请了国际专利;突破了面向直连处理器的两级目录Cache一致性协议技术, 设计实现了双QPI直连通道处理器接口;实现了15GB/s单端口高带宽、低于60ns低延迟的高端容错计算机互连芯片, 使浪潮成为全球第一家设计完成基于QPI1.0的互连芯片的厂家, 该芯片的成功完成意味着系统研制课题的最大的技术风险已经攻克, 为32路整机系统的成功研制奠定了基础。

(8) PB级高性能海量存储系统系列关键技术

浪潮PB级高性能海量存储系统在高可用、高性能多控磁盘阵列体系结构、高性能全局共享缓存及一致性技术、高性能存储交换网络技术、10PB量级的存储虚拟化技术、异构复制技术、重删型快照技术、高速新型相变存储器件设计实现等方面的均有重要创新。

三、目前我国高效能可信计算机领域面临的问题与挑战

1. 存在的问题

(1) 中国的HPC应用水平虽然发展较快, 但是与世界领先水平相比仍然有着非常大的差距, 尤其是在HPC系统软件和应用软件的产业化、性能、可扩展性、投入与可持续性等诸多方面都有一定差距。

(2) 在高端容错计算机和海量存储系统的实际应用中, 由于银行、电信等用户的核心业务系统长期依赖国外产品, 有相当一部分被锁定在国外封闭系统上, 使其难于向国产系统移植;同时, 由于国内的自主品牌处于市场弱势, 国外品牌的硬件和软件与国内自主品牌多不兼容, 这也增加了国产品牌市场推广和应用的难度。

2. 面临的挑战

(1) 大数据的发展浪潮。近年来, 数据密集型应用快速发展, 对高效能可信计算机的体系结构、系统软件、应用模式等都将产生重要影响, 需要抓住大数据时代的应用发展趋势和关键技术机遇, 发展适合数据密集型应用的高效能可信计算机。

(2) 云计算的日益普及。云计算的快速发展和普及对整个信息技术行业产生了革命性的影响, 尤其是在服务器、软件开发、互联网服务等相关产业领域形成了洗牌效果。高效能可信计算机需要面对除了传统HPC应用之外的类型丰富的云服务。

(3) 众核时代的到来。下一代计算芯片从多核向众核过渡已成为必然趋势, 千核级别的计算芯片正在研制中, 体系结构必将由单一架构走向混合架构。体系结构等底层技术的创新可能会引发算法设计、编程模型及工具链甚至应用模式的整体变革, 高效能可信计算机产业将会迎来新的产业技术生态。

四、新形势下我国高效能可信计算机的实施建议

1. 优先主题的调整建议

高效能可信计算机优先主题在国家863计划一系列重大项目的支持下, 经过相关研究单位的不懈努力和地方政府的大力配合, 部分目标已经提前实现, 例如, 千万亿次高效能计算机“天河1号”、“曙光6000”和“神威蓝光”已研制成功并在天津、深圳、济南国家超级计算中心落户。因此, 有必要对优先主题做出必要的调整, 设定更高的目标, 例如具有每秒100PF运算能力的高效能计算机等。

2. 推进实施的政策建议

首先, 国家要在产品与应用层面加大扶持力度。自主品牌的推广应用需要政府部门的政策扶持和应用行业的大力支持, 自主创新是一个完整的链条, 国家除了支持技术研发、产品研制, 更应在新产品推广上给予扶持。同时, 也需要引导和鼓励国内用户积极采购、使用国产品牌。

其次, 坚持“产学研用”密切合作。面向产业链成立技术创新战略联盟, 为计算机制造企业、研究所、大学和高性能计算中心通力合作创造良好环境, 强强联合、优势互补, 实现动态组织、阶段淘汰、滚动支持、联合攻关。以协同创新带动自主创新, 以用户创新带动产业链创新。

第三, 加强国家科技计划与地方和部门科技计划的衔接和配合, 进一步促进国家科技计划之间的协作, 坚守“全国一盘棋”的思想。国家科技计划要与地方经济发展的密切配合, 发挥地方和应用部门的积极性, 是保证高效能可信计算机研究目标实现的重要措施。此外还应鼓励军民融合的发展新模式。

此外, 完善课题成果的评测和评价机制, 通过课题评测和评价机制促进我国高性能计算机的研究和应用。同时积极开展国际合作, 坚持开放的研究道路, 采用走出去、引进来的方式, 了解国际相关领域最新技术发展趋势, 把握正确的研究方向, 制定切实可行的技术路线。

注释

上一篇:交通行业术语中英文对照概要下一篇:综合法