8月30日,阿里云宣布正式启动张北超级智算中心,总建设规模为12EFLOPS(每秒1200亿亿次浮点运算)AI算力,可为AI大模型训练、自动驾驶、空间地理等人工智能探索应用提供强大的智能算力服务。
据介绍,该智算中心由“飞天智算平台”支撑建设,以先进的技术架构,将衡量算力效率的核心指标“千卡并行计算效率”从传统架构的40%提升至90%,可将算力资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。
同期,阿里云正式对外开放这座超级智算中心的技术底座“飞天智算平台”,可通过公共云和专有云的模式服务于各类企业机构,并同步启动另一座位于乌兰察布的智算中心,建设规模为3EFLOPS(每秒300亿亿次浮点运算)AI算力。
两座超级智算中心能够实现规模和效率的突破,是自大数据AI一体化平台到算力基础设施体系化技术创新的结果。传统智算中心达到一定规模之后,增加算力资源反而会降低算力输出的能力。阿里云通过体系化的核心技术自研,改变了智能计算的损耗难题。
例如,在通信技术上,阿里云采用高性能自研Solar-RDMA网络,实现端对端最低2微秒延迟,配合阿里云自研的无阻塞通信技术,让计算过程中的数据交换速度提升了5倍以上。同时,自然风冷、液冷等绿色技术的应用,让智算中心的能耗降低,PUE(电能利用效率)最低可达1.09。
据介绍,这两座超大规模的智算中心正在服务于AI大模型训练、遥感探测、数字人、自动驾驶、生命科学、元宇宙等前沿智能应用。其中,小鹏汽车基于飞天智算将自动驾驶模型训练提速近170倍,深势科技采用飞天智算让分子动力学仿真模拟训练效率提升5倍。