(资料图片仅供参考)
近来,作为国内知名三模态AI大模型——“紫东太初”备受关注。在该大模型的诞生过程中,曙光全国一体化计算服务平台,为其提供了AI算力,并通过优化存储、通讯等环节,保证其训练的高效性。
“紫东太初”是三模态大模型,以图、文、音(视觉、文本、语音)三模态预训练模型为核心。针对“紫东太初”平台特性,除提供了庞大AI算力外,为保证其高效训练,曙光工程师优化了存储、通讯、计算队列等多个计算环节,并经过节点计算、通讯等多种压力测试。
为降低AI大模型的训练与推理成本,曙光早在2018年就推出了”计算服务平台”,该平台让全国用户无需投入大量成本购买硬件设施,就能完成AI大模型的训练与推理工作。
除能够在线提供Tensorflow、PyTorch、PaddlePaddle等主流AI框架外,曙光实现在数千节点规模时仍能满足高效训练目标,与AI企业形成了基于AI模型的联合解决方案,攻克类脑智能、基因技术等难题。
标签: