开普云AI数字人能力平台通过信通院数字人系统能力评测|焦点信息

(相关资料图)

日前，中国信息通信研究院（以下简称“中国信通院”）发布数字人产品评测结果，开普云AI数字人能力平台在技术能力、工程化能力、安全保障三方面均顺利通过评测，获得权威肯定，这也标志着开普云的数字人能力达到了行业领先水平。

2021年以来，随着元宇宙概念的持续火爆，数字人相关的市场规模也随之迅速扩大，然而行业也呈现出产品良莠不齐、评判方法缺失等问题，让用户选择数字人时无从下手，亟需权威的行业标准统一认知。中国信通院发起的数字人系统基础能力评测依据《数字人系统基础能力要求及评估方法》标准开展，代表业界顶尖技术水准。

开普云AI数字人能力平台参与并通过了基础技术能力、基础工程化能力、基础安全保障能力三大维度的全面评估，其中基础技术能力包括形象技术能力、语音技术能力、驱动技术能力、内容供给能力、人设定制能力等能力，基础工程化能力包括标准资源配置披露、可移植性、易用性、可扩展性、兼容性、时效性、可靠性等方面，基础安全保障能力包括形象版权保障、显著标识等内容。

开普云AI数字人能力平台基于人工智能技术，实现数字人形象自动构建与驱动的突破与创新，从而简化了传统的数字内容制作操作过程，具备“低成本、零门槛、智能化”生成数字人能力特点，能够“大批量、高效率、自动化”地进行数字人视频内容生产，高效生成可操作、可落地、可感知的数字人，在客户的不同业务场景下进行数字人赋能，提供一站式的数字人生成运营服务。

在数字人核心驱动技术方面，开普云数字人驱动采用身份无关驱动技术路线，定制化数字人驱动不需要一般厂商长达数天的个性化模型训练，仅需数分钟的预处理，即可实时驱动任意符合拍摄标准的定制化视频。为了实现高质量驱动，开普云算法团队创新研发了利用人脸三维模型重建系数辅助进行语音驱动数字人神经网络训练算法，利用同步损失、重构损失、感知损失等多种损失函数设定进行画质提升；并基于StyleGAN技术思想，通过引入人脸识别损失函数，研发了能够保持个人身份特征的面部视觉特性优化算法，进一步提升了数字人的动态视觉表现力。相较于经典的数字人驱动算法，在保持语音驱动数字人音唇同步性的同时，提高了数字人驱动效果的自然流畅度，尤其是在4K高分辨率情况下的驱动画质。申请发明专利《语音播报视频的生成模型训练和使用方法、装置及设备》、《说话人视频的生成模型训练和使用方法、装置及设备》等。

在平台能力方面，为满足用户简便快速内容生产需求以及业务扩展需要，平台在架构与功能方面进行了精心设计与优化，支持通过简单拖拉拽的方式设置形象、位置、声音、背景、字幕、素材等内容；平台支持算法集群部署和多并发调用，拥有大批量用户支撑能力；还具备开放API集成能力，已与某融媒体导播平台、某数字内容融合管理云平台完成对接，为其提供数字人生成能力赋能；平台支持SaaS和本地化部署，生成的视频结果可一键分享到网页端、移动端进行多端访问。

开普云AI数字人能力平台满足了用户普遍的使用需求、支持业务规模化应用落地、适应多样化场景，通过本次评测是开普云在人工智能领域尤其是智能化内容生产领域深厚技术积累和创新能力的印证。未来，开普云将不断探索技术创新，推动数字人、AIGC等技术与产业的深度融合，让这些技术更高效地融入可落地的产业场景中。

标签：