记者 王俊 北京报道
从去年年底到今年年初, ChatGPT火爆全球互联网, ChatGPT爆火的背后原因是什么?
4月20日举行的IT市场年会上,云从科技咨询规划总监张俊结合当下的大模型火爆的原因,提出发展大模型建议的思考。
(相关资料图)
张俊建议采取“新型举国体制”,由政府统筹通用底层平台建设,联合AI头部企业、科研机构、高等院校等协同攻关基础大模型技术。大模型研发需要高门槛的算力、数据、人力支持,其具有重要的基础设施属性,建议地方政府统筹规划,出台相关扶持政策和科研补贴,政企共建大模型基础设施,打通数据要素,开放应用市场,加快大模型快速落地并持续发展。
ChatGPT的成功证明了AI大模型技术路线的正确性
从去年年底到今年年初, ChatGPT火爆全球互联网。ChatGPT是美国Open AI基于GPT自然语言开发的聊天程序,底层是基于Open AI在GPT预训练语言模型迭代生成的程序。GPT-1模型参数1.17亿,GPT-2、GPT-3模型参数分别为15亿、1750亿,2023年3月最新发布的GPT-4参数数量是GPT-3的16倍,达到1.6万亿规模。
张俊指出,ChatGPT的成功证明了人工智能大模型技术路线的正确性。这意味着人工智能从之前的统计分类阶段走向人类逻辑沟通阶段。
AI大模型是经过大规模训练后能适应一系列任务的人工智能算法模型,是“大数据+大算力+强算法”的结合物,包含了“预训练”和“大模型”两层含义。也就是说大模型经过大规模数据训练之后,无需微调或仅需少量数据的微调就能适应千变万化的场景。
张俊表示,大模型发展的历程,一方面是参数规模从亿级到百万亿级突破;另一方面,模态从NLP自然语言大模型到CV大模型到科学计算大模型,逐渐演变到多模态的大模型融合状态,更加提高了模型算量的理解能力、应用场景的适配能力以及计算性能。
他提到,大模型相比传统AI模型有三方面优势。第一是涌现效应,大模型能通过简单规则和相互作用,有效集成自然语音处理等AI核心技术,涌现出强大的智能表现,将人工智能的能力从原来的感知提升至理解、推理,甚至近似人类“无中生有”的原创能力。
第二是使用场景的广泛应用。张俊表示,AI大模型通过在海量、多类型的场景数据中学习,能够总结不同场景、不同业务下的通用能力,摆脱小模型场景碎片化、难以复用的局限性,为大规模落地人工智能应用提供可能。
第三,研发效率提高。传统小模型高度依赖人工标注数据和人工调优调参,研发成本高、周期长、效率低。大模型将研发模式升级为大规模工厂化范式,采用自监督学习方法,减少对人工标注数据的以来,显著降低人力成本、提升研发效率。
张俊提出,大模型具有泛化性和通用性,可以算打通传统人工智能技术通用性“任督二脉”的关键;基于“预训练+精简”等新范式有效降低AI开发应用门槛;并且大模型以创新的自然语言处理技术,使得人机交互方式更自然。
“基于多领域的知识,构建了统一的、跨场景、多任务的多模态大模型已成为人工智能重点的发展方向。未来人工智能像供水供电一样流向终端,流向用户、流向企业,谁能先做到这点,谁就会在AI战局中获得先机。”张俊说。
云从科技成立于2015年,是第一家在科创板成功上市的人工智能平台公司。从2019年发布CWOS1.0,至今推出了基于大模型的CWOS2.0。“我们的愿望是构建像人一样思考和工作的人机协同的智能体,通过我们CWOS算法工厂、AI数据湖、知识计算、人机交互以及智能业务等核心模块,实现对人的感知分析,对思考和行动的全面协同仿真,形成整个物理世界的数字化。”张俊说。
采取“新型举国体制”,由政府统筹通用底层平台建设
基于对大模型的理解,张俊提出了几方面建议,第一,在创新体制方面,建议采取“新型举国体制”,由政府统筹通用底层平台建设,联合AI头部企业、科研机构、高等院校等协同攻关基础大模型技术。大模型开发需要很高的门槛,目前国内很多基于ChatGPT的应用仍沿用美国的技术架构,但这些并不开源,因此要搞开源之路,加强数字监管、开源开放促进行业生态的发展应用。
第二,赋能产业发展,围绕地方产业发展战略定位,基于大模型攻关成果,研发行业专属大模型,赋能地方产业发展,推动地方数字经济发展。
第三,推进数据共享开发。在智慧城市和数字化建设过程中发现存在数据壁垒和数据孤岛问题,发展大模型首先要解决数据安全高效的共享,包括面向政务、民生等行业应用场景,挖掘数据价值,将大模型成果应用于政务服务、城市治理、民生服务等领域,提高城市管理能力。
第四,创新应用,大模型并非一蹴而就,需要通过不断积累和不断迭代产生的效益,让更多行业和城市的数据接入基础大模型库,促进大模型应用创新。
第五,大模型研发需要高门槛的算力、数据、人力支持,其具有重要的基础设施属性,建议地方政府统筹规划,出台相关扶持政策和科研补贴,政企共建大模型基础设施,打通数据要素,开放应用市场,加快大模型快速落地并持续发展。
标签: