图说:2024世界人工智能大会科学前沿主论坛 新民晚报记者 陶磊 摄(下同)
大模型,无疑是2024世界人工智能大会的“宠儿”。
目前上海已有34款大模型过审,产生了制造、金融等垂类领域应用。全国首个大模型创新生态社区“模速空间”落地徐汇,吸引近80家大模型企业入驻。如果说去年大会,人们还在探讨要让技术“顶天”,要使应用“立地”,那么今年,技术与应用之间,更能感受到“你中有我,我中有你”的紧密。
在科学前沿与产业发展两场主论坛,以及多场主题论坛的“未来之声”中,都传递出上海这座打造ai盛会的创新之城,也正以前所未有的姿态,引领全球大模型浪潮,为全球人工智能研究与应用提供了肥沃土壤和无限可能。
“通专融合”是发展路径
如何实现通用人工智能(agi),让人工智能像人一样可以做很多事,不再局限于某些特定领域?
在2024世界人工智能大会科学前沿主论坛上,上海人工智能实验室主任、首席科学家周伯文提出“通专融合是通往agi的战略路径”。在他看来,建立在ai大模型强大泛化能力上的专业能力,是“人工智能皇冠上的明珠”,与目前的大模型相比,这种系统可以更高效、更好地适应并解决现实世界中的复杂问题。
图说:上海人工智能实验室主任、首席科学家周伯文
不久前,大模型对中国高考“跃跃欲试”。还真有一场“大模型高考”,比试了一番各家能力。结果,大模型“考生”在语文、英语上表现还不错,可数学“集体翻车”,连及格都挺困难。
令人稍感欣慰的是,上海人工智能实验室研发的“书生·浦语”2.0文曲星,在数学成绩上排名第一,超过了gpt-4o。在周伯文看来,“书生·浦语”的“险胜”,显示出“通专融合”研发路径的潜在价值。作为一种新的人工智能发展范式,“通专融合”将大模型的泛化能力与专业能力紧密结合,能打造出完整的技术体系。他认为,这个体系包含三层重点工作:基础模型层、融合协同层、自主进化与交互层——
在基础模型层,科研团队专注于高效地构建大模型的通用泛化能力,尤其是高阶能力,如数学、因果推理等。通过高质量数据的清洗和合成,研发高性能训练框架、高效的模型架构。
在融合协同层,科研人员要将泛化性和专业性有效地结合起来。上海人工智能实验室正在采用多路线协同的算法和技术,构建比肩人类优秀水平的专业能力。通过这些技术,ai能够在复杂环境中做出决策,将复杂任务分解为更易管理的子任务,制定行动计划,并有效地协调多个智能体,以实现群体智能涌现。
在自主进化与交互层,人工智能的自主探索和反馈闭环十分重要。人工智能系统要在真实或仿真世界中自主地收集数据、学习并适应环境,通过与环境的交互获得反馈。这些反馈对于ai自我进化至关重要,自主进化与交互层使ai能进行“具身”自主学习,最终对“世界模型”有更深刻的理解并与之交互,具备完成开放世界任务的能力。
“在科学发现领域,通专融合也有巨大的潜在价值。”周伯文表示,通过通专融合,ai能掌握科学知识、分析实验结果、预测科学现象,进而在反思的基础上,拥有越来越强的提出科学假设的能力。
“超级能干”的应用更重要
百度创始人、董事长兼首席执行官李彦宏是世界人工智能大会的老朋友。在2022世界人工智能大会上,他曾提出,ai的技术发展路线,发生了方向性的改变,从过去的辨别式人工智能,转向了未来的生成式人工智能。当年年末,chatgpt问世,“恍如隔世,感觉整个世界都变了,人工智能可以说颠覆了绝大多数人的认知。”
在2024世界人工智能大会产业发展论坛上,李彦宏的观点是:大模型的重点还是“卷应用”,“没有应用,光有基础模型,不管是开源还是闭源都一文不值。”
图说:百度展区吸引不少参观者
人工智能时代,“超级能干”的应用比只看dau(日活跃用户量)的“超级应用”更重要,“我们要避免掉入‘超级应用陷阱’,觉得一定要出现一个10亿dau的app才叫成功,这是移动时代的思维逻辑。”他认为,只要能对产业和应用场景产生大的增益,整体价值就已大于移动互联网。
他以快递行业举例,利用大模型能力处理订单,快递公司做到了“一张图、一句话寄快递”,不再需要其他繁琐流程,时间从3分多钟缩短到19秒。“而且,90%以上的售后问题,也都由大模型来解决,效率提升非常显著。”
在ai应用的发展方向上,李彦宏最看好智能体。他表示,随着基础模型的日益强大,开发应用也越来越简单,其中,最简单的就是智能体,只要用“人话”把工作流说清楚,再配以专有知识库,即可做出一个很有价值的智能体,“比互联网时代制作一个网页还简单”。他认为,医疗、教育、金融、制造、交通、农业等各行业领域,未来都会依据自己的场景和特有经验、规则、数据等等,做出各种智能体,将会出现数百万量级的智能体,形成庞大生态。
“搜索是智能体分发的最大入口。”李彦宏举例说,高考后,有大量考生填报志愿,需要选学校和专业,会遇到各种问题,这时,百度的高考智能体就可回答考生的各种疑问,“高峰时期,百度的高考智能体每天要回答超过200万个考生问题,总共只有1000万考生,说明一天当中有大比例的人在利用这个智能体。”
应用决定ai“超级时刻”
商汤科技董事长兼首席执行官徐立一直觉得,人工智能行业“热辣滚烫”,像gpt带来的聊天式的应用,sora带来的视频上的震撼,但它还没有到“超级时刻”——因为没有真正走进一个行业的垂直应用中,引起广泛的变化。
不过这几天,徐立的想法有点儿变化。他的中学老师不停在群里询问,说怎么样用人工智能去写文案、生成祝福的图片,发到他的退休群里。徐立忽然间意识到,“超级时刻”和应用是互相成就的,“只有‘超级时刻’带来的认知变化,才能推动这样一个应用。所以倒推回来,如果用应用来支撑,那么我们现在这个时刻就是‘超级时刻’。”
图说:“镇馆之宝”商汤科技vimi可控人物视频生成大模型演示
徐立告诉大家,应用是决定这个时代是不是人工智能“超级时刻”的一个关键。
他打趣说,现在大模型某种程度上只是记忆器——只是背下了所有的知识点,仅有的一点智能实际上来自于互联网数据背后带有的高阶逻辑思维链。“如果要推动人工智能‘超级时刻’的到来,需要大模型可以展现出卓越的深度思考能力。那么合成的人工数据,特别是高级思维的数据往往是非常重要的。所以越是有应用的场景,才能形成高质量数据的核心。”徐立分析。
他还认为,实时的交互性能够带来流畅的体验,亦是推动“超级时刻”以及应用变化的核心之一——在这一点上,端侧是非常重要的突破点。商汤科技今年以来着重推动模型的端侧优化,使实时交互更加流畅,“用好端和云两部分的计算机资源,才能够成为一种全自然的交互模式。”
此外,推动“超级时刻”很重要的一点是可控。因为大模型如果不具备可控性,那么它作为工具,本身能够带来的效能提升就非常有限,“你不需要做得很好,但你需要知道你哪里做得不好,有了这样的一个边界,实际上才能做到真正的可控技术以及可持续的技术发展。”
在行业领域构筑领先地位
华为常务董事、华为云ceo张平安表示,我国人工智能发展离不开算力基础设施的创新,并且要敢于开放行业场景,让人工智能在行业应用上领先。
“我们不能把ai基础设施依赖于是不是有最先进支撑的ai芯片。如果没有了,我们就没办法在ai上领先,这个观点必须要摒弃掉。”张平安介绍,华为创新的方向是将端侧的ai算力需求通过光纤和无线网络释放到云上,通过端云协同获得无缝的ai算力。通过云侧的算力,让端侧既保持了丰富的功能,又极大地降低了功耗和对芯片的依赖。
中国拥有千行万业的业务场景,也拥有全球最大的软件创新人群。张平安指出,中国的人工智能发展道路,追求的应该是在行业领域构筑大模型的全球领先地位。如果各行各业都积极拥抱ai,积极地开放行业的业务场景,中国很有机会在2b(面向企业客户)领域构筑起全球的领先优势。
在6月底举办的华为开发者大会2024上,华为云盘古大模型5.0正式发布,在“全系列、多模态、强思维”三个方面进行了全新升级,在自动驾驶、工业设计、建筑设计、具身智能、数字内容生产、高铁、钢铁、气象、医药等领域,提供了更加丰富的创新应用和落地实践。以钢铁行业为例,目前盘古大模型已经在宝钢的一条热轧生产线上线,预测钢板精度提高5%,每年有望多生产2万吨钢板,增收9000多万元。
新民晚报记者 叶薇 郜阳