新民晚报讯(记者 李一能)电视剧《繁花》的热播,唤起了许多人保护传承沪语的热情。但随着能说一口地道上海话的人越来越少,未来上海年轻人去哪里学习标准沪语成为了难题。今年两会,上海市政协委员、市工商联副主席、上海商汤智能科技有限公司董事长、首席执行官徐立递交了关于建设沪语特色类大模型,助推沪语传承的提案,让ai人工智能成为永不下线的沪语老师。
徐立表示,最近,沪语版电视剧《繁花》大火,极富韵味的沪语台词生动地展现了上世纪 90 年代的上海风情。比如吃排头(挨批评)、贼塌嘻嘻(滑头滑脑)……上海话成为沪语版《繁花》营造年代、城市氛围不可或缺的道具,观众对沪语台词引发的讨论甚至超过了导演、演员、剧情。社交平台上,观众热衷分享电视剧中的精彩沪语台词片段。
徐立认为,沪语是在上海地区悠久历史中形成的独特方言,汇聚了吴越江南语言文化的精华,并在开埠后东西方融合的过程中兼容并包,形成了深厚的文化积淀,更是构成海派文化的核心基础。
但九十年代以来,随着上海建设国际化大都市的步伐逐年加快,人口流动日益频繁,外来人口逐年增加,人口结构的改变直接导致沪语的使用范围与频率日渐萎缩,甚至已面临传承难的问题。目前,年轻一代除了在原生的沪语家庭能够有机会学习和接触之外,其他场景中,诸如学校、就业单位等等,都难以提供长期稳定的学习及使用沪语的环境。如何利用最新的科技手段,为沪语提供全新的生存环境、使用场景,让更多年轻人有机会、有意愿使用沪语,成为助推沪语传承的一个新方案。
在诸多选项中,人工智能ai无疑是一种理想选择。目前大语言模型已经迎来黄金时期,但针对地方方言的自然语言大模型产品仍属空白,主要是商业价值未能闭环。一方面,沪语的使用人群如果放眼到全国,仍属小众,开发成本难以进行大基数平摊,从经济角度而言是不划算的;另一方面,沪语与普通话存在巨大差别,构建沪语大模型需要针对沪语语料进行重新筛选、标注,需要大量对沪语有深入研究的专家全程参与,基本等同于重建一套新的语言体系模型,难度较高。
因此徐立建议,相关委办局设立专项建设以沪语为主的语言类大模型。对沪语体系进行全面的搜集与梳理,建设沪语语料库,包括但不限于文字、发音、逻辑、语义等等,依托语言大模型技术,实现全沪语交互的功能。前期可以先行提供“狭义沪语”版本,目前商汤的语言大模型、如影数字人等产品,均具备了基本的沪语交互功能。后期可逐步实现崇明方言、浦东方言、松江方言等在内“广义沪语”版本。
此外,还建议推动沪语大模型赋能推广教学。大模型目前已经具备多模态的输入输出能力,可提供多场景多形式的教学内容覆盖,调动青少年积极性。可以充分利用大模型推出沪语应用场景模拟、沪语网络微电影,吸引青少年群体加入到沪语爱好者的行列中来使得年轻一代可以有更多机会接触和使用沪语。
“畅想未来,熟练掌握沪语的人工智能,可以在一网通办、税务、银行、医疗、养老等等场景中发挥作用,更重要的是,它将成为永不下线的沪语老师,让未来的年轻人能够有途径学到最地道的各种上海方言。”徐立表示,如果这一探索能够成功,对于运用ai保护中国其他地区方言,乃至全球范围内的濒危语言,有着巨大的借鉴意义。