【资料图】
一口标准的普通话,一串丰富的解说。最近,浙江台州农户林东东的直播间涨粉不少,“全靠这个App,台州话‘秒切’普通话,还能根据我的肢体语言进行补充,太神奇了。”
林东东是台州临海市涌泉镇忘不了柑橘专业合作社的董事长,自家经营的柑橘有一大部分通过“直播带货”找销路。可是,临海话属于吴语方言,顾客直呼“听不懂”,聘请专业主播费用高,又增加了营销成本。
浙江工商大学“气韵声动”学生团队在社会实践时发现了这一问题。“想在直播上打开销路,农户必须打通语言关。”考虑到浙江各地方言多样,团队10人先后在浙江11个市37个乡村反复调研,与70余位农户、20余位乡镇书记交流,熟悉各地的方言特征和表达方式,并形成文字方案。
4个月后,首套适用于台州方言农产品推广的音频驱动虚拟人脸视频系统问世了。这套系统采用“声动”技术,借助虚拟人平台实现直播服务。用户可以自由录入语音,系统则运用人工智能技术对录音进行智能识别,并生成高质量的合成语音,存储于虚拟库中。直播时,只需选择对应的音色和文本即可轻松转化为合成音频。
这款系统的研发均出自学生之手,据介绍,该系统还应用先进的特征向量情感分析和参数化驱动技术,不仅呈现出更加逼真的表情效果,同时还具备强大的学习能力和精准回应能力。“我只要摆一个姿势,这个软件好像就知道我要说什么,把我想要表达内容的用一连串漂亮的话说出来。”林东东说。
如今,该技术在多个直播平台陆续推广,接下来学生团队还将推出匹配各种方言的新系统。(中国教育报-中国教育新闻网 记者 蒋亦丰 通讯员 林晓莹)