兴业证券打造更“自然”的数字人,火山语音提供技术支持
随着AI技术的不断成熟,越来越多金融机构将虚拟数字人应用到业务场景中。虚拟数字人能够打破时空限制、实现降本增效、提高服务体验,有望进一步助力金融机构数字化转型、提升运营效率。
(资料图片)
以兴业小知为例,与此前诸多的虚拟数字人不同,小知是兴业证券携手火山引擎打造的业内首款以自有员工为原型、集“播报+服务”于一体的全真数字分身。作为智慧主播,数智服务官小知将在优理宝App、兴业证券App以及兴业其他新媒体平台为用户解读股市行情、播报市场资讯。
兴业证券首位数智服务官小知
整体来看,小知不仅从外形上深度还原了兴业证券明星投顾的形象,更重要的是其口唇形、微表情与动作也都达到了较高的仿真度与自然度。作为火山引擎金融虚拟数字人解决方案的技术提供方,火山语音通过使用行业领先的非自回归模型的唇形生成网络,合成与输入文本或语音完全匹配的唇形,准确率高达98.55%;基于创新的Motion Graph技术,数字人可以轻松做到毫秒级动作切换延迟且自然无感知。
值得一提的是,数智服务官小知在火山语音领先的端到端语音合成技术加持下,还具有开心、惊讶、愤怒等丰富的情感演绎能力,还可通过控制音色的重音、停顿等,赋予多样的语气,实现笑声、哭腔等非语言现象建模能力,贴近真人的同时为用户提供更有温度的服务。可以说,小知是兴业证券在数智化转型的一次重要探索和实践。
据了解,在火山语音的“AI虚拟员工解决方案”支持下,火山引擎已建立了包括2D、3D卡通和3D超写实在内的虚拟数字人产品矩阵;从场景适配出发,包括“播报型数字人”和“交互型数字人”两种类型。其中播报型数字人,即输入文本或语音,就可生成自然生动的数字人播报视频;交互数字人作为播报型数字人的形态升级,依托于火山语音长期积累的成熟语音交互技术,可以做到“善听”、“会说”、“能想”,与用户面对面实时交互。
数字人产品矩阵
交互数字人集成了全双工语音交互链路,前向兼容语音以及文本输入,后向兼容2D与3D数字人表现力,整体端到端交互延迟在500ms左右,性能效果达到业内领先水平。
多模态交互数字人技术环路
目前该方案已经具备标准平台的快速交付能力,面向金融、大消费、泛互等行业提供涵盖“金融客服”、“智慧导览”、“智能助理”、“虚拟直播”等场景细分解决方案,为用户带来全新的互动服务和便捷体验。2022年6月,火山引擎虚拟人数字平台已获得信通院首批数字人系统基础能力认证。
在数字化浪潮之下,各行各业的虚拟数字人“大战”已蓄势待发。此次兴业证券推出的虚拟数字人便是打响了新年“第一枪”。在火山引擎等科技公司的加持下,让这场没有硝烟的“战争”变得更加精彩。面对这一片新蓝海,最终谁将脱颖而出,谁又将“笑到最后”,需等待时间检验。