出门问问的2022年: AIGC和生成式AI探索进行时-天天新动态
(图片由AI绘画工具Midjourney生成)
2022,是世纪疫情与百年变局交织的一年,也是科技照亮世界的一年。
这一年,韦伯望远镜带来的震撼,将重写人类对于宇宙的认识。而在人类的艺术科学领域,AI正在进军一场抢地战。2022年12月,Science杂志发布2022年度科学十大突破,AIGC 赫然在列。
(资料图片)
这一年,生成式AI迎来爆发式增长,AIGC正在改变内容领域的生产方式,带来了整个行业的变革。而早已探索多年生成式AI的出门问问,也在2022这一 AIGC 元年历经着完全不同的发展时期。
2022年,出门问问在持续深耕智能硬件、AI政企服务等方面的同时,不断优化多模态大模型、拓展AIGC商业化布局,作为国内 AIGC 领域的先驱者和践行者,正逐步成为一家基于AIGC技术,服务于全球内容创作者的,一站式内容生成工具提供方。
01
技术积累:
与AIGC一脉相承的商业探索
2022年是 AIGC 元年,这是一场席卷全球的AI革命发展的必然。
早在2017年,Transformer 架构的发展改变了 NLP 技术的轨迹。GPT系列正是 OpenAI 在 NLP 领域打造的模型,从2018年第一代 GPT 的诞生到2020年 GPT-3 的脱颖而出,一场AI大模型的进化,让图像生成领域也酝酿了一场革新。随着AI绘画的爆火和 ChatGPT 的横空出世,让全世界看到了 AIGC 的“强大”。
AIGC为AI行业带来一种全新的可能性和商业模式。在AIGC之前,绝大多数AI公司的商业模式都是偏ToB项目制,难以复制和规模化,人力成本高,且商业壁垒低。而AIGC让AI公司为更多中小型企业甚至个人提供一种工具,可规模化地降本增效。
这与出门问问近年来的产品化思路一脉相承,出门问问在探索AI生成技术和产品之路上更加明确了PLG和规模化的商业模式——服务全球创作者,提供一站式内容生成工具。
02
战略谋篇:
早于“AIGC”诞生之前的投入布局
更深的洞见和笃行,来自厚积薄发的沉淀。
“AIGC”这一名词于2022年在全世界诞生和蓬勃,其特点和方向却与出门问问的发展脉络有着惊人的一致性。2022,也许大部分公司刚开始叩响AIGC的大门,而出门问问已然在这条道路上走过了一段自己的风景。
作为国内最早布局AIGC领域的公司之一,出门问问自2017年起,重点关注 Transformer 大模型进展。
2020年,出门问问深度聚焦 GPT-3,并最早着手开发了可拓展可快速优化的中文GPT-3——多模态大模型UCLAI,于2020年推出基于UCLAI的第一款AIGC商业化产品——AI配音平台「魔音工坊」,在全球范围内获超百万量级的活跃用户,开启了AIGC商业化的序幕。
2021年,出门问问进行AIGC底层模块化技术的开发和布局,包括文字生成语音、文字生成图片、图片生成视频等,为快速寻找AI落地场景打下坚实的技术基础。
2022年,出门问问实现 AIGC 产品矩阵的全面商业化落地。基于强大的产品能力——算法技术中台化,出门问问实现产品矩阵的迅速迭代及运营拓展,完整推出集AI声音、AI写作、AI图片生成、声音和形象克隆、数字人视频制作、数字人直播等内容生成于一体的 AIGC内容SaaS 平台。平台拥有一站式服务、1:1高仿真克隆技术、海量数字资产、成熟/可信赖的商业模式等核心亮点。
03
商业落地:
打造一站式AIGC产品矩阵
“接下来AIGC的进一步平民化,必将改变人们的内容创作方式,让消费者成为创作者,让更多人借助AI来拓展智慧、知识和想象力的边界。”出门问问创始人兼CEO李志飞表示。
出门问问希望将一站式AI内容生成工具打磨得更加极致,更有效地赋能广大内容创作者和创业者,让更多人享有AI创作自由、创造效率提升,用AI链接虚拟和真实世界。
AI声音生成——魔音工坊 & DupDub
在AI声音领域,出门问问2020年推出第一款AIGC产品——「魔音工坊」,海外版「DupDub」,致力于为用户提供高品质AI配音,目前已在全球范围内获超百万量级用户。
●丰富的声音库,包括500+音色、10+语种和1000+声音风格;
●强大的声音编辑功能,包括多音字调整、语速调节、重读、拖音等;
●媲美真人的声音克隆:结合出门问问新一代TTS引擎 MeetHiFiVoice,最少输入20句话,即可定制高仿真AI声音,兼具情感迁移、跨语言迁移。
作为业界Top级配音平台,魔音工坊与光明日报、新浪、喜马拉雅、微信读书、少年得到、大众汽车集团等知名海内外多媒体平台及企业均达成合作,是抖音、快手、头条等各大视频平台拥有百万及千万量粉丝的大咖们的首选配音平台。
数字形象一站式解决方案——奇妙元&元创岛
对于面向创作者的数字影像领域,出门问问部署了融合“视频生成”和“虚拟直播”的一站式解决方案。
在「奇妙元」——一款2.5D/3D 数字人视频生成&直播平台,用户仅需敲敲键盘、输入文本,即可一键创作惟妙惟肖的数字人视频。
●数百量级的3D/2.5D/卡通角色;
●百余款多语种精品AI发音人;
●覆盖全领域内容类型的场景模版,轻松赋能创作灵感;
●1:1高仿真声音&形象克隆技术;
在「元创岛」——一款3D数字人制作、数字资产托管服务、多种动捕驱动方案于一体的集成 SaaS 系统,可实现炫酷直播、IP活化、形象克隆。为了降低广大创作者的直播门槛,仅需一台笔记本就可以实现半身动捕。
同时,数字形象一站式解决方案全新推出AI数字人自动播功能,输入文案即可驱动数字人自动播报,并上线24小时数字人直播功能,代替真人不眠不休地直播,节省更多运营成本。
目前,出门问问的百变数字人已广泛用于电商带货、口播视频、娱乐主播、企业IP中,如为春秋航空定制专属数字人形象“阿秋”、孵化出斗鱼头部萌妹主播“甜妹小给给”、为工商银行定制数字员工。
AI写作——魔撰
在文案生成领域,2022年出门问问推出全新AI写作工具——「魔撰」,用AI帮助内容创作者更快地写出更好的文案。
●实时纠错并反馈可以改进的地方;
●助力头脑风暴,续写文章;
●AI写作模版和智能润色,找回遣词造句的新鲜感;
●古今词典、多语翻译、文案提取等功能,让你手握灵感,敲出不凡。
「魔撰」的布局基于出门问问在该领域长期积累的大量文案素材和沉淀用户数据,建立了坚实的生态壁垒和产品竞争力。
AI图片生成——言之画
2022年AI绘画爆火,创意十足的吸睛图片也成为很多广告创意、游戏行业从业者的刚需。出门问问推出面向全球游戏广告行业的「言之画」——一款可快速生成爆款广告素材,智能辅助游戏设计的AI图片生成平台。
言之画具有“文本生成图片”、“文本及图片生成图片”、“定制模型”等功能,支持现代风格、古风、二次元风格等多种风格和视角的高精准垂直内容,可提高内容二次创作度。
目前,多家知名游戏及广告创意公司已与「言之画」达成深入合作。
声音&形象克隆
当真实与虚拟相融,我们与数字未来的距离越来越近,如何“复刻”世界的另一个自己?出门问问重拳锻造业界领先的「数字克隆人」定制业务,精耕形象克隆和声音克隆,致力于创建在虚拟世界的个人数字资产,让每个人遇见“更好”的自己。
形象克隆可基于一段记录真人的表情和肢体动作的5分钟视频,以1:1高仿真克隆技术还原真人的容貌、嘴型、表情、肢体动作和声音。
声音克隆最短只需录制20句话,在小时级别内即可获得声音模型,同时可以在不额外录制数据的情况下,让声音拥有丰富的情感以及多语言能力。
目前克隆业务正在火热开展,已为多领域行业标杆克隆定制数字人,并与行业内声优大咖联合定制个性化音色,碰撞出更多创作火花。
04
全球化布局
出门问问在积极布局AIGC的全球化。
AIGC产品没有地域限制,具有天然的全球化性质,出门问问将延续自身软硬结合产品的全球化发展路径,利用一流的国际化视野、团队和出海经验,布局国际化市场。同时,海外已有同类AIGC产品,也为出门问问的产品出海奠定了深厚的用户基础。
此外,国内互联网场景应用较国外深入,已让出门问问开发的视频内容AIGC工具具有很强的行业领先地位和用户基础。2022年,出门问问的「魔音工坊」海外版 DupDub 已实现国际布局,更多AIGC系列产品从规划之初即以全球化发展作为基本方向。
结语
AIGC的一小步,却是人类文明的一大步。
2022年,AIGC正重塑内容生产方式,推动人类生产关系的变革。
出门问问坚信这项技术的革命性力量。而模型覆盖音频、图像、文本、视频、直播等多模态的内容生成能力,让出门问问成为目前国内 AIGC 领域布局最全面的公司之一。未来,出门问问将持续探索AIGC和生成式AI,为全球用户实现AIGC创作打造更多有价值的应用,让AIGC更好地激发人类灵感,让“人机”互相成就,领跑下一代AIGC大局。
AIGC本身也是一场技术、产品、商业的军备竞赛,而AI的边界在哪里,需要我们一起探索。正如出门问问所期待的,AIGC 并不是终局目的,对「定义下一代人机交互」这一愿景的践行才是最核心的目标。
2022,出门问问始终在路上。