出门问问「魔音工坊」写入AI声音应用经典案例
作者:娱乐 来源:知识 浏览: 【大 中 小】 发布时间:2024-12-27 20:37:15 评论数:
近日,出门《中国生成式人工智能应用与实践展望》白皮书(以下简称“白皮书”)在 2024 年莫斯科举办的问问金砖国家工商理事会上正式发布。出门问问作为此次白皮书编写的魔音重要单位,以AI配音工具「魔音工坊」为例,工坊展示了其在AI声音领域的写入强大应用能力及领先优势。
白皮书由中国联通研究院联合出门问问在内的声音13家研究机构共同研究撰写,聚焦生成式人工智能产业发展前沿趋势,应用深度洞察中国在生成式人工领域的经典应用与实践。
出门问问成立于2012年,案例是出门一家以生成式AI和语音交互为核心的人工智能公司,为全球多个国家和地区提供AI智能硬件、问问AI政企服务,魔音以及面向创作者的工坊AIGC产品。公司致力于打造国际领先的写入通用大模型,通过AI技术、声音产品及商业化三位一体发展,成为全球AI CoPilot的引领者。
出门问问拥有行业领先的AI基础设施能力、前沿通用大模型「序列猴子」,以及丰富的垂直领域软硬结合的优化算法技术模块,是为数不多的同时服务于内容创作者、企业、消费者三大类不同群体的公司。
面向内容创作者用户,出门问问致力于通过AIGC赋能内容创作,目前已构建丰富的AIGC CoPilot产品矩阵,包括AI配音助理「魔音工坊」及海外版「DupDub」、AI数字分身「奇妙元」及海外版「LivGen」、企业AI交互式数字员工生成平台「奇妙问」、可一键成片的AI短视频生成平台「元创岛」等,打造一站式内容创作平台,赋能创作者实现高效内容生成。
其中「魔音工坊」是一款集文案、配音、剪辑全流程一站式 AI 软件,在海内外拥有超过800万注册会员,付费会员超60万。其具有六大核心功能,即软件配音、文字转语音、真人配音、声音商店、效率工具、声音克隆及视频编辑,并拥有有声音克隆、声音搜索、情感合成 / 角色迁移以及声音合成四方面声音黑科技。依托序列猴子大模型,「魔音工坊」可通过 3-10 秒的短音频,快速地实现声音克隆,并支持跨语言迁移、情感语气生成。其海外版 DupDub 还支持多语音音频生成,目前已涵盖英语、法语、日语、西班牙语、 葡萄牙语、泰语等。
以「魔音工坊」和新华社的合作为例,新华社将AI配音加入到新媒体AIGC创新平台后,分别用磁性播音腔、温柔女声、治愈童声等不同类型的声音为推文配上情绪匹配、朗读准确的音频。从文本导入到AI配音成本,通常只要几分钟,大幅缩短了文本配音时间,为新华社工作人员释放更多工作精力。
新华社还可以通过形象克隆和声音克隆技术,为记者或者主持人1:1克隆形象,极大的提升后续拍摄和剪辑的效率。在新华社客户端“问证”板块中,便新增了“数字记者”角色。根据真人记者形象,出门问问为其1:1克隆出了数字记者,并通过短视频形式出镜,随时随地为读者科普播报,报道新闻事件。
截至目前,出门问问的AIGC产品累计服务的用户数量已超1500万,注册用户数量超1000万,其中付费的用户数量约86.5万,公司已由传统AI项目制模式成功转型可持续增长的AIGC业务模式。
这样的成绩,离不开出门问问「产模结合」策略的支持。作为业内稀缺的坚持「产模结合」的公司,出门问问声音大模型与「魔音工坊」的配合典型地体现了「产模结合」数据飞轮效应。一方面「魔音工坊」自身的用户数据昼夜不息地反哺着声音大模型的训练,另一方面,声音大模型让「魔音工坊」不断自我突破,有着“超写实”自然音色的惊艳表现,吸引着全球数以百万计的用户深度玩转。
与此同时,「奇妙元」(海外版 LivGen)、「奇妙问」和「元创岛」也通过「产模结合」,不断进行技术迭代与产品升级,实现用户规模与付费用户数量的双增长。
作为AI领域的先行者,2024年以来,出门问问持续深耕生态布局,先后与华为云、腾讯云、阿里钉钉等行业上下游企业达成战略合作,旨在共同促进大模型产业发展。
这也是出门问问参与此次白皮书的撰写的重要原因,即通过以往积累的AI应用探索与思考,与各位同仁碰撞出更多的火花;在输出中国生成式人工智能行业应用先进经验的同时,为行业未来的发展提供参考。