全双工语音大模型赋能情感联结 Soul构建“类真人”社交陪伴体验


中国产业经济信息网   时间:2025-10-20





  当AI技术深度融入社交领域,Z世代对“自然交互”“情感共鸣”的需求正推动行业从“工具化辅助”向“人性化陪伴”升级。聚焦年轻群体的社交平台Soul,凭借自研端到端全双工语音通话大模型的技术突破,打破传统人机交互的“轮次对话”桎梏,为年轻用户打造出更具真实感、更富温度的社交新场景,也为AI社交的发展提供了“技术+人文”融合的实践样本。

  在数字化社交语境中,传统语音交互多采用VAD(话音活性检测)机制与延迟控制逻辑,陷入“一问一答”的机械循环——用户需完整说完一句话,AI才能启动回应,不仅割裂对话节奏,更难以传递语气起伏中的细腻情绪。这一痛点与Z世代追求“无压力社交”的需求形成鲜明反差,他们迫切期待更自然、无割裂感的交互模式,以缓解语音沟通中的尴尬与紧张。正是基于对用户痛点的深度洞察,Soul历经多轮技术迭代,推出升级后的端到端全双工语音通话大模型,从交互逻辑层面实现根本性突破。

  新模型的核心优势,在于赋予AI自主决策对话节奏的能力。与传统模型不同,它摒弃了依赖VAD的被动响应模式,可主动打破沉默、适时打断补充、实现“边听边说”,甚至能通过时间语义感知、环境音识别调整互动策略——比如在用户分享趣事时,AI会以自然的语气词“哇”“好有意思”实时回应,而非等待对话结束。同时,模型搭载多维度情绪理解模块,能捕捉用户语音中的情绪波动,无论是焦虑时的语速加快,还是开心时的语调上扬,都能匹配对应的情感反馈,让交互摆脱“机械感”,更接近现实中朋友间的聊天状态。 

  目前,这一技术正陆续在多元社交场景落地验证。例如,在不久前的WAIC大会上展出的在Soul“群聊派对”场景中,全双工语音AI主持人成为“氛围粘合剂”:当用户讨论陷入停滞时,AI会结合主题抛出“最近发现的小众爱好”等话题;当多人同时发言时,AI能判断说话优先级,避免对话混乱,提升群聊参与度。在1V1语音互动中,技术则有效降低了社交门槛,社交内向用户无需刻意组织完整语句,可像与熟人聊天般自然插话、补充观点,从实际反馈来看,越来越多用户因这种“无压力交互”更愿意开启语音对话,社交时长与互动频率均有明显提升。此前在2025世界人工智能大会(WAIC)现场,Soul还展示了该技术向视频领域的延伸方向:结合实时视频生成能力,未来用户可与AI进行“面对面”的全双工视频互动,构建更立体的“数字人格”联结。

  技术的终极价值,始终指向人的需求。从2016年成立之初便怀揣着“让天下没有孤独的人”的美好愿景,到如今以全双工语音技术打破人机交互壁垒,Soul的探索始终围绕“技术服务情感”展开。随着全双工语音在多模态交互、多人场景的进一步优化,平台将持续推动AI从“高效工具”向“有温度的伙伴”转变,让每个年轻用户都能在数字社交中找到自然表达、深度共鸣的空间,为AI社交行业的健康发展注入人文力量。


  【版权及免责声明】凡本网所属版权作品,转载时须获得授权并注明来源“中国产业经济信息网”,违者本网将保留追究其相关法律责任的权力。凡转载文章及企业宣传资讯,仅代表作者个人观点,不代表本网观点和立场。版权事宜请联系:010-65363056。

延伸阅读



版权所有:中国产业经济信息网京ICP备11041399号-2京公网安备11010502035964