持续引领智能语音和人工智能领域——科大讯飞:让“中国声音”在人工智能星海中走向全球 一家源自中国科学技术大学的公司,自1999年成立以来,以“让机器能听、说、懂、思考”为使命,持续引领智能语音和人工智能领域。这是科大讯飞。从实验室的技术突破赋能千行万业,从中文语音合成全球第一到星火模式撑起国际巨头,科大讯飞用26年的坚持和创新,为“中国声音”走向世界发挥了强有力的作用。创新源头:攀登科技珠峰的“中国足迹”。独立的变化是深入骨髓的科大讯飞DNA。公司实现关键技术突破gy资源处于战略层面,每年将营业收入的20%左右投入研发。它在人工智能发展史上书写了一系列中国里程碑:从2008年机器语音合成首次超过普通人的语音水平,到2012年超过人类专家的语音分析,再到2015年语音识别超过人类速记员,科大讯飞逐步打造出“听得准、说得好”的机器。在语音合成技术方面,2006年至2019年连续14年获得暴雪挑战赛国际语音合成大赛冠军;在语音识别技术方面,2016年至2023年在国际多通道语音分离与识别竞赛Chime中连续四届获得冠军,2021年在国际低休息赛全部15个限制性语言赛道和7个非限制性语言赛道上获得冠军raint多语言语音分离Openasr……真正的突破从让机器“理解和思考”开始:全国博士考试成绩超过人类考生96.3%,展现了AI在专业领域的巨大潜力; 2019年,机器阅读理解首次超过人类平均水平;直到2023年,公司在新一轮大型AI模型浪潮中毅然扛起“国产”大旗,发布了可自由操控的“科大讯飞星火大模型”和首家国产计算平台制造商“飞星一号”。近年来,这种变革的力量变得更加强大。 2024年,“多语言智能语音关键技术及产业化”项目荣获国家科学技术进步奖一等奖,这是国家对技术贡献的最高认可。 2025年,科大讯飞基于积累的经验,发布了大数据cale深度传感模型“科大讯飞Spark X1”以及基于国家算力训练的升级版“x1.5”。尤其值得关注的是,X1.5模型在参数总数小于业界同类模型的情况下,整体性能达到国际领先水平(GPT-5)95%以上。它还将在数学等核心能力方面保持领先地位,为世界提供人工智能发展的“第二选择”。背后是科大讯飞对“无人区”的艰难探索:克服长链思维强化学习培训效率,从30%提升到84%以上;全球首个大型非自回归语音模型架构,实现识别成本降低520%。这些突破不仅挑战了技术极限,也形成了中国人工智能产业在全球科技竞争背景下自主可控的“压舱石”。请愿。赋能千行百业:实施人工智能技术的“中国方案”技术只有应用才能创造价值。科大讯飞深知这一点,将领先的人工智能能力转化为赋能经济社会高质量发展的“春雨”,同时悄然滋润万物。在教育领域,科大讯飞的教育产品已覆盖全国超过1.3亿师生。 Spark模型构建了超过4000个标签的错误原因系统,可以精准分析学生的学习缺陷,实现从作业精准批改到课堂精准指导的“时间级闭环”,深刻改变传统教学范式。在医疗领域,“智能医疗助手”已成为全国800多个区县基层医生的得力助手,累计提供超过11亿次的diaAI辅助诊断和治疗。意见建议,有效提高基础诊疗的规范性和准确性。 AI专科诊疗能力业内率先达到三级医院主任医师水平。此次发布的“智慧医疗助手医院版1.0”和AI个人健康助手“科大讯飞小医”正朝着“为每个AI健康助手、为每个人打造AI诊疗助手”的愿景迈进。人工智能在工业、金融、汽车等领域也大放异彩。工业场景下,基于大规模工业模型的解决方案助力高端制造、能源行业提质增效;金融领域,为200多家金融机构提供智能风控、智能客服等服务;在汽车领域,科大讯飞智能座舱系统已安装超过6800万辆汽车,海外解决方案合作伙伴23种外语版本,助力中国汽车品牌脱颖而出。赋能产业卡报告得到市场热烈反响。 2024年,科大讯飞大模型解决方案中标金额8.48亿元,位居行业第一。从C端AI学习机、智能办公笔记本连续斩获销售冠军,到B端与多家国企达成深度合作,科大讯飞的AI“火花”在万千行业燎原。探索前行:“中国温度”从“有用”到“懂你”科技的最终目的是服务于人。科大讯飞的探索从提高效率的“有用”转向体现情感的“懂你”。在2025年11月6日的全球1024开发者节上,人们看到了一个更加“温暖”的科大讯飞。智能座舱2.0可以通过超过2800点的记忆“记住”用户偏好,让汽车成为真正的“第三空间”;升级版智能办公笔记本k可以深度融入AI的会议记录中,使其更符合录音的套路。与集成软硬件的交互是Empathetic Digital Human Guide融入现实世界求爱技能的基础——连接其多模态:他可以实现多人、多语言对话,根据历史信息进行个人推荐,完成购买机票、预订酒店等任务。 “小飞”的绝佳交互体验来自于科大讯飞的远场麦克风和3D视觉在感知、多人主动交互、类人行为反馈、视觉听觉一体化理解、超拟人化数字人、个性化记忆、情感语义等八项技术能力上的突破。最动人的探索在于情感的联系。发布会亮相的“AI星友”声音高保真克隆和160多个人体模型。它不仅可以根据对话生成个性化记忆,还能在感受到用户需求时主动与用户互动,让科幻电影《她》中充满爱意的人机对话成为现实。这不仅是技术的展示,更是科大讯飞对AI未来形态的思考——AI不仅应该是一个伟大的工具,更应该成为一个能够理解、共情、促进心理健康和人类成长的伙伴。 Spark X1.5通过构建个人用户记忆库,实现对用户长期照片、近期评论、短期对话的全面理解,让AI真正“懂你”。此外,基于大规模的Spark语音模型,只需一句录音语句即可复制任意音色,一条指令即可打造任意风格的声音。 “个性化的kMemory容量和不断变化的声音再现是我们的核心技术。”科大讯飞技术总监告诉R电报员。 (记者王永安)