昆仑万维旗下的天工AI再度传来震撼消息,其精心打造的天工大模型4.0的两个新版本——o1版与4o版,在网页端和APP端同步上线,迅速吸引了大量玩家的关注,这两款新版本不仅在逻辑推理能力上实现了质的飞跃,更在实时语音交互方面带来了前所未有的体验,让众多玩家直呼“太上头”!
天工大模型4.0的o1版,被命名为Skywork o1,它标志着国内首款中文逻辑推理o1模型的诞生,这款模型在推出之初,就以其强大的逻辑推理能力吸引了众多数学爱好者和竞赛选手的目光,据官方介绍,Skywork o1不仅在数学高考题、考研题以及奥数题上展现出了惊人的解题能力,更能在短时间内秒杀各类数学竞赛题目,在面对AIME数学竞赛题时,Skywork o1仅用不到两分钟的时间,就成功推导出了正确答案,其效率之高令人叹为观止。

不仅如此,Skywork o1在解决复杂逻辑题时,也展现出了逐步思考的能力,它不仅能够给出答案,还能进行自我反思,验证结果的准确性,这种能力在逻辑推理领域是极为罕见的,也正因为如此,Skywork o1才能够在众多模型中脱颖而出,成为备受瞩目的焦点。
而天工大模型4.0的4o版,则以其强大的实时语音交互能力赢得了玩家的喜爱,这款新版本加持的实时语音对话助手Skyo,不仅能够在短时间内快速识别和响应用户交互,还支持多语言对话,具备实时打断的能力,这种自然流畅的交互体验,让玩家仿佛在与一个真实的伙伴进行对话,极大地提升了游戏的趣味性和互动性。
据官方数据显示,Skyo在进行多轮对话时,表现出了极高的连贯性和逻辑性,无论是询问生活建议、规划旅行路线,还是探讨游戏策略、分享趣事,Skyo都能够给出恰当且富有情感的回应,这种类人化的交互体验,让玩家在游戏中感受到了前所未有的陪伴和乐趣。
值得一提的是,天工版o1与4o的同时上线,不仅为玩家带来了全新的游戏体验,更在业界引发了广泛的关注和讨论,这两款新版本的成功推出,不仅展示了昆仑万维在AI技术领域的深厚积累和创新实力,更推动了整个AIGC领域的快速发展。
Skywork o1之所以能够在逻辑推理任务上取得如此显著的成绩,离不开天工团队自研的三阶段训练方案,在推理训练阶段,团队通过自主研发的多智能体体系,构建出了高质量的分步推理、反思与验证数据,这些数据不仅提升了模型的训练效率,更为其后续的逻辑推理能力打下了坚实的基础。
在强化学习阶段,团队创新性地提出了一种适配分步推理强化的奖励模型——Skywork o1 Process Reward Model(PRM),这一模型的应用范围从原本侧重的数学和代码领域,拓展到了常识推理、逻辑推演和伦理决策等更广泛的场景中,团队还针对写作、闲聊等通用领域以及多轮对话构建了专门的训练数据,实现了全场景覆盖。
团队还重点提升了Skywork-PRM的模块化评估能力,特别是在处理o1风格思维链方面,优化了试错和反思验证机制,通过更细致的评估体系,为强化学习和搜索过程提供了更精准的奖励信号指导,这些创新性的举措,不仅显著提升了模型的逻辑推理能力,更为其在各类数学和代码基准测试中取得了优异成绩提供了有力保障。
而在推理的规划方面,团队通过自研的Q*线上推理算法以及模型的在线思考能力,实现了最优推理路径的寻找,Q*算法借鉴了人类大脑中“System 2”的思考方式,将LLM的多步推理过程抽象为一个启发式搜索问题,再通过Q*线上推理框架与模型在线思考的结合,实现了推理过程中的精细规划,进而指导LLM的解码过程,这一算法的成功落地,不仅显著提升了模型的线上推理能力,也标志着Q*算法的全球首次实现和公开。
天工版o1与4o的同时上线,不仅为玩家带来了全新的游戏体验,更在业界树立了新的标杆,这两款新版本的成功推出,不仅展示了昆仑万维在AI技术领域的深厚积累和创新实力,更推动了整个AIGC领域的快速发展。
据官方数据显示,天工版o1在GSM8k、MATH、OlympiadBench、AIME-24和AMC-23等标准数学基准测试中,性能显著优于常规通用大模型,表现仅次于o1-mini,而Skyo则在语音交互领域取得了突破性的进展,其快速响应、多语言对话以及实时打断的能力,让玩家在游戏中感受到了前所未有的自然交互体验。
用户认可数据方面,天工版o1与4o自上线以来,就受到了广大玩家的热烈欢迎和高度评价,众多玩家纷纷表示,这两款新版本不仅提升了游戏的趣味性和互动性,更让他们在游戏中感受到了前所未有的陪伴和乐趣,一些玩家甚至表示,他们已经将天工AI作为了自己日常生活中不可或缺的伙伴和助手。
天工版o1与4o的同时上线,不仅为玩家带来了全新的游戏体验,更在业界树立了新的标杆,这两款新版本的成功推出,不仅展示了昆仑万维在AI技术领域的深厚积累和创新实力,更推动了整个AIGC领域的快速发展,我们有理由相信,在未来的日子里,天工AI将继续引领潮流,为玩家带来更多惊喜和乐趣。