SWE-1.5 – Cognition 推出的高性能AI编程模型

SWE-1.5是什么

SWE-1.5 是AI独角兽 Cognition 推出的专为软件工程设计的高性能 AI 编程模型。拥有数百亿参数，具备接近最先进水平的编码能力，同时在速度上取得重大突破，推理速度高达 950 token/秒，比 Haiku 4.5 快 6 倍，比 Sonnet 4.5 快 13 倍，目前已在 Windsurf 代码编辑器中上线。模型通过与 Cerebras 合作，优化了整个系统，包括模型、推理和代理框架，以实现速度和智能的统一。在开发过程中，Cognition 采用了端到端的强化学习，结合高保真的编码环境和自定义的评估机制，确保模型在真实任务中的表现。SWE-1.5 引入了“奖励硬化”技术，通过人类专家的测试来提高模型的鲁棒性。

SWE-1.5的主要功能

代码生成与优化：快速生成高质量代码，支持多种语言，还能提供代码优化建议，提升性能和质量。
编程协作与交互：支持多轮交互式编程，便于团队协作，提高开发效率。
代码理解和分析：深入理解代码语义，保持长代码序列的连贯性，能分析代码并诊断问题。
编程环境集成：已在 Windsurf 编辑器中开放使用，且支持与其他开发工具集成，方便在完整开发流程中使用。
自定义与适应性：可定制开发，适应不同项目需求和任务，融入现有开发环境。

SWE-1.5的技术原理

高速推理与硬件合作：与 Cerebras 合作，利用其先进的硬件技术，实现高达 950 token/秒的推理速度，大幅提升了模型的响应效率。
超大规模数据集成：整合了 200 个精心筛选的数据集，构建了近乎全景式的编程知识图谱，使模型具备跨领域、跨语言的泛化潜力。
上下文感知架构：能在长代码序列中保持语义连贯性，支持多轮交互式编程协作，确保代码生成的逻辑性和一致性。
动态反馈机制：在训练中引入动态反馈机制，模拟真实开发者的行为路径，提升代码生成的实用性和可读性。
强化学习训练：采用端到端的强化学习，在真实的编码环境中进行训练，利用自定义的级联代理框架和强大的基础设施，通过数千个 GB200 NVL72 芯片进行训练，优化模型的性能和适应性。