ROCK:深度解析阿里巴巴开源的智能体训练环境沙箱——强化学习与多模态AI开发实战平台 ROCK是阿里巴巴开源的高效智能体训练环境沙箱,专注于强化学习与多模态AI开发。该平台提供安全可控的仿真环境,支持智能体决策训练、多任务学习与虚实结合实验,助力研究者和开发者构建更智能的AI系统。结合... AI新闻资讯# 智能体# 阿里巴巴 2周前690
SAIL-VL2 – 字节跳动开源的多模态视觉语言模型 SAIL-VL2是什么SAIL-VL2是字节跳动团队开源的多模态视觉语言模型,专注于图像、文本等多模态输入的联合建模。采用稀疏混合专家(MoE)架构和渐进式训练策略,在2B至8B参数规模下实现了高性能... AI新闻资讯 2周前680
OpenAutoGLM – 智谱AI开源的手机AI Agent模型 OpenAutoGLM是什么OpenAutoGLM 是智谱AI开源的具有“手机使用”能力的智能体模型,能通过多模态感知理解手机屏幕内容,自动生成操作流程来完成用户指定的任务。用户只需用自然语言描述需求... AI新闻资讯 2周前680
ChatTutor – 开源的AI教学辅助工具,可视化互动学习 ChatTutor是什么ChatTutor是开源的AI教学辅助工具,专注于STEM学科的可视化互动学习。通过多智能体架构实现对话式答疑和动态绘图功能,能在电子白板上实时绘制数学图形、物理电路或思维导图... AI新闻资讯 2周前680
Alpamayo-R1 – 英伟达开源的带推理能力的视觉-语言-行动模型 英伟达(NVIDIA)于2025年12月正式开源其最新的视觉-语言-行动(VLA)模型——Alpamayo-R1。该模型是全球首个专注于自动驾驶场景并开源的VLA大模型,旨在通过引入“因果链”推理能力... AI新闻资讯# 智能交通# 自动驾驶# 英伟达 2周前680
DPAI Arena – JetBrains开源的AI编程基准测试平台 DPAI Arena是什么DPAI Arena(Developer Productivity AI Arena)是JetBrains创建的开放基准测试平台,衡量AI辅助开发工具在真实世界软件工程任务中... AI新闻资讯 2周前670
WithAnyone – 复旦联合阶跃星辰开源的AI合照生成模型 WithAnyone是什么WithAnyone 是复旦大学和阶跃星辰联合开发的 AI 合照生成模型,解决传统 AI 图像生成中常见的“复制粘贴”问题,实现更自然、可控的多人图像生成。模型通过大规模数据... AI新闻资讯 2周前670
Paper2Video – 新加坡国立开源的学术论文自动生成演示视频项目 Paper2Video是什么Paper2Video 是新加坡国立大学 Show Lab 开源的学术论文自动生成演示视频项目。通过 PaperTalker 多智能体框架,将论文转化为包含幻灯片、字幕、语... AI新闻资讯 2周前660
GLM-4.6V – 智谱AI开源的多模态大语言模型系列 GLM-4.6V是什么GLM-4.6V是智谱AI开源的多模态大语言模型系列,系列包含两个版本:GLM-4.6V(106B-A12B),面向云端与高性能集群场景的基础版,采用混合专家(MoE)架构,总参... AI新闻资讯 2周前660
Open-o3 Video – 北大联合字节开源的视频推理模型 Open-o3 Video是什么Open-o3 Video 是北京大学和字节跳动联合开发的开源视频推理模型,专注于通过时间和空间证据增强视频推理能力。通过明确标注关键证据的时间戳和边界框,帮助模型更好... AI新闻资讯 2周前660