AI新闻资讯

ROCK：深度解析阿里巴巴开源的智能体训练环境沙箱——强化学习与多模态AI开发实战平台

ROCK是阿里巴巴开源的高效智能体训练环境沙箱，专注于强化学习与多模态AI开发。该平台提供安全可控的仿真环境，支持智能体决策训练、多任务学习与虚实结合实验，助力研究者和开发者构建更智能的AI系统。结合...

AI新闻资讯 # 智能体 # 阿里巴巴

2周前

690

SAIL-VL2 – 字节跳动开源的多模态视觉语言模型

SAIL-VL2是什么SAIL-VL2是字节跳动团队开源的多模态视觉语言模型，专注于图像、文本等多模态输入的联合建模。采用稀疏混合专家（MoE）架构和渐进式训练策略，在2B至8B参数规模下实现了高性能...

AI新闻资讯

2周前

680

OpenAutoGLM – 智谱AI开源的手机AI Agent模型

OpenAutoGLM是什么OpenAutoGLM 是智谱AI开源的具有“手机使用”能力的智能体模型，能通过多模态感知理解手机屏幕内容，自动生成操作流程来完成用户指定的任务。用户只需用自然语言描述需求...

AI新闻资讯

2周前

680

ChatTutor – 开源的AI教学辅助工具，可视化互动学习

ChatTutor是什么ChatTutor是开源的AI教学辅助工具，专注于STEM学科的可视化互动学习。通过多智能体架构实现对话式答疑和动态绘图功能，能在电子白板上实时绘制数学图形、物理电路或思维导图...

AI新闻资讯

2周前

680

Alpamayo-R1 – 英伟达开源的带推理能力的视觉-语言-行动模型

英伟达（NVIDIA）于2025年12月正式开源其最新的视觉-语言-行动（VLA）模型——Alpamayo-R1。该模型是全球首个专注于自动驾驶场景并开源的VLA大模型，旨在通过引入“因果链”推理能力...

AI新闻资讯 # 智能交通 # 自动驾驶 # 英伟达

2周前

680

DPAI Arena – JetBrains开源的AI编程基准测试平台

DPAI Arena是什么DPAI Arena（Developer Productivity AI Arena）是JetBrains创建的开放基准测试平台，衡量AI辅助开发工具在真实世界软件工程任务中...

AI新闻资讯

2周前

670

WithAnyone – 复旦联合阶跃星辰开源的AI合照生成模型

WithAnyone是什么WithAnyone 是复旦大学和阶跃星辰联合开发的 AI 合照生成模型，解决传统 AI 图像生成中常见的“复制粘贴”问题，实现更自然、可控的多人图像生成。模型通过大规模数据...

AI新闻资讯

2周前

670

Paper2Video – 新加坡国立开源的学术论文自动生成演示视频项目

Paper2Video是什么Paper2Video 是新加坡国立大学 Show Lab 开源的学术论文自动生成演示视频项目。通过 PaperTalker 多智能体框架，将论文转化为包含幻灯片、字幕、语...

AI新闻资讯

2周前

660

GLM-4.6V – 智谱AI开源的多模态大语言模型系列

GLM-4.6V是什么GLM-4.6V是智谱AI开源的多模态大语言模型系列，系列包含两个版本：GLM-4.6V（106B-A12B），面向云端与高性能集群场景的基础版，采用混合专家（MoE）架构，总参...

AI新闻资讯

2周前

660

Open-o3 Video – 北大联合字节开源的视频推理模型

Open-o3 Video是什么Open-o3 Video 是北京大学和字节跳动联合开发的开源视频推理模型，专注于通过时间和空间证据增强视频推理能力。通过明确标注关键证据的时间戳和边界框，帮助模型更好...

AI新闻资讯

2周前

660

标签云

热门资讯