LongCat-Flash-Omni – 美团开源的全模态大语言模型 LongCat-Flash-Omni是什么LongCat-Flash-Omni 是美团 LongCat 团队发布的开源全模态大语言模型。拥有5600亿参数规模(激活参数270亿),在保持庞大参数量的同... AI新闻资讯 2周前610
MemOS – 开源的AI记忆管理平台,支持多种记忆类型 MemOS是什么 MemOS 是开源的 AI 记忆管理操作系统,能为智能体和 AI 应用提供长期记忆能力。MemOS通过统一的记忆抽象层,支持多种记忆类型(如文本记忆、激活记忆、参数记忆),具备动态知... AI新闻资讯# AI工具 4周前610
DeepOCR – 基于DeepSeek-OCR模型的开源复刻项目 DeepOCR是什么DeepOCR 是开源复刻项目,实现 DeepSeek-OCR 的核心架构,通过光学压缩技术高效处理文本信息。核心是 DeepEncoder,由 SAM-base(处理高分辨率图像... AI新闻资讯 2周前580
Step-Audio-EditX – 阶跃星辰开源的首个LLM级音频编辑大模型 Step-Audio-EditX是什么Step-Audio-EditX是开源的音频编辑大模型,由阶跃星辰团队研发,专注于通过人工智能技术实现音频内容的精细操控。模型能动态调整音频的情绪、说话风格(如撒... AI新闻资讯 2周前570
LongCat-Image – 美团LongCat团队开源的图像生成与编辑模型 LongCat-Image是什么LongCat-Image是美团LongCat团队发布的开源图像生成与编辑模型。采用混合骨干架构(MM-DiT+Single-DiT),结合视觉语言模型(VLM)条件编... AI新闻资讯 2周前520
GigaBrain-0 – 开源的具身基础模型,由世界模型生成数据驱动 GigaBrain-0是全球领先的开源视觉-语言-动作具身基础模型。它创新性地利用GigaWorld世界模型生成高达90%的训练数据,成功突破机器人学习的数据瓶颈。该模型在真实机器人测试中,面对新纹理... AI新闻资讯# 机器人 2周前520
DeepSeek-Math-V2:全球首个开源IMO金牌数学大模型,定义自验证推理新范式 DeepSeek-Math-V2是DeepSeek最新发布的开源数学推理模型,首次实现国际数学奥林匹克竞赛(IMO)金牌水平并全面开源。该模型基于自验证训练框架,通过LLM验证器与生成器的协同优化,在... AI新闻资讯# deepseek# 数学 2周前470
ViMax – 香港大学开源多智能体视频生成框架,赋能高效AI视频创作与自动生成技术 ViMax 是香港大学推出的开源多智能体视频生成框架,致力于通过协同AI智能体技术,实现高效、自动化的视频内容生成。该框架结合先进的神经网络与多智能体协作机制,为视频创作、动态内容合成及AI视觉生成提... AI新闻资讯# 图生视频# 小说转视频# 视频生成 2周前450