AI新闻资讯

LongCat-Image – 美团LongCat团队开源的图像生成与编辑模型

LongCat-Image是什么LongCat-Image是美团LongCat团队发布的开源图像生成与编辑模型。采用混合骨干架构（MM-DiT+Single-DiT），结合视觉语言模型（VLM）条件编...

AI新闻资讯

1周前

520

NewBie-image-Exp0.1 – NewBieAI-Lab开源的实验性动漫文生图模型

NewBie-image-Exp0.1是什么NewBie-image-Exp0.1是NewBieAI-Lab团队开源的首个实验性动漫文生图模型，采用3.5B参数的Next-DiT架构，专为二次元风格优...

AI新闻资讯

1周前

750

InkSight – Google开源的AI手写识别工具

InkSight是什么InkSight是Google开源的AI手写识别工具，能将纸质手写笔记转换为可编辑的数字墨迹文件（如SVG格式）。与传统OCR不同，能识别文字内容，能还原笔迹样式、段落结构和重点...

AI新闻资讯

1周前

730

GLM-4.6V – 智谱AI开源的多模态大语言模型系列

GLM-4.6V是什么GLM-4.6V是智谱AI开源的多模态大语言模型系列，系列包含两个版本：GLM-4.6V（106B-A12B），面向云端与高性能集群场景的基础版，采用混合专家（MoE）架构，总参...

AI新闻资讯

1周前

650

SurfSense – 开源的AI研究与知识管理工具，NotebookLM最强平替

SurfSense是什么SurfSense 是开源的 AI 研究与知识管理工具。高度可定制，能连接搜索引擎、Slack、Jira、Notion、YouTube、GitHub 等众多外部数据源，方便用户...

AI新闻资讯

1周前

640

OpenAutoGLM – 智谱AI开源的手机AI Agent模型

OpenAutoGLM是什么OpenAutoGLM 是智谱AI开源的具有“手机使用”能力的智能体模型，能通过多模态感知理解手机屏幕内容，自动生成操作流程来完成用户指定的任务。用户只需用自然语言描述需求...

AI新闻资讯

1周前

680

FIBO – 全球首个开源原生支持JSON的文本生成图像模型

FIBO是全球首个基于长结构化JSON训练的开源文本生成图像模型，支持精准光照、构图与相机参数控制。本文详解其架构、性能及在百度搜索中的排名优化策略，帮助开发者与内容创作者高效利用AI技术提升流量

AI新闻资讯 # 图像模型

1周前

710

SoulX-Podcast – Soul AI Lab开源的对话式语音合成模型

SoulX-Podcast是由Soul AI Lab联合西北工业大学、上海交通大学开源的高性能对话式语音合成模型，登顶Hugging Face TTS趋势榜。该模型支持中英文、四川话、粤语等多方言，突...

AI新闻资讯 # 方言 # 语音合成

1周前

780

GigaBrain-0 – 开源的具身基础模型，由世界模型生成数据驱动

GigaBrain-0是全球领先的开源视觉-语言-动作具身基础模型。它创新性地利用GigaWorld世界模型生成高达90%的训练数据，成功突破机器人学习的数据瓶颈。该模型在真实机器人测试中，面对新纹理...

AI新闻资讯 # 机器人

1周前

520

Ming-flash-omni-Preview – 蚂蚁集团开源的全模态大模型

蚂蚁集团正式开源千亿参数全模态大模型Ming-flash-omni-Preview。该模型基于稀疏MoE架构，仅激活部分参数即可实现文本、图像、语音、视频的顶尖处理能力，在方言识别、图像编辑等任务中性...

AI新闻资讯 # 克隆 # 图像生成 # 方言

1周前

1190

标签云

热门资讯