LongCat-Image – 美团LongCat团队开源的图像生成与编辑模型 LongCat-Image是什么LongCat-Image是美团LongCat团队发布的开源图像生成与编辑模型。采用混合骨干架构(MM-DiT+Single-DiT),结合视觉语言模型(VLM)条件编... AI新闻资讯 1周前520
NewBie-image-Exp0.1 – NewBieAI-Lab开源的实验性动漫文生图模型 NewBie-image-Exp0.1是什么NewBie-image-Exp0.1是NewBieAI-Lab团队开源的首个实验性动漫文生图模型,采用3.5B参数的Next-DiT架构,专为二次元风格优... AI新闻资讯 1周前750
InkSight – Google开源的AI手写识别工具 InkSight是什么InkSight是Google开源的AI手写识别工具,能将纸质手写笔记转换为可编辑的数字墨迹文件(如SVG格式)。与传统OCR不同,能识别文字内容,能还原笔迹样式、段落结构和重点... AI新闻资讯 1周前730
GLM-4.6V – 智谱AI开源的多模态大语言模型系列 GLM-4.6V是什么GLM-4.6V是智谱AI开源的多模态大语言模型系列,系列包含两个版本:GLM-4.6V(106B-A12B),面向云端与高性能集群场景的基础版,采用混合专家(MoE)架构,总参... AI新闻资讯 1周前650
SurfSense – 开源的AI研究与知识管理工具,NotebookLM最强平替 SurfSense是什么SurfSense 是开源的 AI 研究与知识管理工具。高度可定制,能连接搜索引擎、Slack、Jira、Notion、YouTube、GitHub 等众多外部数据源,方便用户... AI新闻资讯 1周前640
OpenAutoGLM – 智谱AI开源的手机AI Agent模型 OpenAutoGLM是什么OpenAutoGLM 是智谱AI开源的具有“手机使用”能力的智能体模型,能通过多模态感知理解手机屏幕内容,自动生成操作流程来完成用户指定的任务。用户只需用自然语言描述需求... AI新闻资讯 1周前680
FIBO – 全球首个开源原生支持JSON的文本生成图像模型 FIBO是全球首个基于长结构化JSON训练的开源文本生成图像模型,支持精准光照、构图与相机参数控制。本文详解其架构、性能及在百度搜索中的排名优化策略,帮助开发者与内容创作者高效利用AI技术提升流量 AI新闻资讯# 图像模型 1周前710
SoulX-Podcast – Soul AI Lab开源的对话式语音合成模型 SoulX-Podcast是由Soul AI Lab联合西北工业大学、上海交通大学开源的高性能对话式语音合成模型,登顶Hugging Face TTS趋势榜。该模型支持中英文、四川话、粤语等多方言,突... AI新闻资讯# 方言# 语音合成 1周前780
GigaBrain-0 – 开源的具身基础模型,由世界模型生成数据驱动 GigaBrain-0是全球领先的开源视觉-语言-动作具身基础模型。它创新性地利用GigaWorld世界模型生成高达90%的训练数据,成功突破机器人学习的数据瓶颈。该模型在真实机器人测试中,面对新纹理... AI新闻资讯# 机器人 1周前520
Ming-flash-omni-Preview – 蚂蚁集团开源的全模态大模型 蚂蚁集团正式开源千亿参数全模态大模型Ming-flash-omni-Preview。该模型基于稀疏MoE架构,仅激活部分参数即可实现文本、图像、语音、视频的顶尖处理能力,在方言识别、图像编辑等任务中性... AI新闻资讯# 克隆# 图像生成# 方言 1周前1190