Handy – 开源的语音转文字桌面应用,完全离线 Handy是什么 Handy 是开源的语音转文字桌面应用,完全离线运行,支持 Windows、macOS 和 Linux 系统。由 Rust 和 React/TypeScript 构建,界面简洁,操作... AI新闻资讯# AI工具 2周前0520
GLM-4.6 – 智谱推出的最新旗舰模型,最强Coding模型 GLM-4.6是什么 GLM-4.6 是智谱推出的新一代基座大模型,总参数量达 355B,激活参数 32B。模型在真实编程、长上下文处理、推理能力、信息搜索、写作能力及智能体应用等方面实现全面进阶。代... AI新闻资讯# AI工具 2周前0510
SongBloom – 腾讯AI Lab推出的全长度歌曲生成模型 SongBloom是什么 SongBloom 是腾讯 AI Lab 开发的全长度歌曲生成框架,结合了自回归草图绘制和基于扩散的细化技术,通过交错生成范式(Interleaved Generation... AI笔记# AI工具 4周前0500
混元图像3.0 – 腾讯开源的原生多模态图像生成模型 混元图像3.0是什么 混元图像3.0(HunyuanImage 3.0)是腾讯发布并开源的原生多模态图像生成模型。模型参数规模达80B,是目前测评效果最好、参数量最大的开源生图模型。具备原生多模态能力... AI新闻资讯# AI工具 6天前0490
JoySafety – 京东开源的大模型安全框架 JoySafety是什么 JoySafety 是京东开源的大模型安全框架,为企业提供成熟、可靠、免费的大模型安全防护方案。模型基于多种原子能力模块(如 BERT、FastText、Transforme... AI新闻资讯# AI工具 2周前0490
StableAvatar – 复旦推出的音频驱动视频生成模型 StableAvatar是什么 StableAvatar 是复旦大学、微软亚洲研究院等推出的创新音频驱动虚拟形象视频生成模型。模型通过端到端的视频扩散变换器,结合时间步感知音频适配器、音频原生引导机制... AI新闻资讯# AI工具 6天前0480
FG-CLIP 2 – 360开源的双语细粒度视觉语言对齐模型 FG-CLIP 2是什么 FG-CLIP 2是360推出的开源双语细粒度视觉语言对齐模型,专为解决视觉与语言的精准对齐问题而设计。在视觉语言理解领域取得了重大突破,尤其在中英文双语任务上表现出色。模型... AI新闻资讯# AI工具 2周前0470
Mano – 明略科技推出的GUI智能操作模型 Mano是什么 Mano 是明略科技推出的专有大模型,专注于图形用户界面(GUI)智能操作。模型基于多模态基础模型,通过在线强化学习和训练数据自动采集等创新技术,在 Mind2Web 和 OSWorl... AI新闻资讯# AI工具 2周前0450
Tinker API – Thinking Machines Lab推出的模型微调API Tinker API是什么 Tinker API 是 Thinking Machines Lab 发布的首款产品,专为语言模型微调而设计。简化语言模型的微调流程,让研究人员和开发者能专注于算法和数据... AI新闻资讯# AI工具 2周前0440
NavFoM – 银河通用推出的环视导航基座大模型 NavFoM是什么 NavFoM(Navigation Foundation Model)是银河通用联合北京大学、阿德莱德大学、浙江大学等团队发布的全球首个跨本体全域环视导航基座大模型。具备全场景支持... AI新闻资讯# AI工具 2周前0370