FG-CLIP 2 – 360开源的双语细粒度视觉语言对齐模型 FG-CLIP 2是什么 FG-CLIP 2是360推出的开源双语细粒度视觉语言对齐模型,专为解决视觉与语言的精准对齐问题而设计。在视觉语言理解领域取得了重大突破,尤其在中英文双语任务上表现出色。模型... AI新闻资讯# AI工具 1个月前1120
讯飞输入法 – 科大讯飞推出的AI输入工具 讯飞输入法是什么 讯飞输入法是科大讯飞推出的智能输入工具,具备高精度语音识别和多样化输入方式。支持语音、拼音、手写等多种输入模式,语音输入准确率高,支持多种方言和中英混合输入,方便不同用户群体使用。手... AI新闻资讯# AI工具# 讯飞# 讯飞输入法 3周前1110
Next Music – AI音乐创作平台,一键生成原创音乐和歌词 Next Music是什么 Next Music 是创新的AI音乐创作平台,能帮助用户快速生成原创音乐和歌词。用户只需描述歌曲的风格和主题,平台能在短时间内生成完整的歌曲。平台支持选择音色性别、自定义... AI新闻资讯# AI工具 4周前1110
被质疑“饥饿营销+套壳炒作”,Manus合伙人张涛回应 DeepSeek之后,又一款国产ai成功出圈。 3月6日凌晨,中国AI团队Monica宣布推出全球首款通用型AI智能体产品Manus。据悉,Manus在GAIA基准测试中取得了SOTA(State-o... AI新闻资讯 1个月前1110
AI作曲新突破!SongBloom开源:腾讯联合港中大、南京大学发布歌曲生成大模型 腾讯联合香港中文大学、南京大学正式开源歌曲生成大模型SongBloom。该模型在旋律创作、歌词适配方面取得新进展,提供免费在线试听与体验,为音乐创作者与AIGC开发者提供强大的开源工具。立即了解其技术... AI新闻资讯# AI音乐# 歌曲# 腾讯 2周前1100
Depth Anything 3 – 字节跳动推出的视觉空间重建模型 Depth Anything 3是什么 Depth Anything 3(DA3)是字节跳动Seed团队推出的视觉空间重建模型,通过单一Transformer架构实现从任意视角的视觉输入中恢复三维空间... AI新闻资讯# AI工具# 字节跳动# 机器人导航 3周前1100
StepAudio R1 – 阶跃星辰开源的原生音频推理模型 StepAudio R1是什么 StepAudio R1 是阶跃星辰团队推出的全球首个开源原生音频推理模型。模型通过创新的模态锚定推理蒸馏(MGRD)框架,解决了传统音频模型在复杂推理中性能下降的问题... AI新闻资讯# AI工具# StepAudio# 情感分析 3周前1100
HunyuanVideo 1.5 – 腾讯混元开源的轻量级视频生成模型 HunyuanVideo 1.5是什么 HunyuanVideo 1.5 是腾讯混元团队开源的轻量级视频生成模型,参数规模为8.3B。模型基于Diffusion Transformer架构,支持通过文... AI新闻资讯# AI工具 4周前1100
Tbox AI 浏览器 – 为内容创作和知识管理设计的AI浏览器 Tbox AI 浏览器是什么 Tbox AI 浏览器是为创作者和知识工作者设计的智能浏览器。Tbox AI 浏览器以 AI 技术为核心,将内容创作与知识管理深度融合,通过智能辅助功能,帮助用户高效生成... AI新闻资讯# AI工具# AI浏览器# 浏览器 3周前1090
Omnilingual ASR – Meta AI推出的自动语音识别系统 Omnilingual ASR是什么 Omnilingual ASR 是 Meta AI 推出的自动语音识别系统,支持超过1600种语言,包括500种低资源语言。Omnilingual ASR通过扩展... AI新闻资讯# AI工具 4周前1090