AI新闻资讯

FG-CLIP 2 – 360开源的双语细粒度视觉语言对齐模型

FG-CLIP 2是什么 FG-CLIP 2是360推出的开源双语细粒度视觉语言对齐模型，专为解决视觉与语言的精准对齐问题而设计。在视觉语言理解领域取得了重大突破，尤其在中英文双语任务上表现出色。模型...

AI新闻资讯 # AI工具

1个月前

1120

讯飞输入法 – 科大讯飞推出的AI输入工具

讯飞输入法是什么讯飞输入法是科大讯飞推出的智能输入工具，具备高精度语音识别和多样化输入方式。支持语音、拼音、手写等多种输入模式，语音输入准确率高，支持多种方言和中英混合输入，方便不同用户群体使用。手...

AI新闻资讯 # AI工具 # 讯飞 # 讯飞输入法

3周前

1110

Next Music – AI音乐创作平台，一键生成原创音乐和歌词

Next Music是什么 Next Music 是创新的AI音乐创作平台，能帮助用户快速生成原创音乐和歌词。用户只需描述歌曲的风格和主题，平台能在短时间内生成完整的歌曲。平台支持选择音色性别、自定义...

AI新闻资讯 # AI工具

4周前

1110

被质疑“饥饿营销+套壳炒作”，Manus合伙人张涛回应

DeepSeek之后，又一款国产ai成功出圈。 3月6日凌晨，中国AI团队Monica宣布推出全球首款通用型AI智能体产品Manus。据悉，Manus在GAIA基准测试中取得了SOTA（State-o...

AI新闻资讯

1个月前

1110

AI作曲新突破！SongBloom开源：腾讯联合港中大、南京大学发布歌曲生成大模型

腾讯联合香港中文大学、南京大学正式开源歌曲生成大模型SongBloom。该模型在旋律创作、歌词适配方面取得新进展，提供免费在线试听与体验，为音乐创作者与AIGC开发者提供强大的开源工具。立即了解其技术...

AI新闻资讯 # AI音乐 # 歌曲 # 腾讯

2周前

1100

Depth Anything 3 – 字节跳动推出的视觉空间重建模型

Depth Anything 3是什么 Depth Anything 3（DA3）是字节跳动Seed团队推出的视觉空间重建模型，通过单一Transformer架构实现从任意视角的视觉输入中恢复三维空间...

AI新闻资讯 # AI工具 # 字节跳动 # 机器人导航

3周前

1100

StepAudio R1 – 阶跃星辰开源的原生音频推理模型

StepAudio R1是什么 StepAudio R1 是阶跃星辰团队推出的全球首个开源原生音频推理模型。模型通过创新的模态锚定推理蒸馏（MGRD）框架，解决了传统音频模型在复杂推理中性能下降的问题...

AI新闻资讯 # AI工具 # StepAudio # 情感分析

3周前

1100

HunyuanVideo 1.5 – 腾讯混元开源的轻量级视频生成模型

HunyuanVideo 1.5是什么 HunyuanVideo 1.5 是腾讯混元团队开源的轻量级视频生成模型，参数规模为8.3B。模型基于Diffusion Transformer架构，支持通过文...

AI新闻资讯 # AI工具

4周前

1100

Tbox AI 浏览器 – 为内容创作和知识管理设计的AI浏览器

Tbox AI 浏览器是什么 Tbox AI 浏览器是为创作者和知识工作者设计的智能浏览器。Tbox AI 浏览器以 AI 技术为核心，将内容创作与知识管理深度融合，通过智能辅助功能，帮助用户高效生成...

AI新闻资讯 # AI工具 # AI浏览器 # 浏览器

3周前

1090

Omnilingual ASR – Meta AI推出的自动语音识别系统

Omnilingual ASR是什么 Omnilingual ASR 是 Meta AI 推出的自动语音识别系统，支持超过1600种语言，包括500种低资源语言。Omnilingual ASR通过扩展...

AI新闻资讯 # AI工具

4周前

1090

标签云

热门资讯