AI新闻资讯

VibeVoice-Realtime – 微软开源的轻量级实时文本转语音模型

VibeVoice-Realtime是什么VibeVoice-Realtime 是微软开源的轻量级实时文本转语音（TTS）模型，专为低延迟和实时交互设计。支持流式文本输入，从第一个文本 token 开...

AI新闻资讯

2周前

660

SurfSense – 开源的AI研究与知识管理工具，NotebookLM最强平替

SurfSense是什么SurfSense 是开源的 AI 研究与知识管理工具。高度可定制，能连接搜索引擎、Slack、Jira、Notion、YouTube、GitHub 等众多外部数据源，方便用户...

AI新闻资讯

2周前

640

NocoBase – 免费开源的AI无代码开发平台，可视化构建应用

NocoBase是什么NocoBase是基于AI驱动的开源无代码开发平台，支持快速搭建业务系统，无需编程即可通过配置完成应用开发。项目采用Apache-2.0协议，提供私有化部署和灵活扩展能力，适用于...

AI新闻资讯

2周前

640

LazyCraft – 开源AI Agent应用开发与管理平台，基于LazyLLM构建

LazyCraft是什么LazyCraft 是商汤基于开源框架 LazyLLM 构建的开源 AI Agent 应用开发与管理平台，为企业和开发者提供一站式AI应用开发解决方案。帮助开发者以低门槛、低成...

AI新闻资讯

2周前

640

InfinityStar – 字节开源的统一时空自回归视频生成框架

InfinityStar是什么InfinityStar是字节跳动开源的统一时空自回归框架，专为高分辨率图像和视频生成设计。采用离散自回归方法，能在单一模型中同时处理文本到图像、文本到视频、图像到视频等...

AI新闻资讯

2周前

640

FLUX.2 – 黑森林开源的图像生成与编辑模型

FLUX.2是由黑森林团队开源的高性能图像生成与编辑模型，支持用户免费进行AI绘画、智能修图及高清图像创作。该模型集成了先进的生成算法与编辑功能，适用于艺术设计、内容创作、学术研究等多个领域，助力用户...

AI新闻资讯 # 图像生成 # 文生图

2周前

640

阶跃星辰GELab-Zero正式开源：端侧4B多模态GUI Agent模型，刷新多项SOTA，实现消费级硬件本地推理

阶跃星辰重磅开源GELab-Zero套组及4B GUI Agent预览模型，在ScreenSpot、OSWorld等多项权威基准测试中全面刷新性能纪录，取得同尺寸SOTA成绩。该模型专为端侧部署设计...

AI新闻资讯 # 一键部署 # 轻量化

2周前

640

Handy – 开源免费的本地AI语音转文字工具

Handy是什么Handy是开源免费的本地语音转文字工具，支持Windows、MacOS和Linux系统，由Rust和React开发。通过本地处理语音数据，无需上传云端，保障隐私安全，适合快速转录和文...

AI新闻资讯

2周前

630

Egocentric-10K – Build AI开源的第一人称视角机器人数据集

Egocentric-10K是什么Egocentric-10K 是大规模的第一人称视角（egocentric）工厂操作视频数据集，由 build.ai 团队开源。数据集包含 10,000 小时的视频...

AI新闻资讯

2周前

630

字节跳动Vidi2模型重磅发布：120亿参数实现精准视频时空定位，革新多模态AI理解与编辑

字节跳动最新开源的多模态视频大模型Vidi2，凭借120亿参数与创新的精细时空定位（STG）技术，能精准识别并定位视频中的对象与动作-9。它不仅彻底改变了从文字到视频的搜索方式，让视频内容可直接被“问...

AI新闻资讯

2周前

630

标签云

热门资讯