VibeVoice-Realtime – 微软开源的轻量级实时文本转语音模型 VibeVoice-Realtime是什么VibeVoice-Realtime 是微软开源的轻量级实时文本转语音(TTS)模型,专为低延迟和实时交互设计。支持流式文本输入,从第一个文本 token 开... AI新闻资讯 2周前660
SurfSense – 开源的AI研究与知识管理工具,NotebookLM最强平替 SurfSense是什么SurfSense 是开源的 AI 研究与知识管理工具。高度可定制,能连接搜索引擎、Slack、Jira、Notion、YouTube、GitHub 等众多外部数据源,方便用户... AI新闻资讯 2周前640
NocoBase – 免费开源的AI无代码开发平台,可视化构建应用 NocoBase是什么NocoBase是基于AI驱动的开源无代码开发平台,支持快速搭建业务系统,无需编程即可通过配置完成应用开发。项目采用Apache-2.0协议,提供私有化部署和灵活扩展能力,适用于... AI新闻资讯 2周前640
LazyCraft – 开源AI Agent应用开发与管理平台,基于LazyLLM构建 LazyCraft是什么LazyCraft 是商汤基于开源框架 LazyLLM 构建的开源 AI Agent 应用开发与管理平台,为企业和开发者提供一站式AI应用开发解决方案。帮助开发者以低门槛、低成... AI新闻资讯 2周前640
InfinityStar – 字节开源的统一时空自回归视频生成框架 InfinityStar是什么InfinityStar是字节跳动开源的统一时空自回归框架,专为高分辨率图像和视频生成设计。采用离散自回归方法,能在单一模型中同时处理文本到图像、文本到视频、图像到视频等... AI新闻资讯 2周前640
FLUX.2 – 黑森林开源的图像生成与编辑模型 FLUX.2是由黑森林团队开源的高性能图像生成与编辑模型,支持用户免费进行AI绘画、智能修图及高清图像创作。该模型集成了先进的生成算法与编辑功能,适用于艺术设计、内容创作、学术研究等多个领域,助力用户... AI新闻资讯# 图像生成# 文生图 2周前640
阶跃星辰GELab-Zero正式开源:端侧4B多模态GUI Agent模型,刷新多项SOTA,实现消费级硬件本地推理 阶跃星辰重磅开源GELab-Zero套组及4B GUI Agent预览模型,在ScreenSpot、OSWorld等多项权威基准测试中全面刷新性能纪录,取得同尺寸SOTA成绩。该模型专为端侧部署设计... AI新闻资讯# 一键部署# 轻量化 2周前640
Handy – 开源免费的本地AI语音转文字工具 Handy是什么Handy是开源免费的本地语音转文字工具,支持Windows、MacOS和Linux系统,由Rust和React开发。通过本地处理语音数据,无需上传云端,保障隐私安全,适合快速转录和文... AI新闻资讯 2周前630
Egocentric-10K – Build AI开源的第一人称视角机器人数据集 Egocentric-10K是什么Egocentric-10K 是大规模的第一人称视角(egocentric)工厂操作视频数据集,由 build.ai 团队开源。数据集包含 10,000 小时的视频... AI新闻资讯 2周前630
字节跳动Vidi2模型重磅发布:120亿参数实现精准视频时空定位,革新多模态AI理解与编辑 字节跳动最新开源的多模态视频大模型Vidi2,凭借120亿参数与创新的精细时空定位(STG)技术,能精准识别并定位视频中的对象与动作-9。它不仅彻底改变了从文字到视频的搜索方式,让视频内容可直接被“问... AI新闻资讯 2周前630