GigaBrain-0 – 开源VLA具身模型,基于世界模型生成的数据 GigaBrain-0是什么 GigaBrain-0 是新型的视觉-语言-行动(VLA)基础模型,由世界模型生成的数据驱动。模型通过大规模生成多样化数据,减少了对真实机器人数据的依赖,显著提升了跨任务... AI笔记# AI工具 3天前0430
Remy – AI 3D模型生成应用,支持360度自由环视 Remy是什么 Remy 是Kiri Innovations公司推出的基于3D高斯溅射技术的空间记录应用,用户可通过手机拍摄视频快速生成逼真的3D场景。应用随华为鸿蒙OS 6系统发布,上线后迅速登顶鸿... AI笔记# AI工具 3天前0390
Glyph – 智谱联合清华开源的视觉文本压缩框架 Glyph是什么 Glyph 是智谱联合清华大学 CoAI 实验室开源的创新框架,能通过视觉 – 文本压缩解决大语言模型(LLM)上下文过长的问题。框架将长文本渲染为图像,用视觉语言模型(VLM)处理... AI笔记# AI工具 3天前0460
Agent HQ – GitHub推出的集成AI智能体平台 Agent HQ是什么 Agent HQ是GitHub推出的集成AI智能体的创新平台,将各种AI工具无缝融入开发者的工作流中。通过Mission Control提供统一的指挥中心,让开发者可以在Git... AI笔记# AI工具 3天前0340
FlowithOS – Flowith推出的全球首个智能体操作系统 FlowithOS是什么 FlowithOS是Flowith推出的全球首个智能体操作系统,使其能像人类一样与数字世界互动。FlowithOS具备浏览器、终端和脚本使用功能,能自动执行复杂任务,如文件管... AI笔记# AI工具 3天前0360
SoulX-Podcast – Soul推出的多说话人语音合成模型 SoulX-Podcast是什么 SoulX-Podcast 是 Soul AI Lab 推出的多说话人文本到语音(TTS)模型,专为生成长篇播客对话设计。模型参数为1.7B,支持普通话、英语及多种汉... AI笔记# AI工具 3天前0490
在哪儿问问 – 滴滴推出的AI图寻应用 在哪儿问问是什么 在哪儿问问是滴滴推出的AI图寻小程序,用户可通过上传照片,让AI识别照片中的地点,获取其大致位置。提供地点查找功能,能推荐相似地点及照片中的相关产品,兼具实用性和探索性。例如,上传地... AI笔记# AI工具 3天前0400
SciToolAgent – 浙大开源知识图谱驱动的科学领域Agent SciToolAgent是什么 SciToolAgent是浙江大学创新中心(HICAI-ZJU)开发的开源工具平台,提升科研效率。整合了500多种科学工具,覆盖生物学、化学、材料科学等多领域,可处理数... AI笔记# AI工具 3天前0560
FireRedChat – 小红书推出的全双工语音交互系统 FireRedChat是什么 FireRedChat 是小红书智创音频团队开发的全双工语音交互系统,具有实时双向对话能力,支持可控打断功能。采用模块化设计,包括转录控制模块、交互模块和对话管理器等,支... AI笔记# AI工具 3天前0350
Meta ARE – Meta推出的AI Agent动态环境评估平台 Meta ARE是什么 Meta ARE(Agents Research Environments)是Meta推出的用在训练和评估AI Agents的动态模拟研究平台。平台通过创建随时间演变的环境,模... AI笔记# AI工具 4天前0540