FLUX.2 – 黑森林开源的图像生成与编辑模型 FLUX.2是由黑森林团队开源的高性能图像生成与编辑模型,支持用户免费进行AI绘画、智能修图及高清图像创作。该模型集成了先进的生成算法与编辑功能,适用于艺术设计、内容创作、学术研究等多个领域,助力用户... AI新闻资讯# 图像生成# 文生图 2周前620
Fara-7B – 微软开源的计算机操作Agent助手模型 微软最新开源的Fara-7B是一款专为计算机操作设计的AI Agent助手模型,具备强大的自动化任务执行能力。该模型能够理解自然语言指令,自主操作电脑完成各类任务,如信息检索、软件控制、文件管理等,大... AI新闻资讯# 大模型# 微软 2周前970
HunyuanOCR – 腾讯混元开源的光学字符识别专家模型 腾讯混元开源的 HunyuanOCR 是一款专业级光学字符识别模型,具备高精度文字检测与识别能力,支持多场景、多语言文档图像处理。该模型基于深度学习技术优化,适用于文档数字化、自然场景文字提取、表格识... AI新闻资讯# 文字检测# 腾讯混元# 视频字幕 2周前870
Supertonic – 开源的高性能AI 文本转语音系统,极速离线运行 Supertonic是一款基于开源技术的高性能AI文本转语音系统,支持极速离线运行,无需网络连接即可生成流畅自然的语音。系统采用先进的深度学习模型,提供媲美真人发音的高质量语音输出,支持多语言及声音定... AI新闻资讯# TTS# 文本转语音# 语音克隆 2周前810
小米开源MiMo-Embodied:跨领域具身智能基座模型全面解读|关键技术解析与应用前景 小米最新开源的MiMo-Embodied模型是一款突破性的跨领域具身智能基座模型,致力于为机器人、智能体及实体交互设备提供通用智能能力支持。该模型整合多模态感知与决策能力,覆盖视觉、语言、动作等多维度... AI新闻资讯# 小米集团# 自动驾驶 2周前670
复旦大学发布MOSS-Speech:国产开源语音到语音大模型,实现高质量语音转换与生成 复旦大学最新开源的MOSS-Speech是一款先进的语音到语音大模型,支持高质量、多场景的语音转换与生成任务。该模型结合前沿深度学习技术,适用于语音合成、风格迁移、跨语言语音生成等应用,为AI语音领域... AI新闻资讯# 复旦大学# 语音 2周前850
Parallax – Gradient开源的全球首个全自主AI操作系统 Parallax - Gradient 是全球首个全自主、开源的AI操作系统,致力于推动人工智能技术的普及与革命。该系统具备自主感知、决策与执行能力,支持多场景智能应用,为开发者、企业及研究机构提供高... AI新闻资讯# AI实验室# deepseek# Qwen3 2周前870
HunyuanVideo 1.5 – 腾讯混元免费开源的轻量级视频生成模型 腾讯混元最新推出的HunyuanVideo 1.5是一款免费开源的轻量级视频生成模型,支持通过文本描述一键生成高质量视频内容。该模型具有参数规模小、运行效率高、生成效果优质的特点,适合个人创作者、开发... AI新闻资讯# 图生视频# 文生视频# 混元大模型 2周前880
Awex – 蚂蚁集团开源的高性能权重交换框架 Awex 是蚂蚁集团开源的高性能权重交换框架,专为分布式模型训练与参数同步优化设计。它提供轻量、高效、可靠的权重交换能力,帮助企业和开发者提升大规模机器学习训练效率,降低系统复杂度,适用于深度学习、联... AI新闻资讯# 云计算# 人工智能# 数据中心 2周前850
Seekdb – 蚂蚁OceanBase开源的AI原生混合搜索数据库 SeekDB是由蚂蚁集团OceanBase团队开源的新一代AI原生混合搜索数据库,深度融合向量检索与结构化查询,支持实时数据分析与高性能智能搜索。适用于推荐系统、知识库、多模态检索等场景,提供开源企业... AI新闻资讯# 搜索数据库# 数据处理# 语言模型 2周前770