AI新闻资讯

FLUX.2 – 黑森林开源的图像生成与编辑模型

FLUX.2是由黑森林团队开源的高性能图像生成与编辑模型，支持用户免费进行AI绘画、智能修图及高清图像创作。该模型集成了先进的生成算法与编辑功能，适用于艺术设计、内容创作、学术研究等多个领域，助力用户...

AI新闻资讯 # 图像生成 # 文生图

2周前

620

Fara-7B – 微软开源的计算机操作Agent助手模型

微软最新开源的Fara-7B是一款专为计算机操作设计的AI Agent助手模型，具备强大的自动化任务执行能力。该模型能够理解自然语言指令，自主操作电脑完成各类任务，如信息检索、软件控制、文件管理等，大...

AI新闻资讯 # 大模型 # 微软

2周前

970

HunyuanOCR – 腾讯混元开源的光学字符识别专家模型

腾讯混元开源的 HunyuanOCR 是一款专业级光学字符识别模型，具备高精度文字检测与识别能力，支持多场景、多语言文档图像处理。该模型基于深度学习技术优化，适用于文档数字化、自然场景文字提取、表格识...

AI新闻资讯 # 文字检测 # 腾讯混元 # 视频字幕

2周前

870

Supertonic – 开源的高性能AI 文本转语音系统，极速离线运行

Supertonic是一款基于开源技术的高性能AI文本转语音系统，支持极速离线运行，无需网络连接即可生成流畅自然的语音。系统采用先进的深度学习模型，提供媲美真人发音的高质量语音输出，支持多语言及声音定...

AI新闻资讯 # TTS # 文本转语音 # 语音克隆

2周前

810

小米开源MiMo-Embodied：跨领域具身智能基座模型全面解读｜关键技术解析与应用前景

小米最新开源的MiMo-Embodied模型是一款突破性的跨领域具身智能基座模型，致力于为机器人、智能体及实体交互设备提供通用智能能力支持。该模型整合多模态感知与决策能力，覆盖视觉、语言、动作等多维度...

AI新闻资讯 # 小米集团 # 自动驾驶

2周前

670

复旦大学发布MOSS-Speech：国产开源语音到语音大模型，实现高质量语音转换与生成

复旦大学最新开源的MOSS-Speech是一款先进的语音到语音大模型，支持高质量、多场景的语音转换与生成任务。该模型结合前沿深度学习技术，适用于语音合成、风格迁移、跨语言语音生成等应用，为AI语音领域...

AI新闻资讯 # 复旦大学 # 语音

2周前

850

Parallax – Gradient开源的全球首个全自主AI操作系统

Parallax - Gradient 是全球首个全自主、开源的AI操作系统，致力于推动人工智能技术的普及与革命。该系统具备自主感知、决策与执行能力，支持多场景智能应用，为开发者、企业及研究机构提供高...

AI新闻资讯 # AI实验室 # deepseek # Qwen3

2周前

870

HunyuanVideo 1.5 – 腾讯混元免费开源的轻量级视频生成模型

腾讯混元最新推出的HunyuanVideo 1.5是一款免费开源的轻量级视频生成模型，支持通过文本描述一键生成高质量视频内容。该模型具有参数规模小、运行效率高、生成效果优质的特点，适合个人创作者、开发...

AI新闻资讯 # 图生视频 # 文生视频 # 混元大模型

2周前

880

Awex – 蚂蚁集团开源的高性能权重交换框架

Awex 是蚂蚁集团开源的高性能权重交换框架，专为分布式模型训练与参数同步优化设计。它提供轻量、高效、可靠的权重交换能力，帮助企业和开发者提升大规模机器学习训练效率，降低系统复杂度，适用于深度学习、联...

AI新闻资讯 # 云计算 # 人工智能 # 数据中心

2周前

850

Seekdb – 蚂蚁OceanBase开源的AI原生混合搜索数据库

SeekDB是由蚂蚁集团OceanBase团队开源的新一代AI原生混合搜索数据库，深度融合向量检索与结构化查询，支持实时数据分析与高性能智能搜索。适用于推荐系统、知识库、多模态检索等场景，提供开源企业...

AI新闻资讯 # 搜索数据库 # 数据处理 # 语言模型

2周前

770

标签云

热门资讯