FIBO – 开源的图像生成模型，首个原生支持JSON

AI笔记1个月前更新 mx131

FIBO是什么

FIBO 是首个开源的原生支持 JSON 的文本生成图像模型，专为长结构化描述训练而成。模型在超过 1 亿条结构化 JSON 描述（每条约 1,000 字）上训练，能精确、可重复地控制光线、构图、色彩与相机参数。FIBO 支持生成、精修和灵感三种模式，具备特征解耦能力，能单独调整某个属性不破坏整体场景。FIBO使用 100% 授权数据，确保合规性和法律透明性，适合专业工作流。

FIBO – 开源的图像生成模型，首个原生支持JSON

FIBO的主要功能

文本到图像生成：根据用户输入的文本描述，生成高质量的图像。
结构化 JSON 提示：将简短文本提示扩展为详细的结构化 JSON 描述，包含光线、构图、色彩等细节。
迭代可控生成：支持从简短提示生成图像，或基于已有 JSON 提示进行多轮细化。
特征解耦控制：单独调整某个属性（如相机角度）而不破坏整体场景。
灵感模式：通过输入图像提取结构化提示，生成相关图像，激发创意。
企业级合规性：100% 使用授权数据，确保法律透明性和可重复性。
生产级集成：模型支持 API 接口、ComfyUI 节点及本地推理。

FIBO的技术原理

架构：基于 8B 参数的 DiT 架构，采用流匹配（Flow Matching）训练方式。
文本编码器：使用 SmolLM3-3B，搭配创新的 DimFusion 条件架构，实现高效的长描述训练。
VAE：采用 Wan 2.2，负责图像的编码和解码。
VLM 引导：通过视觉语言模型（VLM）将简短文本提示扩展为详细的结构化 JSON 提示。
结构化监督：使用结构化 JSON 描述进行训练，促进特征解耦，避免提示词漂移。
数据合规性：在超过 1 亿条授权的长结构化 JSON 描述上训练，确保数据合规性。

FIBO的项目地址

GitHub仓库：https://github.com/Bria-AI/FIBO
HuggingFace模型库：https://huggingface.co/briaai/FIBO
在线体验Demo：https://huggingface.co/spaces/briaai/FIBO

FIBO的应用场景

专业设计与创意工作流：为广告、产品设计和平面设计生成高质量图像，支持快速迭代和精准控制，提升创意效率。
影视与娱乐：FIBO 能生成电影、游戏和动画的概念艺术与场景设计，助力视觉化创作，加速开发流程。
教育与培训：模型能生成教学图像和虚拟实验场景，辅助教育内容制作，提升学习体验。
科学研究：模型能将科学数据转化为直观图像，辅助研究展示和数据可视化。
医疗与健康：FIBO 可生成医学示意图和虚拟手术场景，支持医学教学和手术培训。

AI笔记 # AI工具

© 版权声明

文章版权归原作者所有，未经允许请勿转载。

相关文章

Argus 1.0 – 如视推出的全球首个空间大模型

Argus 1.0 – 如视推出的全球首个空间大模型

AI新闻资讯 # AI工具

3周前

760

豆包大模型1.6-vision – 火山引擎推出的视觉深度思考模型

豆包大模型1.6-vision – 火山引擎推出的视觉深度思考模型

AI新闻资讯 # AI工具

1个月前

1580

豆包语音2.0 – 字节跳动推出的升级版AI语音模型

豆包语音2.0 – 字节跳动推出的升级版AI语音模型

AI笔记 # AI工具 # AI项目和框架

2个月前

1820

Kandinsky 5.0 – 俄罗斯AI-Forever开源的视频生成模型

Kandinsky 5.0 – 俄罗斯AI-Forever开源的视频生成模型

AI笔记 # AI工具

2个月前

2580