Lumine是什么
Lumine是字节跳动推出的在3D开放世界游戏中实时感知、推理和行动的通用AI智能体。Lumine基于Qwen2-VL-7B-Base模型,通过类人交互范式,将感知、思考和行动整合在一起。Lumine能实时感知游戏环境,执行复杂的任务,包括战斗、解谜、与NPC交互以及GUI操作等。Lumine在《原神》中表现出色,能完成长达数小时的主线任务,且在其他游戏中展现跨游戏泛化能力。Lumine通过多阶段训练,逐步提升自主思考和操作能力,为未来具身智能的发展提供新的方向。
Lumine的主要功能
- 任务执行:能自主完成复杂的长周期任务,如在《原神》中完成长达数小时的主线剧情。
- 战斗能力:动态追踪敌人、精准射击、切换角色进行连招攻击,高效开启宝箱。
- 解谜能力:支持应对各种解谜挑战,如收集风神瞳、激活元素方碑等。
- NPC交互:能与NPC进行稳定对话,完成任务。
- GUI操作:像人类玩家一样进行2D界面操作,如制作物品、使用传送锚点等。
- 跨游戏泛化:无需额外微调,能在其他游戏(如《崩坏:星穹铁道》《鸣潮》)中完成任务。
Lumine的技术原理
- 感知空间:以每200ms处理一帧游戏画面,保留历史推理轨迹,为决策提供上下文信息。
- 混合思考策略:在关键场景(如环境突变、计划失效)进行推理,简单场景直接输出动作,提高效率。
- 键盘与鼠标操作建模:将所有操作定义为鼠标位移和按键序列,通过高质量数据进行三阶段训练:
- 预训练:学习基础视觉运动能力。
- 指令跟随训练:关联语言指令与动作。
- 决策推理训练:学会自主规划和修正,完成长周期任务。
- 实时优化:通过上下文管理和多维度优化,降低延迟,确保实时交互。
Lumine的项目地址
- 项目官网:https://www.lumine-ai.org/
- arXiv技术论文:https://arxiv.org/pdf/2511.08892
Lumine的应用场景
- 游戏开发与测试:用在游戏自动化测试,帮助开发者快速发现漏洞、性能问题及用户体验问题,同时辅助生成智能NPC行为和任务设计,提升游戏开发效率。
- 游戏娱乐:作为AI队友或对手,为玩家提供更具挑战性和趣味性的互动体验,或在单人游戏中辅助玩家完成复杂任务,提升游戏完成度。
- 教育与培训:用在虚拟训练环境,为学生或专业人员提供任务训练,或在教育游戏中辅助学习,通过任务和挑战帮助学生掌握知识和技能。
- 虚拟世界与元宇宙:作为虚拟角色在元宇宙中与用户互动,提供陪伴或服务,帮助用户生成虚拟世界中的任务、剧情或互动内容,丰富用户体验。
- 工业与制造业:在工业模拟环境中执行任务和优化流程,帮助设计高效工作模式,用在智能机器人训练,提升其自主决策和操作能力。
© 版权声明
文章版权归原作者所有,未经允许请勿转载。
相关文章
暂无评论...