美心AI导航
次级导航
  • ai资讯
    • ai大模型
    • ai自媒体
  • 热榜
    • ai资讯
      • ai大模型
      • ai自媒体
    • 热榜

    AI新闻资讯

    共 298 篇文章
    AI最新资讯_人工智能新闻头条_AI行业动态
    ai大模型AI笔记AI自媒体教程AI新闻资讯
    排序
    发布更新浏览点赞
    OCR新王登顶!百度开源PaddleOCR-VL:0.9B超轻量模型斩获全球综合性能第一

    OCR新王登顶!百度开源PaddleOCR-VL:0.9B超轻量模型斩获全球综合性能第一

    百度最新开源的PaddleOCR-VL模型,在全球权威评测中以92.6分登顶OCR综合性能榜首。这款参数仅0.9B的超轻量视觉-语言模型,能精准解析文本、表格、公式、手写及图表,支持109种语言,推理...
    AI新闻资讯# GPT# 精准识别# 语言模型
    1周前
    1280
    助力Speech LLM落地!美团LongCat开源高效语音编解码方案 (LongCat-Audio-Codec)

    助力Speech LLM落地!美团LongCat开源高效语音编解码方案 (LongCat-Audio-Codec)

    针对Speech LLM落地中的音频处理难题,美团LongCat团队正式开源专用语音编解码方案LongCat-Audio-Codec。该方案提供一站式Tokenizer与DeTokenizer工具链...
    AI新闻资讯# 美团# 翻译# 语言模型
    1周前
    1050
    性能霸榜,全面开源:上海AI Lab联合北大发布文档解析大模型MinerU2.5,1.2B参数超越GPT-4o

    性能霸榜,全面开源:上海AI Lab联合北大发布文档解析大模型MinerU2.5,1.2B参数超越GPT-4o

    上海人工智能实验室与北京大学联合开源高性能文档解析大模型MinerU2.5。该模型以仅1.2B的轻量参数,在OmniDocBench等权威评测中全面超越GPT-4o、Gemini等主流大模型,特别擅长...
    AI新闻资讯# 人工智能# 北京大学# 语言模型
    1周前
    1100
    VitaBench – 美团LongCat开源的交互式Agent评测基准

    VitaBench – 美团LongCat开源的交互式Agent评测基准

    美团LongCat团队正式开源VitaBench,这是一个高度贴近真实生活场景的交互式Agent评测基准。它以外卖点餐、餐厅就餐、旅游出行三大高频场景为载体,构建了包含66种工具的评测环境,旨在解决A...
    AI新闻资讯# 大模型# 美团
    1周前
    1070
    DeepSeek-OCR – DeepSeek开源的光学字符识别模型

    DeepSeek-OCR – DeepSeek开源的光学字符识别模型

    DeepSeek于2025年10月开源了新一代光学字符识别模型DeepSeek-OCR。该模型基于创新的视觉语言模型(VLM)架构,通过DeepEncoder实现高效视觉压缩,在10倍压缩比下仍保持约...
    AI新闻资讯# deepseek# OCR# 文本处理
    1周前
    1130
    混元世界模型1.1 – 腾讯混元发布的开源3D重建大模型

    混元世界模型1.1 – 腾讯混元发布的开源3D重建大模型

    腾讯混元于2025年10月正式开源世界模型1.1版本(WorldMirror),在业内领先的3D生成能力上再次突破。新版支持文本、图像、视频等多模态输入,在单张消费级显卡上即可实现秒级高质量3D场景生...
    AI新闻资讯# 3D大模型# 混元# 腾讯
    1周前
    1050
    DreamOmni2 – 港科大开源的多模态AI图像编辑与生成模型

    DreamOmni2 – 港科大开源的多模态AI图像编辑与生成模型

    香港科技大学冯诺依曼研究院贾佳亚团队开源多模态AI模型DreamOmni2,在图像编辑与生成任务中表现卓越。其突破性在于能精准理解并生成光影、风格等抽象概念,支持多张参考图协同工作,在多项测试中性能超...
    AI新闻资讯# 图像编辑# 港科大
    1周前
    730
    LongCat-Video – 美团LongCat开源的视频生成模型

    LongCat-Video – 美团LongCat开源的视频生成模型

    LongCat-Video是什么LongCat-Video是美团LongCat团队开源的13.6亿参数视频生成模型,采用MIT开源协议,支持文生视频、图生视频和视频续写三大任务。模型通过"粗到细"生成...
    AI新闻资讯
    1周前
    770
    Dexbotic – 原力灵机开源的具身智能VLA模型一站式科研服务平台

    Dexbotic – 原力灵机开源的具身智能VLA模型一站式科研服务平台

    Dexbotic是由Dexmal原力灵机重磅开源的一站式具身智能VLA(视觉-语言-动作)模型科研服务平台。该平台旨在解决VLA研究领域技术分散、复现困难的痛点,为研究者提供标准化、模块化的统一基础设...
    AI新闻资讯# 语言模型
    1周前
    790
    ValueCell – 开源的多智能体金融平台,多个Agent分工协作

    ValueCell – 开源的多智能体金融平台,多个Agent分工协作

    ValueCell是一个社区驱动的开源多智能体金融平台,致力于通过多个AI Agent的协同工作,将复杂的投研流程自动化。它集成了市场分析、SEC文件解读、情绪监控与策略交易等多种智能体,支持全球主要...
    AI新闻资讯# OpenAI# OpenRouter# 投资管理
    1周前
    1280
    加载更多

    标签云

    热门资讯

    美心AI导航
    专注收录免费,好用的AI工具,并提供丰富的免费教程和使用指南,让AI零基础用户也能轻松上手,覆盖写作、绘图、视频、编程等200+细分领域。助你快速找到最适合的AI神器。

    友链申请 免责声明 广告合作 关于我们 网站地图 RSS地图 LLMs地图

    Copyright © 2025 美心AI导航 蜀ICP备2025123970号-1 
    网址
    网址文章软件书籍