大模型与智能体架构

文献精读 LPM 1.0:基于视频的大型角色交互式表演模型

少于 1 分钟阅读

核心速递 : 本文推出了首个支持全双工对话的交互式视频生成系统 LPM 1.0,通过 170 亿参数的 DiT 基础模型与流式蒸馏架构,打破了生成模型在极高表现力、实时推理与长时序身份稳定性上的“不可能三角” 。 1. 论文基本信息 Title: LPM 1.0: Video-based Char...

文献精读 ACON:优化长周期大语言模型智能体的上下文压缩

少于 1 分钟阅读

核心速递 : ACON 提出了一个统一的智能体上下文优化框架,利用自然语言对比反馈实现无梯度的压缩策略优化,并将此能力高效蒸馏至小参数模型,在大幅降低大模型多步推理内存与成本的同时,显著提升了长周期智能体的任务成功率。 1. 论文基本信息 Title: ACON: OPTIMIZING CONTE...

文献精读 scGPT:利用生成式AI构建单细胞多组学基础模型

1 分钟阅读

核心速递 : scGPT 率先在超 3300 万单细胞数据上进行了生成式预训练,创新性地解决了非序列化基因表达数据的注意力掩码问题,打造了单细胞生物学领域的“基础大模型”,并通过迁移学习在细胞类型注释、跨组学整合、基因扰动预测及网络推断等核心任务上实现了 SOTA(State-of-the-Art)性能。 ...

💬 分类讨论