数据来源:HuggingFace Papers

Latest Papers

1. What Should Agents Say? Action-state Communication for Efficient Multi-Agent Systems

Abstract:Multi-agent systems (MAS) built on large language models are typically organized around roles, pipelines, and turn schedules, while the content that agents pass to one another is often left as unconstrained natural language. However, this free-form communication can rapidly inflate token usage, consume the shared context window, and ultimately affect both system performance and inference cost. We analyze five common inter-agent communication strategies across two MAS topologies, finding that no fixed strategy is universally optimal. Instead, effective inter-agent messages consistently preserve action-centered information needed by downstream agents. Building on this, we propose the PACT (Protocolized Action-state Communication and Transmission), which treats inter-agent communication as a public state-update problem and projects each raw agent output into a compact action-state record before it enters shared history. Across different MAS topologies, PACT consistently improves the performance-cost trade-off, achieving comparable or stronger task performance with substantially fewer tokens. The gains extend to production coding harnesses: PACT lifts OpenHands’ resolve rate at -10% tokens-per-resolved, and is resolve-neutral on SWE-agent while halving input tokens. Our code is publicly available at this https URL.

中文摘要

摘要:基于大型语言模型的多智能体系统(MAS)通常围绕角色、流程和回合调度进行组织,而智能体之间传递的内容往往是无限制的自然语言。然而,这种自由形式的通信会快速增加令牌使用量,消耗共享上下文窗口,并最终影响系统性能和推理成本。我们分析了两种 MAS 拓扑结构中的五种常见智能体间通信策略,发现没有固定策略是普遍最优的。相反,有效的智能体间消息始终保留下游智能体所需的以动作为中心的信息。在此基础上,我们提出了 PACT(协议化动作状态通信与传输),将智能体间通信视为公共状态更新问题,并在每个原始智能体输出进入共享历史之前,将其投影为紧凑的动作状态记录。在不同的 MAS 拓扑结构中,PACT 持续改善性能与成本的权衡,实现了可比或更强的任务性能,同时使用的令牌显著减少。这些收益也扩展到生产编码应用:PACT 提升了 OpenHands 的解决率,同时令牌使用量降低了 10%,在 SWE-agent 上则保持解决率不变,并将输入令牌量减半。我们的代码在此 https URL 公共提供。

LLM Analysis

Q: 这篇论文试图解决什么问题?

这篇论文试图解决多智能体系统(MAS)中智能体间通信内容的优化问题,具体而言:

核心问题

在基于大语言模型的多智能体系统中,智能体之间的消息传递通常采用无约束的自然语言形式。这种自由形式的通信会导致以下问题:

  • Token成本激增: verbose或带有内部推理痕迹的消息会被下游智能体反复处理,导致token使用量在轮次间累积式增长
  • 上下文窗口压力:共享历史中的冗余内容迅速膨胀,可能在任务完成前耗尽上下文窗口
  • 性能与成本的权衡失衡:现有研究主要关注角色设计、轮次调度和工具分配,却忽视了智能体应该传递什么内容这一关键设计维度

具体挑战

论文通过诊断分析发现,常见的五种通信策略(完整内容、简洁生成、仅结论、简短摘要、仅工件)均存在局限性:

  • 完整内容:昂贵且冗余,包含大量下游智能体不需要的推理痕迹
  • 仅结论:在接收方缺乏周围状态信息时过于信息丢失严重
  • 通用缩短策略:可能移除下游智能体所需的任务相关信息

解决思路

论文提出将智能体间通信重新定义为公共状态更新问题:消息不应总结发送方的私有推理,而应以最小的动作相关信息更新共享状态,使下游智能体能够继续任务。基于此,论文提出了PACT(Protocolized Action-state Communication and Transmission)协议,将每个智能体的原始输出投影为紧凑的动作-状态记录(包含动作、状态、结果三个字段),从而在显著降低token消耗的同时保持或提升任务性能。

Q: 有哪些相关研究?

该论文的相关研究主要集中在以下三个领域:

多智能体系统(Multi-agent systems)

现有研究主要关注**“谁说话以及何时说话”**的协调机制,包括:

  • 角色专业化与自我协作(Wang et al., 2024c; Li et al., 2023):通过分配不同角色或利用多角色自我协作来增强任务解决能力
  • 同伴辩论与批判(Du et al., 2024; Liang et al., 2023):多个智能体通过辩论和相互批判来提高事实性和推理能力
  • 多智能体对话框架(Wu et al., 2024; Chen et al., 2024):提供通用的多智能体协作架构
  • 并行输出聚合(Wang et al., 2024a):通过聚合多个智能体的并行输出来提升性能

关键缺口:这些设计在角色分工和编排方式上各不相同,但普遍将智能体间消息的内容留给无约束的自然语言处理

多智能体系统中的Token消耗

该领域的研究关注重复上下文重用带来的成本问题:

  • 上下文累积效应:一个智能体的输出成为另一个智能体的输入,后续智能体必须重新处理早期消息(Zeng et al., 2025)
  • 思维链(Chain-of-thought)的重复处理:当智能体转发推理内容时,相同的推理痕迹被下游智能体反复读取,导致成本激增
  • 通信内容的结构化研究(Zou et al., 2025; Chen et al., 2025; Yu et al., 2026):研究表明有纪律的通信会影响准确性和成本

关键缺口:现有研究主要关注**“智能体应该与谁通信”(Zhang et al., 2025; Shen et al., 2025),而“应该通信什么内容”**在很大程度上被忽视。

面向真实任务的智能体框架(Agentic harnesses)

研究逐渐从学术脚手架转向解决真实世界的复杂问题,特别是在软件工程领域:

  • SWEbench(Jimenez et al., 2024):评估智能体解决真实GitHub问题的基准测试
  • OpenHands(Wang et al., 2025)和SWE-agent(Yang et al., 2024):广泛使用的智能体循环,在长轨迹中交织推理、工具调用和环境反馈

关键挑战:由于这些框架积累了较长的工具增强历史记录,每轮消息和共享历史预算很容易规模膨胀。现有工作尚未充分探讨如何通过精简通信内容来降低这些生产级系统的成本。

Q: 论文如何解决这个问题?

论文通过提出 PACT(Protocolized Action-state Communication and Transmission) 协议来解决多智能体系统中通信内容冗余与成本高昂的问题。该解决方案包含以下核心机制:

1. 问题重构:公共状态更新视角

论文将智能体间通信重新定义为公共状态更新问题,而非传统的自由形式消息传递。关键洞察在于:

  • 消息不应总结发送方的私有推理过程(如内部的 痕迹、反复推敲的中间步骤)
  • 消息应更新共享状态,仅保留下游智能体继续任务所需的动作相关信息

2. 动作-状态消息空间(Action-state Message Space)

PACT 将每个公共智能体间消息严格限定为包含三个字段的动作-状态记录

字段 功能 内容
ACTION 明确交接意图 发送方已执行的动作,或要求接收方执行的下一步动作
STATE 提供 grounding 证据 支撑该动作的证据、观察、环境反馈或工具结果
RESULT 传递可复用工件 动作的直接产出(如检索到的事实、精炼后的方案、工具调用结果)

这三个字段共同定义了允许进入共享智能体间信道的信息边界。

3. 形式化协议机制

设多智能体系统在轮次 t 具有共享历史 H_t 。具有角色或动作 r_t 的智能体接收局部观察 o_t 和共享历史 H_t ,生成原始输出 y_t 。

标准 MAS 的更新规则为:
H_(t+1)^(std) = H_t^(std) oplus y_t

其中 oplus 表示追加消息,这使得 y_t 的所有内容(包括推理痕迹、重复陈述、最终工件)都成为公共历史的一部分。

PACT 通过发送方投影 Pi(PACT) 替换原始消息:
H
(t+1)^(PACT) = Ht^(PACT) oplus Pi(PACT)(y_t, o_t, r_t)

投影函数 Pi_(PACT) 将原始输出映射到紧凑的公共消息空间,仅保留动作-状态记录所需的三个字段,排除中间过程级内容。

4. 协议的关键属性

PACT 作为通信协议具有以下设计特性:

  • 私有计算与公共通信分离:智能体仍可按原有方式执行内部推理、自我检查或探索替代方案;PACT 仅控制生成输出的哪一部分被保留为公共通信。这不同于抑制推理或改变智能体内部解决过程的方法,保留了智能体的固有能力。
  • 与标准 MAS 设计正交:PACT 不引入新智能体、不改变轮次调度、不训练压缩器、不假设特定角色结构。同一动作-状态接口可在不同设置中以不同方式序列化:

  • 分证据交互中:显式写入动作、状态和结果

  • 角色专业化流水线中:部分动作通过角色调度隐式编码,保留更紧凑的角色工件

5. 实际实现:代理钩子(Proxy Hook)

在生产级智能体编码框架(如 OpenHands 和 SWE-agent)中,PACT 被实现为轻量级代理钩子,在飞行中更新智能体轮次间的公共消息:

  1. 输出生成:每轮在工具调用前,智能体必须生成结构化的 块,包含:
  • Action Required(所需动作)
  • Observed State(观察到的状态)
  • Planned Effect(计划效果)——即 ACTION、STATE、RESULT 的编码语义
  1. 历史重写:在每轮开始前,代理重写先前的助手消息,仅保留 块和工具调用,移除中间过程和自由形式散文;工具结果保持完整。

这样,智能体间信道被缩减为仅包含动作-状态摘要、工具调用和工具结果的信息,显著降低了累积上下文长度。

Q: 论文做了哪些实验?

论文进行了四个层次的实验验证,涵盖诊断分析、主实验对比、消融研究和真实世界应用:

1. 诊断分析实验(§3)

目的:分析五种常见通信策略在两种不同MAS拓扑结构中的表现,验证”无单一策略 universally optimal”的假设。

实验设置

  • 模型:Qwen3-8B、Qwen3-14B、Qwen3-32B
  • Setting A — 分证据交互(Split-Evidence Interaction):

  • 对称双智能体设置,证据被分割,需多轮交换才能回答问题

  • 数据集:HotpotQA、2WikiMultiHopQA
  • 每问题10个段落(2个黄金支撑段+8个干扰段),智能体间5-5分割
  • 最多8轮,早停机制
  • Setting B — 顺序流水线(Sequential Pipeline):
  • 四智能体固定顺序:Planner → Critic → Refiner → Solver
  • 数据集:AIME2024、AIME2025(数学推理)、GPQA-Diamond(科学推理)、OpenBookQA(常识问答)

五种对比策略

  • Full Content:转发完整自由形式输出(含推理痕迹)
  • Concise Generation:使用模型原生非思考模式生成简短回复
  • Conclusion Only:仅传递最终结论/答案部分
  • Brief Summary:显式要求生成短摘要
  • Artifact Only:仅传递角色工件(如计划或批评),无动作描述或支撑证据

关键发现(见图2、图3):

  • Full Content 成本最高且性能并非最优
  • Concise Generation 在交互设置表现好,但在流水线设置弱(中间智能体需产生有用计划/批评)
  • Conclusion Only 在流水线中尚可(固定角色顺序提供上下文),但在交互设置中表现差(需证据交换)
  • Artifact Only 在交互设置准确率高但token成本极高(因抑制前言导致智能体运行更多轮次)

2. PACT主实验(§5)

目的:验证PACT在性能-成本权衡上优于现有MAS通信范式。

对比基线

  • Chain of Agents (CoA):智能体链式顺序工作,每个仅读取最近一条同伴消息(非完整历史)
  • Text-based MAS (TextMAS):角色专业化智能体通过无约束自然语言协作,保留完整消息历史
  • Multi-Agent Debate:4个智能体独立提出初始答案,辩论3轮,多数投票决定最终答案

结果(表1、表2):

Setting A(分证据交互)

模型 最佳对比方法 PACT F1 Token节省
Qwen3-8B Multi-Agent Debate (69.6) 69.9 比Debates少~50% tokens
Qwen3-14B CoA (54.8) 56.8 比CoA少~11.6% tokens
Qwen3-32B Multi-Agent Debate (60.3) 61.5 比Debates少~60% tokens

Setting B(顺序流水线)

  • 准确率:PACT在12个基准-模型组合中的9个达到最高或次高准确率
  • Token效率:平均token使用量比Multi-Agent Debate减少81%(仅使用19-23%的tokens)
  • 规模趋势:从Qwen3-8B到32B,PACT的token使用量减少21.1%,同时准确率提升4.2点,表明更强模型更能利用紧凑通信

3. 消融实验(§5.3)

目的:验证PACT三个字段(Action、State、Result)的必要性。

设置:HotpotQA数据集,Qwen3-8B模型

结果(表3):

  • 完整PACT (A+S+R):F1=69.9,Tok=6,704
  • 移除Action (S+R):F1降至64.9 (-5.0),Token微增1.8%
  • 接收方缺乏明确信号了解信息用途或需求
  • 移除State (A+R):F1降至65.2 (-4.7),Token微增0.6%
  • 动作结果缺乏证据支撑,可靠性下降
  • 仅保留Result (R):F1降至64.3 (-5.6),Token激增12.9%
  • 无支撑结果导致接收方歧义,需更多轮次澄清

结论:三个字段共同构成完整的动作-状态交接,缺一不可。

4. 真实世界编码框架实验(§6)

目的:验证PACT作为轻量级代理钩子,在未设计的生产级智能体框架中的可移植性。

实现方式

  • 作为LiteLLM代理钩子,在飞行中重写提示和解析响应
  • 每轮要求智能体在工具调用前生成结构化<summary>块(包含Action Required、Observed State、Planned Effect)
  • 重写历史:仅保留<summary>块和工具调用,移除中间过程和自由形式散文

测试平台

  • OpenHands (CodeActAgent)SWE-agentSWE-bench Verified(真实GitHub问题)上测试
  • 模型:Qwen3-14B

结果(表4):

OpenHands

指标 基线 PACT 变化
解决率 19.40% 23.00% +3.6 pp (+18个实例)
每解决实例Token数 3.82M 3.43M -10.3%
平均完成Token/调用 870.6 824.2 -5.3%

SWE-agent

指标 基线 PACT 变化
解决率 25.6% 24.2% -1.4 pp (近似中性)
输入Token 314.6M 156.0M -50.4%
每解决实例Token数 2.46M 1.30M -47%

意义:PACT在OpenHands上同时提升性能和效率,在SWE-agent上保持解决率近似中性的同时将成本减半,证明其作为推理时通信协议的实用价值。

Q: 有什么可以进一步探索的点?

基于论文的局限性与实验设计,以下方向值得进一步探索:

1. 更广泛的系统架构与交互模式

论文的Limitations部分明确指出,当前验证存在两个覆盖缺口:

  • 短交互与非历史累积架构:PACT针对共享对话历史是主要token成本来源的场景设计,其在短交互或不重复暴露先前智能体输出的架构(如单次调用、独立并行处理)中的效益尚未充分探索。
  • 动态与开放式协作拓扑:实验未覆盖开放式辩论(open-ended debate)、工具密集型规划(tool-heavy planning)或动态路由智能体网络(dynamically routed agent networks)。在这些场景中,通信内容可能需要自适应调整,而非固定的三字段结构。

2. 自动化协议学习与优化

当前PACT采用手工设计的结构化模板(Action-State-Result)。未来可探索:

  • 端到端学习通信协议:利用可微分训练或强化学习,让智能体自动发现最优的公共消息投影函数 Pi_(PACT) ,而非预设字段。
  • 任务自适应压缩:根据任务复杂度动态调整STATE字段的详细程度,例如在多跳推理中自动保留关键证据链,在简单问答中压缩为极简摘要。

3. 跨模态与异构通信

论文聚焦于文本模态的自然语言通信。扩展方向包括:

  • 多模态动作-状态记录:在涉及代码、图像、表格或API返回值的场景中,如何结构化非文本内容(如代码diff、图像特征)进入统一的action-state空间。
  • 异构智能体间通信:当系统中包含不同基础模型(如LLM与视觉-语言模型、或不同规模的模型混合)时,如何设计适配各方能力的公共消息格式。

4. 安全性与隐私边界的形式化

虽然PACT区分了私有计算与公共通信,但STATE字段仍可能包含敏感信息:

  • 隐私泄漏量化:形式化分析STATE字段在提供必要grounding的同时,如何最小化暴露原始输入中的隐私信息(如代码中的密钥、个人身份信息)。
  • 对抗鲁棒性:研究恶意智能体如何通过构造特定的Action或State字段诱导下游智能体产生错误行为,以及相应的防御机制。

5. 与先进模型架构的协同

  • 长上下文与推理模型:随着模型上下文窗口扩展和推理能力增强(如Claude 3.7 Sonnet、o3类模型),需重新评估”紧凑通信”与”充分利用模型长程推理能力”之间的权衡。
  • 混合专家(MoE)系统:探索PACT原则是否适用于智能体级别的MoE架构,其中每个专家可视为一个智能体,通信协议影响路由决策效率。

6. 理论分析与最优性边界

  • 信息论视角:从信息瓶颈(Information Bottleneck)角度分析,在给定任务性能约束下,公共历史 H_t 的理论最小描述长度是多少。
  • 通信复杂度下界:针对特定多智能体任务(如共识达成、分布式推理),证明PACT-style的通信策略接近理论最优的通信复杂度下界。

Q: 总结一下论文的主要内容

这篇论文研究了多智能体系统(MAS)中智能体间通信内容的优化问题,提出通过结构化协议降低通信成本并提升任务效率。

核心问题

基于大语言模型的多智能体系统通常采用无约束的自然语言进行智能体间通信,导致:

  • Token成本激增:冗长的推理痕迹和冗余内容被下游智能体反复处理,在共享历史中累积
  • 上下文窗口压力:自由形式消息迅速膨胀,可能在任务完成前耗尽上下文窗口
  • 性能与成本失衡:现有研究关注角色设计和调度,却忽视了”智能体应该传递什么内容”这一关键维度

关键发现

通过对五种常见通信策略(完整内容、简洁生成、仅结论、简短摘要、仅工件)在两种MAS拓扑(分证据交互、顺序流水线)上的诊断分析,论文发现:

  • 无单一策略普遍最优:不同拓扑结构下最优策略各异
  • 动作中心性:有效的智能体间消息始终保留动作相关信息(action-centered information),即接收方继续任务所需的最小公共状态更新

方法:PACT协议

基于上述发现,论文提出 PACT(Protocolized Action-state Communication and Transmission),一种无需训练、与框架无关的通信协议:

核心机制:将每个智能体的原始输出投影为紧凑的动作-状态记录,仅包含三个字段:

  • ACTION:已执行或需执行的下一步动作
  • STATE:支撑动作的证据、观察或环境反馈
  • RESULT:传递给下游的工件或结果

该协议严格区分私有计算(内部推理过程)与公共通信(进入共享历史的内容),排除中间 deliberation 痕迹。

实验验证

受控MAS设置(Qwen3 8B/14B/32B):

  • 在分证据交互和四智能体顺序流水线上,PACT相比基线(Chain of Agents、Text-based MAS、Multi-Agent Debate)平均减少**38.7%**的token使用,同时保持或提升任务准确率
  • 消融实验证实三个字段缺一不可:移除任一字段均导致性能下降或token消耗增加

真实世界编码框架

  • OpenHands:解决率从19.4%提升至23.0%,每解决实例token成本降低10.3%
  • SWE-agent:在保持解决率近似中性的情况下,输入token减少50.4%,每解决实例token成本降低47%

主要贡献

  1. 系统性分析:首次系统分析智能体间通信策略,证明通信内容是影响MAS性能与成本的核心设计维度
  2. 协议设计:提出PACT协议,定义私有计算与公共通信的边界,实现紧凑的动作-状态交接
  3. 实用验证:在从学术基准到生产级编码框架的多种场景中,验证PACT能显著改善性能-成本权衡,展示其作为通用推理时通信协议的实用价值

Q: 想要进一步了解论文

以上只是了解一篇论文的几个基本FAQ。如果你还想与Kimi进一步讨论该论文,请点击 这里 为你跳转Kimi AI网页版,并启动一个与该论文相关的新会话。

Authors: Chen Huang,Yuhao Wu,Wenxuan Zhang

PDF URL: https://arxiv.org/pdf/2606.05304.pdf

Arxiv URL: https://arxiv.org/abs/2606.05304

Arxiv ID: 2606.05304

CoolPaper URL: https://papers.cool/arxiv/2606.05304

Published: 2026-06-10T01:51:22.040Z

Updated: 2026-06-10T01:51:22.040Z


2. BenSyc: Benchmarking Conversational Sycophancy and Human Alignment in LLMs for Bengali Contexts

Abstract:Large language models (LLMs) increasingly participate in emotionally sensitive social conversations, where responses may shift from balanced support toward excessive validation or escalatory alignment. Existing sycophancy research primarily focuses on factual agreement and instruction-following settings, leaving culturally grounded conversational sycophancy underexplored. We introduce BenSyc, the first benchmark for studying conversational sycophancy in Bengali social contexts. Starting from 11,840 Reddit posts and 170k comments collected from communities across Bangladesh and West Bengal, we construct a human-validated benchmark with binary labels and a fine-grained five-level taxonomy spanning Invalidation, Neutral, Support, Validation, and Escalation. We evaluate more than 15 open and proprietary LLMs on conversational alignment classification and response generation tasks. Results show that distinguishing empathetic support from reinforcement-oriented validation remains challenging even for frontier instruction-tuned models: the best system achieves only 61.8 Macro-F1 on binary detection and 61.7 Macro-F1 on five-class classification. In generation settings, several models frequently produce strongly validating or escalatory responses in emotionally charged situations. Our findings highlight substantial variation across model families and conversational behaviors, underscoring the importance of culturally grounded multilingual benchmarks for evaluating socially aligned conversational AI systems.

中文摘要

摘要:大型语言模型(LLMs)越来越多地参与情感敏感的社交对话,其中的回应可能从平衡的支持转向过度的认可或升级式的认同。现有的阿谀研究主要集中在事实一致性和指令跟随场景,而对富有文化背景的对话阿谀研究仍然不足。我们提出了BenSyc,这是首个用于研究孟加拉社交语境中对话阿谀的基准。基于从孟加拉国和西孟加拉的社区收集的11,840条Reddit帖子和17万条评论,我们构建了一个经过人工验证的基准,包括二元标签以及跨越“无效”、“中性”、“支持”、“认可”和“升级”的细粒度五级分类。在对话对齐分类和回应生成任务上,我们评估了超过15个开放和专有的LLM模型。结果显示,即使是前沿的指令微调模型,在区分共情支持与强化导向的认可方面仍具有挑战性:最佳系统在二元检测上仅达61.8的Macro-F1,在五类分类上为61.7的Macro-F1。在生成任务中,一些模型在情感高度敏感的情境下经常产生强烈认可或升级式回应。我们的研究结果显示模型家族和对话行为之间存在显著差异,强调了基于文化的多语言基准对于评估社会对齐的对话AI系统的重要性。

LLM Analysis

Q: 这篇论文试图解决什么问题?

这篇论文致力于解决大语言模型(LLMs)在孟加拉语社交语境中的对话性谄媚(conversational sycophancy)评估缺失的问题。具体而言,该研究针对以下核心挑战:

1. 文化特定对话对齐的评估空白

现有谄媚研究主要集中在事实性同意(factual agreement)和指令遵循(instruction-following)场景(如模型是否迎合用户的错误事实认知),但忽视了情感敏感的社交对话中更为微妙的人际对齐行为。在孟加拉语等低资源语言的社交语境中,模型回应可能从平衡支持滑向过度验证(validation)或冲突升级(escalation),而现有基准缺乏对此类文化特定对话模式的系统评估框架。

2. 区分共情支持与强化验证的难题

论文指出,支持性共情(supportive empathy)与强化导向的验证(reinforcement-oriented validation)在表面上难以区分——两者都承认用户情绪,但前者提供安慰而不强化用户的解释框架,后者则放大用户的归因、确定性或情绪反应。现有二元分类(赞成/反对)无法捕捉这一光谱,需要细粒度的对话对齐分类法。

3. 多语言、非西方语境下的基准缺失

现有对齐与安全评估高度以英语为中心,缺乏对孟加拉语(Bangla)孟加拉英语(Banglish)代码转换(code-switching)等自然非正式在线话语的覆盖。论文强调,多语言能力不等于文化对齐,需要专门评估模型在孟加拉文化背景下的社交强化行为。

4. 模型生成中的风险行为检测

通过构建包含无效化(Invalidation)→中性(Neutral)→支持(Support)→验证(Validation)→升级(Escalation)五级分类法的基准,论文试图解决如何自动检测模型在生成回应时可能出现的隐性升级行为(如强化敌意、归咎或极端情绪),这些行为往往表面流畅且具文化合理性,但可能加剧用户的负面情绪或认知偏差。

简言之,BenSyc 旨在建立首个针对孟加拉语社交对话中谄媚行为的文化根植性评估基准,解决当前 LLM 评估中缺乏对非西方文化语境下细微对话对齐行为(特别是情感验证与冲突升级)进行系统量化的关键缺陷。

Q: 有哪些相关研究?

该论文在第2节“Related Work”中系统梳理了以下五个相关研究方向:

2.1 谄媚与过度对齐(Sycophancy

Authors: Kazi Noshin,Sajib Acharjee Dip,Ranat Das Prangon,Fardin Hassan Tamim,Syed Ishtiaque Ahmed,Liqing Zhang,Sharifa Sultana

PDF URL: https://arxiv.org/pdf/2606.10061.pdf

Arxiv URL: https://arxiv.org/abs/2606.10061

Arxiv ID: 2606.10061

CoolPaper URL: https://papers.cool/arxiv/2606.10061

Published: 2026-06-10T01:51:31.418Z

Updated: 2026-06-10T01:51:31.418Z