Recent Posts

[논문리뷰] Strength Lies in Differences! Improving Strategy Planning for Non-collaborative Dialogues via Diversified User Simulation (EMNLP 2024)

9 minute read

이 논문에서는 시스템의 목표에 유리한 합의를 이끌어내기 위해 다양한 사용자와 전략적 대화를 수행하는 비협력적 대화 에이전트를 연구하고, 사용자 특성을 고려한 전략적 계획 및 일반화된 훈련을 위한 TRIP을 제안합니다. 실험을 통해 TRIP의 효과를 입증합니다.

[논문리뷰] PsySafe: A Comprehensive Framework for Psychological-based Attack, Defense, and Evaluation of Multi-agent System Safety (ACL 2024)

18 minute read

본 논문에서는 대규모 언어 모델(LLM)로 강화된 다중 에이전트 시스템의 안전 문제를 에이전트 심리학 관점에서 탐구하며, 어두운 성격 특성이 안전에 미치는 위협을 다루는 포괄적 프레임워크(PsySafe)를 제안합니다. 이를 통해 위험 행동, 심리적 평가와 행동 간의 관계를 분석하고...