[논문리뷰] Dialogue Systems for Emotional Support via Value Reinforcement (ACL 2025)
본 연구는 정서지원 대화 시스템에 가치 강화(value reinforcement)를 도입한 가치 주도 학습 방법을 제안한다. Reddit 데이터를 활용해 각 대화 턴에서 강화할 가치를 식별하고, 가치 강화를 통한 성능이 지원 기술, 감정 강도, 가치 강화 측면에서 우수함을 실험으로...
본 연구는 정서지원 대화 시스템에 가치 강화(value reinforcement)를 도입한 가치 주도 학습 방법을 제안한다. Reddit 데이터를 활용해 각 대화 턴에서 강화할 가치를 식별하고, 가치 강화를 통한 성능이 지원 기술, 감정 강도, 가치 강화 측면에서 우수함을 실험으로...
본 논문은 LLM이 스스로 미세조정 데이터를 생성하고 가중치를 지속적으로 업데이트하여 새로운 과제나 지식에 적응할 수 있도록 하는 Self-Adapting LLMs(SEAL) 프레임워크를 제안한다.
본 논문은 감정 모델링을 통합한 EAI 프레임워크를 제안하여 대형 언어 모델(LLM)의 윤리적 의사결정에 미치는 감정의 영향을 분석하고, 감정 편향이 LLM의 협력률 저하 등 인간과 다른 행동 양상을 초래함을 밝혀 LLM의 감정 정합성 평가 기준 마련의 필요성을 강조한다.
가상 시뮬레이션 환경에서 대화 에이전트의 자기감정이 대화 전략과 의사결정에 영향을 미쳐, 인간과 유사한 대화 행동과 자연스러운 의사결정 변화를 유도함을 밝혔다.
이 연구는 코드 표현을 활용해 행동의 선행 조건을 추론하고, 이를 바탕으로 정책의 행동 샘플링을 선행 조건에 맞게 조정하여 작업 지향 대화 및 텍스트월드 환경에서 적은 학습으로도 성능을 향상시키는 방법을 제안한다.