Hanyong Lee

[논문리뷰] LLMArena: Assessing Capabilities of Large Language Models in Dynamic Multi-Agent Environments (ACL 2024)

7 minute read

대규모 언어 모델(LLM)의 새로운 벤치마크인 LLMArena를 소개하며, 이는 다중 에이전트 동적 환경에서 LLM의 다양한 능력을 평가할 수 있도록 설계되었다. 연구 결과, LLM은 완전한 자율 에이전트로 발전하는 데 있어 여전히 많은 개선이 필요하다고 강조한다.

[논문리뷰] Rethinking the Bounds of LLM Reasoning- Are Multi-Agent Discussions the Key? (ACL 2024)

13 minute read

최근 LLM(대형 언어 모델) 연구에서 다중 에이전트 토론이 추론 능력을 향상시킨다는 주장에 대한 재평가를 통해, 단일 에이전트 LLM이 강력한 프롬프트를 사용하면 다중 에이전트 방식과 비슷한 성능을 낼 수 있음을 보여 주었다.

[논문리뷰] Encouraging Divergent Thinking in Large Language Models through Multi-Agent Debate (EMNLP 2024)

6 minute read

현대의 대형 언어 모델(LLM)은 일반적인 언어 작업에서는 우수한 성능을 보이지만 복잡한 추론 작업에서는 여전히 어려움을 겪고 있으며, 이를 해결하기 위한 연구로 자기 반영(self-reflection) 전략이 제안된다. 하지만 이 연구에서는 자기 반영 방식이 ‘사고의 퇴화(Deg...

[논문리뷰] An Electoral Approach to Diversify LLM-based Multi-Agent Collective Decision-Making (EMNLP 2024)

14 minute read

현대의 대형 언어 모델들은 복잡한 문제 해결 및 집단 의사결정에서 협력적 시너지를 보여주고 있으며, 본 연구에서는 52개의 시스템을 조사하여 의사결정 방식의 다양성이 부족함을 발견했습니다. 이를 개선하기 위해 다양한 순위 선호 투표 메커니즘을 포함한 GEDI라는 모듈을 제안하며, ...

[논문리뷰] Aspect category sentiment analysis based on prompt-based learning with attention mechanism (Neurocomputing)

10 minute read

이 논문은 특정 측면의 감정 극성을 평가하는 세 가지 주요 구성 요소(측면 용어 추출, 측면 범주 탐지, 감정 분류)를 활용하여 새로운 프롬프트 기반 공동 모델(PBJM)을 제안합니다. 이 모델은 측면 범주 분석(ACSA) 작업을 개선하여 감정 분석의 정확성을 높이고, 기존 모델보...