Posts by Tag

NLP

[논문리뷰] Native Sparse Attention- Hardware-Aligned and Natively Trainable Sparse Attention (ACL 2025)

15 minute read

NSA는 알고리즘·하드웨어 최적화를 결합한 natively trainable 희소 어텐션으로, 토큰을 거칠게 압축한 뒤 세밀히 선택하는 동적 계층적 전략으로 전역 맥락과 국소 정밀도를 동시에 보존합니다. 연산 집약도 균형 설계와 엔드투엔드 학습으로 사전학습 비용을 줄이면서도 Ful...

[논문리뷰] Language Models Resist Alignment- Evidence From Data Compression (ACL 2025)

21 minute read

이 논문은 대형 언어 모델의 정렬 파인튜닝이 실제로 견고한 효과를 가지는지 이론적·실험적으로 처음으로 조사한다. 실험을 통해 정렬된 후에도 모델이 사전학습 분포로 되돌아가려는 ‘엘라스티시티’를 확인하고, 압축 이론으로 파인튜닝이 정렬 효과를 더 크게 약화시킬 수 있음을 보이며, 모...

[논문리뷰] Fairness through Difference Awareness- Measuring Desired Group Discrimination in LLMs (ACL 2025)

12 minute read

본 논문은 알고리즘 공정성을 색맹적(집단 차이를 무시하는) 차별 회피에 의존하기보다 맥락에 따라 그룹 간 차이를 인지하는 차이 인식(diff awareness)을 제안한다. 설명적/규범적/상관적 벤치마크를 구분하고 여덟 가지 시나리오로 구성된 16k개 질문의 벤치마드를 통해 차이 ...

[논문리뷰] A Theory of Response Sampling in LLMs- Part Descriptive and Part Prescriptive (ACL 2025)

14 minute read

본 연구는 LLM이 자율 의사결정에서 방대한 행동 공간의 옵션을 샘플링하는 휴리스틱이 인간의 의사결정과 유사하게 Descriptive(통계적 규범)와 Prescriptive(내재된 이상적 규범)로 구성됨을 보여주고, 이러한 규범의 편향이 공중보건·경제 동향 등 다양한 현실 도메인에...

[논문리뷰] Self-Adapting Language Models (arXiv 2025)

13 minute read

본 논문은 LLM이 스스로 미세조정 데이터를 생성하고 가중치를 지속적으로 업데이트하여 새로운 과제나 지식에 적응할 수 있도록 하는 Self-Adapting LLMs(SEAL) 프레임워크를 제안한다.

[논문리뷰] Can Large Language Models be Good Emotional Supporter? Mitigating Preference Bias on Emotional Support Conversation (ACL 2024)

11 minute read

요약: 감정 지원 대화(ESC) 과제에서는 일상적인 대화를 통해 개인의 감정적 고통을 완화하는 것을 목표로 하며, 최근 대형 언어 모델(LLMs)이 효과적인 감정 지원을 제공하는 데 어려움을 겪고 있음을 분석하고, 특정 전략에 대한 선호가 효과적인 지원을 저해함을 밝혀냈다. 이 연...

[논문리뷰] ESCoT: Towards Interpretable Emotional Support Dialogue Systems (ACL 2024)

7 minute read

요약: 이 논문은 감정 지원 대화 시스템의 해석 가능성을 강화하기 위해 Emotion-Focused and Strategy-Driven Chain-of-Thought(ESCoT)라는 새로운 응답 생성 방안을 제안하고, 이를 통해 감정 식별 및 조절 과정을 모방하여 대화 데이터셋을 ...

[논문리뷰] Talk With Human-like Agents: Empathetic Dialogue Through Perceptible Acoustic Reception and Reaction (ACL 2024)

7 minute read

요약: 이 논문은 음성 인식을 통합하여 인간 의사소통의 뉘앙스를 이해하는 다중 모달 대화 시스템 ‘PerceptiveAgent’를 제안하며, 이를 통해 화자의 진정한 의도를 더 잘 파악하고 공감적인 반응을 생성하는 방법을 다룹니다.

[논문리뷰] DialogBench: Evaluating LLMs as Human-like Dialogue Systems (NAACL 2024)

9 minute read

요약: 본 논문에서는 대화 시스템의 인간 같은 특성을 평가하기 위한 12개의 대화 과제가 포함된 DialogBench라는 벤치마크를 제안하며, instruction tuning이 대형 언어 모델의 인간 유사성을 어느 정도 향상시키지만 여전히 개선 여지가 많음을 보여준다.

[논문리뷰] Towards Emotional Support Dialog Systems (ACL 2021)

15 minute read

요약: 이 논문에서는 정서적 지지 대화(ESC) 작업을 정의하고, 정서적 지원 대화 데이터셋(ESConv)을 구성하여 효과적인 정서적 지지를 제공하기 위한 대화 시스템 연구에 기여하고자 한다. 연구 결과, 지원 전략의 중요성을 강조하고 ESConv의 유용성을 보여준다.

[논문리뷰] A Model-agnostic Data Manipulation Method for Persona-based Dialogue Generation (ACL 2022)

5 minute read

요약: 이 논문은 대화 생성 모델에 개인화를 도입하기 위한 데이터 문제를 해결하기 위해, 효율적인 데이터 조작 방법을 제안하고, 이를 통해 생성 모델의 성능을 향상시키는 방법을 탐구한다.

[논문리뷰] FASTopic- Pretrained Transformer is a Fast, Adaptive, Stable, and Transferable Topic Model (NeurIPS 2024)

10 minute read

요약: 이 논문에서는 기존의 효율성, 안정성 및 효과성 문제를 해결하기 위해 빠르고 적응 가능하며 안정적이고 이전 가능성 높은 주제 모델인 FASTopic을 제안합니다. FASTopic은 데이터셋 내에서 문서 임베딩과 주제 및 단어 임베딩 간의 의미적 관계를 직접 모델링하여 잠재적...

[논문리뷰] TopicGPT- A Prompt-based Topic Modeling Framework (NAACL 2024)

14 minute read

요약: TopicGPT는 대형 언어 모델을 활용하여 텍스트에서 잠재적 주제를 발견하고, 인간의 분류와 더 잘 일치하며 해석 가능성을 높인 주제 모델링 프레임워크이다. 이 모델은 사용자가 주제를 보다 쉽게 지정하고 수정할 수 있도록 하여, 고품질의 해석 가능한 주제를 제공한다.

[논문리뷰] Towards Revealing the Mystery behind Chain of Thought- A Theoretical Perspective (NeurIPS 2023)

8 minute read

요약: 생각의 체인(Chain-of-Thought, CoT) 프롬프트가 대규모 언어 모델(LLM)의 수학 및 추론 과제 성능을 크게 향상시키는 방법과 이론적 기초를 탐구한 연구로, CoT를 사용하여 결정 문제와 기초 수학 문제 해결 능력을 분석하였다.

[논문리뷰] Ontologically Faithful Generation of Non-Player Character Dialogues (EMNLP 2024)

8 minute read

요약: KNUDGE는 비디오 게임 “The Outer Worlds”의 사이드 퀘스트 대화 데이터를 기반으로 한 언어 생성 데이터셋으로, 모델이 자연어로 명시된 퀘스트와 엔티티 사양을 반영한 대화 트리를 생성해야 하는 과제를 다룹니다. 연구 결과, 신경망 생성 모델이 competen...

[논문리뷰] Controllable Neural Dialogue Summarization with Personal Named Entity Planning (EMNLP 2021)

5 minute read

요약: 본 논문에서는 개인 이름 항목 계획을 통해 대화 요약을 유연하게 안내할 수 있는 제어 가능한 신경 생성 프레임워크를 제안하며, 요약 작업의 제약 문제를 해결하기 위한 정보 유형 및 초점을 조절합니다. 이 프레임워크는 일반적인 종합적 관점과 사용자 지정된 개인 이름 항목에 기...

[논문리뷰] BoB- BERT Over BERT for Training Persona-based Dialogue Models from Limited Personalized Data (ACL 2021)

6 minute read

요약: 대화 에이전트를 위한 일관된 페르소나 유지는 중요하며, 제한된 페르소나 데이터의 규모가 이에 대한 훈련의 장벽이 되고 있다. 본 연구에서는 BERT-over-BERT (BoB) 모델을 통해 페르소나 기반 대화 생성을 두 개의 하위 작업으로 분리하여 이러한 문제를 해결하고, ...

[논문리뷰] Building a Role Specified Open-Domain Dialogue System Leveraging Large-Scale Language Models (NAACL 2022)

7 minute read

요약: 최근 오픈 도메인 대화 모델의 발전에도 불구하고, 특정 역할을 유지하며 자연스럽게 대화할 수 있는 시스템 구축은 어려운 과제로, 본 연구에서는 이를 해결하기 위한 효율적인 데이터 수집 프레임워크를 제안하고, 다양한 아키텍처를 비교하여 역할 사양을 충족시키는 대화 모델을 개발...

[논문리뷰] Investigating the Personality Consistency in Quantized Role-Playing Dialogue Agents (EMNLP 2024)

5 minute read

요약: 이 연구는 양자화된 대형 언어 모델에서의 성격 특성 일관성을 탐구하며, 역할 놀이 시나리오에서 다중 상호작용 동안 할당된 성격의 안정성을 평가합니다. 성격 불일치를 해결하기 위한 비모수적 방법인 Think2를 제안하고, QRPDA의 일관성을 유지하는 데 효과적임을 입증합니다.

[Paper Review] Investigating the Personality Consistency in Quantized Role-Playing Dialogue Agents (EMNLP 2024)

6 minute read

Summary This study explores the personality trait consistency of quantized large language models (LLMs) and evaluates the stability of assigned personalities...

[논문리뷰] Evaluating Intention Detection Capability of Large Language Models in Persuasive Dialogues (ACL 2024)

10 minute read

요약: 본 연구는 대화의 맥락을 고려하여 설득적 다중 턴 대화에서 의도 탐지를 평가하기 위해 기존 데이터셋을 수정하고 새로운 데이터셋을 생성하여 대형 언어 모델(LLM)의 성능을 분석합니다.

[Paper Review] Evaluating Intention Detection Capability of Large Language Models in Persuasive Dialogues (ACL 2024)

12 minute read

Summary: The study explores intention detection in persuasive multi-turn dialogues using large language models, highlighting the importance of conversational...

[논문리뷰] BitAbuse: A Dataset of Visually Perturbed Texts for Defending Phishing Attacks (NAACL 2025 Findings)

7 minute read

요약: 본 연구에서는 시각적으로 변형된 텍스트를 포함한 실제 피싱 사례로 구성된 BitAbuse 데이터셋을 제안하며, 이를 통해 언어 모델의 성능을 향상시키고 적대적 공격 방어 연구를 지원하고자 한다.

[Paper Review] BitAbuse: A Dataset of Visually Perturbed Texts for Defending Phishing Attacks (NAACL 2025 Findings)

7 minute read

Summary: This study proposes the BitAbuse dataset, which comprises real phishing cases containing visually perturbed (VP) texts. The dataset aims to enhance ...

[논문리뷰] Evaluating the Ripple Effects of Knowledge Editing in Language Models (TACL 2024)

6 minute read

요약: 현대 언어 모델은 많은 사실적 지식을 포착하지만, 때때로 잘못된 정보가 생성될 수 있다. 본 연구에서는 이러한 사실 수정의 파급 효과를 평가하는 새로운 기준을 제안하고, 이를 통해 여러 수정 방법의 한계를 지적하였다.

[논문리뷰] Building Persona Consistent Dialogue Agents with Offline Reinforcement Learning (EMNLP 2023)

8 minute read

이 논문은 대화 시스템의 페르소나 일관성을 향상시키기 위해 기존 데이터로 비용 효율적인 훈련이 가능한 오프라인 강화학습(RL) 프레임워크를 제안하며, 자동화 및 인간 평가에서 높은 페르소나 일관성과 대화 품질을 입증한다.

[Paper Review] Building Persona Consistent Dialogue Agents with Offline Reinforcement Learning (EMNLP 2023)

13 minute read

This paper presents an offline reinforcement learning (RL) framework to enhance persona consistency in dialogue systems, combining the benefits of supervised...

[논문리뷰] Graph of Thoughts: Solving Elaborate Problems with Large Language Models (AAAI 2024)

8 minute read

요약: 대형 언어 모델(LLM)의 프롬프트 능력을 향상시키는 “Graph of Thoughts (GoT)” 프레임워크를 소개하며, 이는 LLM의 정보를 그래프 형태로 모델링하여 시너지 효과를 창출하고 다양한 작업에서 성능을 개선한다. GoT는 새로운 사고 변환을 확장할 수 있어 새...

[Paper Review] Graph of Thoughts: Solving Elaborate Problems with Large Language Models (AAAI 2024)

9 minute read

Summary: This paper introduces the Graph of Thoughts (GoT) framework, which enhances the prompt capabilities of large language models (LLMs) by modeling info...

[논문리뷰] Toolformer: Language models can teach themselves to use tools (NeurIPS 2023)

6 minute read

요약: 이 논문은 Toolformer라는 모델을 소개하며, 자기 지도 학습 방식(self-supervised approach)을 통해 외부 도구를 활용하여 작업 성능을 향상하는 방법을 배운다. Toolformer는 제로샷 성능(zero-shot performance)을 크게 개선하...

[Paper Review] Toolformer: Language models can teach themselves to use tools (NeurIPS 2023)

9 minute read

Summary: This paper introduces Toolformer, a model that learns to enhance task performance by utilizing external tools through a self-supervised approach. To...

[논문리뷰] Tree of Thoughts: Deliberate Problem Solving with Large Language Models (NeurIPS 2023)

9 minute read

요약: Chain-of-Thought(CoT) 접근법을 확장하여, LLM이 체계적인 문제 해결을 수행하도록 하는 Tree of Thoughts(ToT) 프레임워크를 제안한다.

[Paper Review] Tree of Thoughts: Deliberate Problem Solving with Large Language Models (NeurIPS 2023)

10 minute read

Summary: Expanding the Chain-of-Thought (CoT) approach, this paper proposes the Tree of Thoughts (ToT) framework to enable large language models (LLMs) to pe...

Back to Top ↑

Persona-based Dialogue

[논문리뷰] PicPersona-TOD: A Dataset for Personalizing Utterance Style in Task-Oriented Dialogue with Image Persona (NAACL 2025)

14 minute read

본 논문은 사용자 이미지 기반 페르소나를 활용해 개인 맞춤형 대화를 가능케 하는 PicPersona-TOD 데이터셋과, 이를 활용해 보다 자연스럽고 몰입감 있는 대화를 생성하는 NLG 모델 Pictor를 제안한다.

[논문리뷰] CharacterGPT: A Persona Reconstruction Framework for Role-Playing Agents (NAACL 2025)

8 minute read

CharacterGPT는 챕터별 소설 요약에서 인물 특성을 점진적으로 추출해 캐릭터 페르소나를 동적으로 재구성함으로써 일관된 역할 수행을 돕는 프레임워크이다.

[논문리뷰] PK-ICR- Persona-Knowledge Interactive Multi-Context Retrieval for Grounded Dialogue (EMNLP 2023)

7 minute read

대화 시스템에서 관련된 페르소나와 지식을 함께 식별하는 것이 중요하다는 점을 강조하며, 복잡한 다중 맥락 대화에서 효과적인 응답 생성을 위한 새로운 접근 방식을 제안한다. 새로운 기초 검색 방법과 함께, 데이터 증강과 관련된 난이도가 높은 부정 샘플에 대한 랭킹 성능을 측정하는 독...

[논문리뷰] Less is More: Learning to Refine Dialogue History for Personalized Dialogue Generation (NAACL 2022)

13 minute read

이 연구는 사용자 성격에 맞춘 대화 응답 생성을 위한 개인화 대화 시스템을 제안하며, 사용자 대화 이력을 정제하여 더 유용하고 정확한 정보를 추출함으로써 개인화 응답의 품질을 향상시키는 방법을 제시합니다. 실험 결과, 제안한 모델이 보다 정보가 풍부하고 개인화된 응답을 생성하는 데...

[논문리뷰] RECAP- Retrieval-Enhanced Context-Aware Prefix Encoder for Personalized Dialogue Response Generation (ACL 2023)

12 minute read

챗봇에 일관된 개성을 부여하는 것은 engaging한 대화를 위해 중요하지만 여전히 해결되지 않은 문제입니다. 본 연구에서는 개인화된 응답 생성을 위한 새로운 검색 기반 접근 방식을 제안하며, 대화 도메인 데이터로 훈련된 계층적 변환기 검색기와 컨텍스트 인식 전처리 인코더를 설계하...

[논문리뷰] PAED: Zero-Shot Persona Attribute Extraction in Dialogues (ACL 2023)

17 minute read

퍼소나 속성 추출은 개인화된 인간-컴퓨터 상호작용에 중요하며, 대화는 퍼소나 정보를 전달하는 주요 매체입니다. 본 연구는 신뢰할 수 있는 텍스트-레이블 매칭 기준을 활용하여 고품질 데이터를 생성하고, 대조 학습 및 생성 기반 모델을 통해 제로샷 퍼소나 속성 추출을 개선합니다. 결과...

[논문리뷰] Strength Lies in Differences! Improving Strategy Planning for Non-collaborative Dialogues via Diversified User Simulation (EMNLP 2024)

9 minute read

이 논문에서는 시스템의 목표에 유리한 합의를 이끌어내기 위해 다양한 사용자와 전략적 대화를 수행하는 비협력적 대화 에이전트를 연구하고, 사용자 특성을 고려한 전략적 계획 및 일반화된 훈련을 위한 TRIP을 제안합니다. 실험을 통해 TRIP의 효과를 입증합니다.

[논문리뷰] Building a Personalized Dialogue System with Prompt-Tuning (NAACL 2022)

7 minute read

이 연구에서는 캐릭터 설정에 기반한 일관된 응답을 제공하는 대화 시스템을 구축하며, 사전 훈련된 대형 언어 모델에 저비용의 프롬프트 튜닝 방식을 적용하여 자연스럽고 개인화된 응답을 생성할 수 있음을 보여준다.

[논문리뷰] MORPHEUS- Modeling Role from Personalized Dialogue History by Exploring and Utilizing Latent Space (EMNLP 2024)

11 minute read

개인화된 대화 생성(PDG)은 외부 역할 데이터 의존성을 줄이고 대화 기록에서 역할 정보를 추출하여 일반화된 역할 모델링을 가능하게 합니다. MORPHEUS는 잠재 공간에서 역할을 표현해 대화 기록 기반으로 개인화된 응답을 생성하며, 실험 결과 외부 데이터 없이도 효과적인 역할 정...

[논문리뷰] Red Teaming Language Models for Processing Contradictory Dialogues (EMNLP 2024)

11 minute read

대부분의 언어 모델이 대화 중 자기 모순을 일으키는 문제를 해결하기 위해, 이 연구는 모순적 대화 처리 작업을 통해 대화 내 모순적 발언을 탐지하고 수정하는 방법을 탐구합니다. 모순적 대화를 포함한 데이터셋을 개발하여 이러한 대화를 탐지 및 설명하고 수정하는 프레임워크를 제시하며,...

[논문리뷰] Towards Personalized Dialogue Without Pre-defined Profiles through In-Dialogue Learning (EMNLP 2024)

6 minute read

요약: 이 논문은 사전 정의된 프로필 없이 대화 내에서 페르소나 정보를 학습하는 IDL(In-Dialogue Learning) 프레임워크를 제안하며, 이를 통해 BLEU와 ROUGE 점수가 각각 최대 200%, 247% 향상됨을 보여줌.

[논문리뷰] A Model-agnostic Data Manipulation Method for Persona-based Dialogue Generation (ACL 2022)

5 minute read

요약: 이 논문은 대화 생성 모델에 개인화를 도입하기 위한 데이터 문제를 해결하기 위해, 효율적인 데이터 조작 방법을 제안하고, 이를 통해 생성 모델의 성능을 향상시키는 방법을 탐구한다.

[논문리뷰] Ontologically Faithful Generation of Non-Player Character Dialogues (EMNLP 2024)

8 minute read

요약: KNUDGE는 비디오 게임 “The Outer Worlds”의 사이드 퀘스트 대화 데이터를 기반으로 한 언어 생성 데이터셋으로, 모델이 자연어로 명시된 퀘스트와 엔티티 사양을 반영한 대화 트리를 생성해야 하는 과제를 다룹니다. 연구 결과, 신경망 생성 모델이 competen...

[논문리뷰] BoB- BERT Over BERT for Training Persona-based Dialogue Models from Limited Personalized Data (ACL 2021)

6 minute read

요약: 대화 에이전트를 위한 일관된 페르소나 유지는 중요하며, 제한된 페르소나 데이터의 규모가 이에 대한 훈련의 장벽이 되고 있다. 본 연구에서는 BERT-over-BERT (BoB) 모델을 통해 페르소나 기반 대화 생성을 두 개의 하위 작업으로 분리하여 이러한 문제를 해결하고, ...

[논문리뷰] Building a Role Specified Open-Domain Dialogue System Leveraging Large-Scale Language Models (NAACL 2022)

7 minute read

요약: 최근 오픈 도메인 대화 모델의 발전에도 불구하고, 특정 역할을 유지하며 자연스럽게 대화할 수 있는 시스템 구축은 어려운 과제로, 본 연구에서는 이를 해결하기 위한 효율적인 데이터 수집 프레임워크를 제안하고, 다양한 아키텍처를 비교하여 역할 사양을 충족시키는 대화 모델을 개발...

[논문리뷰] Investigating the Personality Consistency in Quantized Role-Playing Dialogue Agents (EMNLP 2024)

5 minute read

요약: 이 연구는 양자화된 대형 언어 모델에서의 성격 특성 일관성을 탐구하며, 역할 놀이 시나리오에서 다중 상호작용 동안 할당된 성격의 안정성을 평가합니다. 성격 불일치를 해결하기 위한 비모수적 방법인 Think2를 제안하고, QRPDA의 일관성을 유지하는 데 효과적임을 입증합니다.

[Paper Review] Investigating the Personality Consistency in Quantized Role-Playing Dialogue Agents (EMNLP 2024)

6 minute read

Summary This study explores the personality trait consistency of quantized large language models (LLMs) and evaluates the stability of assigned personalities...

[논문리뷰] Evaluating Intention Detection Capability of Large Language Models in Persuasive Dialogues (ACL 2024)

10 minute read

요약: 본 연구는 대화의 맥락을 고려하여 설득적 다중 턴 대화에서 의도 탐지를 평가하기 위해 기존 데이터셋을 수정하고 새로운 데이터셋을 생성하여 대형 언어 모델(LLM)의 성능을 분석합니다.

[Paper Review] Evaluating Intention Detection Capability of Large Language Models in Persuasive Dialogues (ACL 2024)

12 minute read

Summary: The study explores intention detection in persuasive multi-turn dialogues using large language models, highlighting the importance of conversational...

[논문리뷰] Building Persona Consistent Dialogue Agents with Offline Reinforcement Learning (EMNLP 2023)

8 minute read

이 논문은 대화 시스템의 페르소나 일관성을 향상시키기 위해 기존 데이터로 비용 효율적인 훈련이 가능한 오프라인 강화학습(RL) 프레임워크를 제안하며, 자동화 및 인간 평가에서 높은 페르소나 일관성과 대화 품질을 입증한다.

[Paper Review] Building Persona Consistent Dialogue Agents with Offline Reinforcement Learning (EMNLP 2023)

13 minute read

This paper presents an offline reinforcement learning (RL) framework to enhance persona consistency in dialogue systems, combining the benefits of supervised...

SimOAP: Improve Coherence and Consistency in Persona-based Dialogue Generation via Over-sampling and Post-evaluation

6 minute read

요약: 페르소나 기반의 대화 생성을 위한 간단하지만 효과적인 2단계 SimOAP의 오버 샘플링과 사후평가(Post-evaluation) 전략을 제안한다.

Back to Top ↑

LLM

[논문리뷰] A Theory of Response Sampling in LLMs- Part Descriptive and Part Prescriptive (ACL 2025)

14 minute read

본 연구는 LLM이 자율 의사결정에서 방대한 행동 공간의 옵션을 샘플링하는 휴리스틱이 인간의 의사결정과 유사하게 Descriptive(통계적 규범)와 Prescriptive(내재된 이상적 규범)로 구성됨을 보여주고, 이러한 규범의 편향이 공중보건·경제 동향 등 다양한 현실 도메인에...

[논문리뷰] TopicGPT- A Prompt-based Topic Modeling Framework (NAACL 2024)

14 minute read

요약: TopicGPT는 대형 언어 모델을 활용하여 텍스트에서 잠재적 주제를 발견하고, 인간의 분류와 더 잘 일치하며 해석 가능성을 높인 주제 모델링 프레임워크이다. 이 모델은 사용자가 주제를 보다 쉽게 지정하고 수정할 수 있도록 하여, 고품질의 해석 가능한 주제를 제공한다.

[논문리뷰] Evaluating the Ripple Effects of Knowledge Editing in Language Models (TACL 2024)

6 minute read

요약: 현대 언어 모델은 많은 사실적 지식을 포착하지만, 때때로 잘못된 정보가 생성될 수 있다. 본 연구에서는 이러한 사실 수정의 파급 효과를 평가하는 새로운 기준을 제안하고, 이를 통해 여러 수정 방법의 한계를 지적하였다.

[논문리뷰] Building Persona Consistent Dialogue Agents with Offline Reinforcement Learning (EMNLP 2023)

8 minute read

이 논문은 대화 시스템의 페르소나 일관성을 향상시키기 위해 기존 데이터로 비용 효율적인 훈련이 가능한 오프라인 강화학습(RL) 프레임워크를 제안하며, 자동화 및 인간 평가에서 높은 페르소나 일관성과 대화 품질을 입증한다.

[Paper Review] Building Persona Consistent Dialogue Agents with Offline Reinforcement Learning (EMNLP 2023)

13 minute read

This paper presents an offline reinforcement learning (RL) framework to enhance persona consistency in dialogue systems, combining the benefits of supervised...

[Langgraph] 이 에이전트는 10원으로 논문 요약해줍니다.

6 minute read

요약: Langgraph를 사용하여 논문을 자동으로 원하는 언어로 요약해주는 에이전트를 만들어보자.

[Langgraph] This agent summarizes research papers for $0.006.

7 minute read

Summary: Let’s build an agent using LangGraph that automatically summarizes research papers in the desired language.

[논문리뷰] Graph of Thoughts: Solving Elaborate Problems with Large Language Models (AAAI 2024)

8 minute read

요약: 대형 언어 모델(LLM)의 프롬프트 능력을 향상시키는 “Graph of Thoughts (GoT)” 프레임워크를 소개하며, 이는 LLM의 정보를 그래프 형태로 모델링하여 시너지 효과를 창출하고 다양한 작업에서 성능을 개선한다. GoT는 새로운 사고 변환을 확장할 수 있어 새...

[Paper Review] Graph of Thoughts: Solving Elaborate Problems with Large Language Models (AAAI 2024)

9 minute read

Summary: This paper introduces the Graph of Thoughts (GoT) framework, which enhances the prompt capabilities of large language models (LLMs) by modeling info...

[논문리뷰] Toolformer: Language models can teach themselves to use tools (NeurIPS 2023)

6 minute read

요약: 이 논문은 Toolformer라는 모델을 소개하며, 자기 지도 학습 방식(self-supervised approach)을 통해 외부 도구를 활용하여 작업 성능을 향상하는 방법을 배운다. Toolformer는 제로샷 성능(zero-shot performance)을 크게 개선하...

[Paper Review] Toolformer: Language models can teach themselves to use tools (NeurIPS 2023)

9 minute read

Summary: This paper introduces Toolformer, a model that learns to enhance task performance by utilizing external tools through a self-supervised approach. To...

[논문리뷰] Tree of Thoughts: Deliberate Problem Solving with Large Language Models (NeurIPS 2023)

9 minute read

요약: Chain-of-Thought(CoT) 접근법을 확장하여, LLM이 체계적인 문제 해결을 수행하도록 하는 Tree of Thoughts(ToT) 프레임워크를 제안한다.

[Paper Review] Tree of Thoughts: Deliberate Problem Solving with Large Language Models (NeurIPS 2023)

10 minute read

Summary: Expanding the Chain-of-Thought (CoT) approach, this paper proposes the Tree of Thoughts (ToT) framework to enable large language models (LLMs) to pe...

[Langgraph] ReAct agent 구현해보기

2 minute read

요약: ReAct Agent를 Langgraph로 구현해본다.

[Langgraph] Implementing a ReAct agent

3 minute read

Summary: Implementing a ReAct Agent with Langgraph

[논문리뷰] ReAct: Synergizing Reasoning and Acting in Language Models (ICLR 2023)

9 minute read

요약: 추론 추적(reasoning traces)과 작업별 행동(task-specific actions)을 교차적으로 생성하여 두 가지 간의 더 큰 시너지를 가능하게 하는 방법인 ReAct를 제안한다.

[Paper Review] ReAct: Synergizing Reasoning and Acting in Language Models (ICLR 2023)

11 minute read

Summary: They propose ReAct, a method that enables greater synergy between reasoning traces and task-specific actions by generating them in an interleaved ma...

Langgraph 문서번역 완료

less than 1 minute read

요약: 내가 개발한 코드 문서 자동 번역 에이전트를 사용하여 Langgraph의 문서 번역을 완료했다.

Langgraph Documentation Translation Completed

less than 1 minute read

Summary: I have completed the translation of Langgraph’s documentation using the code documentation auto-translation agent that I developed.

[Langgraph] Creating an Automatic Translation Agent for GitHub Code Documentation

11 minute read

summary: Sharing the experience of using Langgraph’s hierarchical model to build an automatic code documentation translation agent.

[Langgraph] Github 코드 문서 자동 번역 에이전트 제작

10 minute read

요약: 코드 문서 자동 번역 에이전트를 만들기 위해 Langgraph의 계층적 모델을 사용한 경험을 공유한다.

Back to Top ↑

Empathetic Dialogue Systems

[논문리뷰] Knowledge Enhanced Reflection Generation for Counseling Dialogues (ACL 2022)

9 minute read

이 논문은 상담 대화에서 상식 및 도메인 지식을 통합해 응답을 생성하는 방법을 제안하고, 검색 기반 및 COMET 생성 지식이 응답 품질 향상에 효과적임을 실험적으로 입증하였다.

[논문리뷰] KMI: A Dataset of Korean Motivational Interviewing Dialogues for Psychotherapy (NAACL 2025)

11 minute read

본 논문은 전문 치료사 지식을 반영한 동기면담(MI) 시뮬레이션 프레임워크를 통해 한국어 MI 대화 1,000건의 고품질 합성 데이터셋(KMI)을 생성하고, 이를 기반으로 한 대화 모델의 전문성과 실용성을 평가하였다.

[논문리뷰] SoulChat: Improving LLMs’ Empathy, Listening, and Comfort Abilities through Fine-tuning with Multi-turn Empathy Conversations (EMNLP 2023 Findings)

4 minute read

요약: 대용량 언어 모델(LLM)이 심리 상담 분야에 적용될 때, 사용자에게 공감과 신뢰를 제공하는 것이 중요하다는 점을 강조하며, 이를 위해 다중 회차 공감 대화 데이터셋을 구축하고, 실험을 통해 LLM의 공감 능력을 향상시킬 수 있음을 보여주었다.

[논문리뷰] MISC- A Mixed Strategy-Aware Model integrating COMET for Emotional Support Conversation (ACL 2022)

12 minute read

요약: 이 논문에서는 감정 지원 대화에서 기존 방법의 한계를 극복하기 위해 사용자의 세밀한 감정 상태를 추론하고, 다양한 전략을 혼합하여 응답하는 새로운 모델 MISC를 제안하며, 실험 결과 이 방법의 효과성을 입증하였다.

[논문리뷰] Cem: Commonsense-aware empathetic response generation (AAAI 2022)

5 minute read

요약: 본 논문은 공감 능력을 활용한 대화 시스템을 위한 새로운 접근법인 ‘Commonsense-aware Empathetic Chatting Machine (CEM)’을 제안하며, 이는 사용자 상황에 대한 인지를 통해 보다 정보적이고 공감적인 반응을 생성하는 데 중점을 둡니다. ...

[논문리뷰] Let’s Go Real Talk- Spoken Dialogue Model for Face-to-Face Conversation (ACL 2024)

15 minute read

요약: 이 논문에서는 음성 및 시각 정보를 처리하여 오디오-비주얼 대화를 생성하는 새로운 Face-to-Face 대화 모델과 340시간 분량의 대화 데이터로 구성된 MultiDialog 코퍼스를 소개합니다. 이를 통해 중간 텍스트 없이 아바타 챗봇 시스템의 개발에 대한 기초 작업을...

[논문리뷰] Facilitating Multi-turn Emotional Support Conversation with Positive Emotion Elicitation- A Reinforcement Learning Approach (ACL 2023)

7 minute read

요약: 본 연구는 다중 대화에서 긍정적인 감정 유도를 형식화하고, 대화 일관성을 유지하면서 감정 지원을 제공하는 새로운 패러다임과 이를 위한 모델 SUPPORTER를 제안한다.

[논문리뷰] ESC-Eval: Evaluating Emotion Support Conversations in Large Language Models (EMNLP 2024)

11 minute read

요약: 감정 지원 대화(ESC)는 인간의 스트레스를 줄이고 정서적 지도를 제공하여 정신적 및 신체적 웰빙을 향상시키는 데 중요한 응용 프로그램이다. 본 연구에서는 역할 놀이 에이전트를 활용하여 ESC 모델의 평가 프레임워크인 ESC-Eval을 제안하고, 이를 통해 여러 LLM의 E...

[논문리뷰] Improving Multi-turn Emotional Support Dialogue Generation with Lookahead Strategy Planning (EMNLP 2022)

7 minute read

요약: 본 연구에서는 정서적 지원(ES) 대화 시스템의 다중 턴 상호작용을 위한 새로운 시스템인 MultiESC를 제안하며, 효과적인 지원 전략 계획과 사용자 상태의 동적 모델링을 통해 성능을 크게 향상시킨다는 내용을 다룬다.

[논문리뷰] E-CORE: Emotion Correlation Enhanced Empathetic Dialogue Generation (EMNLP 2023)

14 minute read

요약: 이 논문에서는 감정 상관관계를 고려한 새로운 공감적 대화 생성 프레임워크를 제안하여, 감정 인식과 반응 생성의 정확성을 개선하고 이를 통해 보다 인간적인 대화 시스템을 구현하는 방법을 다룹니다.

[논문리뷰] Knowledge-enhanced Mixed-initiative Dialogue System for Emotional Support Conversations (ACL 2023)

8 minute read

요약: 본 연구는 감정 지원 대화에서 사용자와 시스템이 모두 주도권을 가지는 혼합 주도형 시스템에 대한 분석을 수행하고, 이를 위한 지식 강화 혼합 주도형 프레임워크(KEMI)를 제안하여 효과성을 입증한다.

[논문리뷰] Can Large Language Models be Good Emotional Supporter? Mitigating Preference Bias on Emotional Support Conversation (ACL 2024)

11 minute read

요약: 감정 지원 대화(ESC) 과제에서는 일상적인 대화를 통해 개인의 감정적 고통을 완화하는 것을 목표로 하며, 최근 대형 언어 모델(LLMs)이 효과적인 감정 지원을 제공하는 데 어려움을 겪고 있음을 분석하고, 특정 전략에 대한 선호가 효과적인 지원을 저해함을 밝혀냈다. 이 연...

[논문리뷰] ESCoT: Towards Interpretable Emotional Support Dialogue Systems (ACL 2024)

7 minute read

요약: 이 논문은 감정 지원 대화 시스템의 해석 가능성을 강화하기 위해 Emotion-Focused and Strategy-Driven Chain-of-Thought(ESCoT)라는 새로운 응답 생성 방안을 제안하고, 이를 통해 감정 식별 및 조절 과정을 모방하여 대화 데이터셋을 ...

[논문리뷰] Talk With Human-like Agents: Empathetic Dialogue Through Perceptible Acoustic Reception and Reaction (ACL 2024)

7 minute read

요약: 이 논문은 음성 인식을 통합하여 인간 의사소통의 뉘앙스를 이해하는 다중 모달 대화 시스템 ‘PerceptiveAgent’를 제안하며, 이를 통해 화자의 진정한 의도를 더 잘 파악하고 공감적인 반응을 생성하는 방법을 다룹니다.

[논문리뷰] Towards Emotional Support Dialog Systems (ACL 2021)

15 minute read

요약: 이 논문에서는 정서적 지지 대화(ESC) 작업을 정의하고, 정서적 지원 대화 데이터셋(ESConv)을 구성하여 효과적인 정서적 지지를 제공하기 위한 대화 시스템 연구에 기여하고자 한다. 연구 결과, 지원 전략의 중요성을 강조하고 ESConv의 유용성을 보여준다.

Back to Top ↑

Agents

[Langgraph] 이 에이전트는 10원으로 논문 요약해줍니다.

6 minute read

요약: Langgraph를 사용하여 논문을 자동으로 원하는 언어로 요약해주는 에이전트를 만들어보자.

[Langgraph] This agent summarizes research papers for $0.006.

7 minute read

Summary: Let’s build an agent using LangGraph that automatically summarizes research papers in the desired language.

[Langgraph] ReAct agent 구현해보기

2 minute read

요약: ReAct Agent를 Langgraph로 구현해본다.

[Langgraph] Implementing a ReAct agent

3 minute read

Summary: Implementing a ReAct Agent with Langgraph

[논문리뷰] ReAct: Synergizing Reasoning and Acting in Language Models (ICLR 2023)

9 minute read

요약: 추론 추적(reasoning traces)과 작업별 행동(task-specific actions)을 교차적으로 생성하여 두 가지 간의 더 큰 시너지를 가능하게 하는 방법인 ReAct를 제안한다.

[Paper Review] ReAct: Synergizing Reasoning and Acting in Language Models (ICLR 2023)

11 minute read

Summary: They propose ReAct, a method that enables greater synergy between reasoning traces and task-specific actions by generating them in an interleaved ma...

Langgraph 문서번역 완료

less than 1 minute read

요약: 내가 개발한 코드 문서 자동 번역 에이전트를 사용하여 Langgraph의 문서 번역을 완료했다.

Langgraph Documentation Translation Completed

less than 1 minute read

Summary: I have completed the translation of Langgraph’s documentation using the code documentation auto-translation agent that I developed.

[Langgraph] Creating an Automatic Translation Agent for GitHub Code Documentation

11 minute read

summary: Sharing the experience of using Langgraph’s hierarchical model to build an automatic code documentation translation agent.

[Langgraph] Github 코드 문서 자동 번역 에이전트 제작

10 minute read

요약: 코드 문서 자동 번역 에이전트를 만들기 위해 Langgraph의 계층적 모델을 사용한 경험을 공유한다.

Back to Top ↑

EMNLP 2024

[논문리뷰] MORPHEUS- Modeling Role from Personalized Dialogue History by Exploring and Utilizing Latent Space (EMNLP 2024)

13 minute read

개인화된 대화 생성(PDG)은 역할이나 페르소나에 따라 일관된 응답을 생성하는 것을 목표로 하며, 기존 방법은 외부 역할 데이터에 의존해 민감한 문제를 일으킬 수 있습니다. 이를 해결하기 위해 우리는 대화 이력에서 역할 정보를 추출하고, 잠재 공간에서 역할을 효과적으로 모델링하는 ...

[논문리뷰] Strength Lies in Differences! Improving Strategy Planning for Non-collaborative Dialogues via Diversified User Simulation (EMNLP 2024)

9 minute read

이 논문에서는 시스템의 목표에 유리한 합의를 이끌어내기 위해 다양한 사용자와 전략적 대화를 수행하는 비협력적 대화 에이전트를 연구하고, 사용자 특성을 고려한 전략적 계획 및 일반화된 훈련을 위한 TRIP을 제안합니다. 실험을 통해 TRIP의 효과를 입증합니다.

[논문리뷰] Encouraging Divergent Thinking in Large Language Models through Multi-Agent Debate (EMNLP 2024)

6 minute read

현대의 대형 언어 모델(LLM)은 일반적인 언어 작업에서는 우수한 성능을 보이지만 복잡한 추론 작업에서는 여전히 어려움을 겪고 있으며, 이를 해결하기 위한 연구로 자기 반영(self-reflection) 전략이 제안된다. 하지만 이 연구에서는 자기 반영 방식이 ‘사고의 퇴화(Deg...

[논문리뷰] An Electoral Approach to Diversify LLM-based Multi-Agent Collective Decision-Making (EMNLP 2024)

14 minute read

현대의 대형 언어 모델들은 복잡한 문제 해결 및 집단 의사결정에서 협력적 시너지를 보여주고 있으며, 본 연구에서는 52개의 시스템을 조사하여 의사결정 방식의 다양성이 부족함을 발견했습니다. 이를 개선하기 위해 다양한 순위 선호 투표 메커니즘을 포함한 GEDI라는 모듈을 제안하며, ...

[논문리뷰] MORPHEUS- Modeling Role from Personalized Dialogue History by Exploring and Utilizing Latent Space (EMNLP 2024)

11 minute read

개인화된 대화 생성(PDG)은 외부 역할 데이터 의존성을 줄이고 대화 기록에서 역할 정보를 추출하여 일반화된 역할 모델링을 가능하게 합니다. MORPHEUS는 잠재 공간에서 역할을 표현해 대화 기록 기반으로 개인화된 응답을 생성하며, 실험 결과 외부 데이터 없이도 효과적인 역할 정...

[논문리뷰] Red Teaming Language Models for Processing Contradictory Dialogues (EMNLP 2024)

11 minute read

대부분의 언어 모델이 대화 중 자기 모순을 일으키는 문제를 해결하기 위해, 이 연구는 모순적 대화 처리 작업을 통해 대화 내 모순적 발언을 탐지하고 수정하는 방법을 탐구합니다. 모순적 대화를 포함한 데이터셋을 개발하여 이러한 대화를 탐지 및 설명하고 수정하는 프레임워크를 제시하며,...

[논문리뷰] ESC-Eval: Evaluating Emotion Support Conversations in Large Language Models (EMNLP 2024)

11 minute read

요약: 감정 지원 대화(ESC)는 인간의 스트레스를 줄이고 정서적 지도를 제공하여 정신적 및 신체적 웰빙을 향상시키는 데 중요한 응용 프로그램이다. 본 연구에서는 역할 놀이 에이전트를 활용하여 ESC 모델의 평가 프레임워크인 ESC-Eval을 제안하고, 이를 통해 여러 LLM의 E...

[논문리뷰] Ontologically Faithful Generation of Non-Player Character Dialogues (EMNLP 2024)

8 minute read

요약: KNUDGE는 비디오 게임 “The Outer Worlds”의 사이드 퀘스트 대화 데이터를 기반으로 한 언어 생성 데이터셋으로, 모델이 자연어로 명시된 퀘스트와 엔티티 사양을 반영한 대화 트리를 생성해야 하는 과제를 다룹니다. 연구 결과, 신경망 생성 모델이 competen...

[논문리뷰] Investigating the Personality Consistency in Quantized Role-Playing Dialogue Agents (EMNLP 2024)

5 minute read

요약: 이 연구는 양자화된 대형 언어 모델에서의 성격 특성 일관성을 탐구하며, 역할 놀이 시나리오에서 다중 상호작용 동안 할당된 성격의 안정성을 평가합니다. 성격 불일치를 해결하기 위한 비모수적 방법인 Think2를 제안하고, QRPDA의 일관성을 유지하는 데 효과적임을 입증합니다.

[Paper Review] Investigating the Personality Consistency in Quantized Role-Playing Dialogue Agents (EMNLP 2024)

6 minute read

Summary This study explores the personality trait consistency of quantized large language models (LLMs) and evaluates the stability of assigned personalities...

Back to Top ↑

Decision Making

[논문리뷰] A Theory of Response Sampling in LLMs- Part Descriptive and Part Prescriptive (ACL 2025)

14 minute read

본 연구는 LLM이 자율 의사결정에서 방대한 행동 공간의 옵션을 샘플링하는 휴리스틱이 인간의 의사결정과 유사하게 Descriptive(통계적 규범)와 Prescriptive(내재된 이상적 규범)로 구성됨을 보여주고, 이러한 규범의 편향이 공중보건·경제 동향 등 다양한 현실 도메인에...

[논문리뷰] EAI: Emotional Decision-Making of LLMs in Strategic Games and Ethical Dilemmas (NeurIPS 2024)

19 minute read

본 논문은 감정 모델링을 통합한 EAI 프레임워크를 제안하여 대형 언어 모델(LLM)의 윤리적 의사결정에 미치는 감정의 영향을 분석하고, 감정 편향이 LLM의 협력률 저하 등 인간과 다른 행동 양상을 초래함을 밝혀 LLM의 감정 정합성 평가 기준 마련의 필요성을 강조한다.

[논문리뷰] Self-Emotion Blended Dialogue Generation in Social Simulation Agents (SIGDIAL 2024)

12 minute read

가상 시뮬레이션 환경에서 대화 에이전트의 자기감정이 대화 전략과 의사결정에 영향을 미쳐, 인간과 유사한 대화 행동과 자연스러운 의사결정 변화를 유도함을 밝혔다.

[논문리뷰] Code Models are Zero-shot Precondition Reasoners (NAACL 2024)

14 minute read

이 연구는 코드 표현을 활용해 행동의 선행 조건을 추론하고, 이를 바탕으로 정책의 행동 샘플링을 선행 조건에 맞게 조정하여 작업 지향 대화 및 텍스트월드 환경에서 적은 학습으로도 성능을 향상시키는 방법을 제안한다.

[논문리뷰] Embodied Agent Interface- Benchmarking LLMs for Embodied Decision Making (NeurIPS 2024)

16 minute read

본 논문은 다양한 과제와 평가 지표를 통합한 EMBODIED AGENT INTERFACE를 제안하여, 대형 언어 모델(LLM)의 신체화된 의사결정 능력을 세부적으로 평가하고 장단점을 분석한다.

[논문리뷰] WhodunitBench: Evaluating Large Multimodal Agents via Murder Mystery Games (NeurIPS 2024)

11 minute read

본 논문에서는 실제 상황에서 요구되는 복합적 멀티모달 추론 및 행동 평가를 위해 살인 미스터리 게임 기반의 동적 환경 평가 벤치마크인 WhodunitBench를 제안하였으며, 이를 통해 현재 대형 멀티모달 에이전트들의 한계를 분석하였다.

[논문리뷰] Can large language models explore in-context? (NeurIPS 2024)

13 minute read

현존하는 대형 언어 모델들은 별도의 학습 없이 기본 성능만으로는 강화학습의 핵심인 탐험 능력을 잘 수행하지 못하며, 효과적인 탐험을 위해서는 외부 요약 등 비단순한 알고리즘적 개입이 필요함을 보였다.

[논문리뷰] Inference and Learning in Dynamic Decision Networks Using Knowledge Compilation (AAAI 2024)

19 minute read

본 논문은 동적 환경에서 불확실성을 고려한 의사결정 문제를 다루며, 동적 결정 네트워크(DDN)에 대해 벨만 업데이트를 지식 컴파일하여 미분 가능한 동적 결정 회로를 생성하고 이를 통해 기울기 기반 학습을 수행하는 새로운 알고리즘 mapl-cirup을 제안한다.

[논문리뷰] Capturing Human Cognitive Styles with Language: Towards an Experimental Evaluation Paradigm (NAACL 2025)

10 minute read

본 논문은 언어 기반 인지 스타일 모델을 인간 행동 실험과 비교 평가하는 체계적 실험 프레임워크를 제안하며, 언어 특징을 통해 개인의 의사결정 스타일을 상당히 정확히 예측할 수 있음을 보여준다.

[논문리뷰] EmoDynamiX: Emotional Support Dialogue Strategy Prediction by Modelling MiXed Emotions and Discourse Dynamics (NAACL 2025)

13 minute read

본 논문은 정서적 지원 대화 시스템의 투명성과 성능 향상을 위해 전략 예측과 언어 생성을 분리하고, 사용자 감정과 시스템 전략 간 상호작용을 그래프로 모델링하는 EmoDynamiX 프레임워크를 제안한다.

Back to Top ↑

ACL 2024

[논문리뷰] PsySafe: A Comprehensive Framework for Psychological-based Attack, Defense, and Evaluation of Multi-agent System Safety (ACL 2024)

18 minute read

본 논문에서는 대규모 언어 모델(LLM)로 강화된 다중 에이전트 시스템의 안전 문제를 에이전트 심리학 관점에서 탐구하며, 어두운 성격 특성이 안전에 미치는 위협을 다루는 포괄적 프레임워크(PsySafe)를 제안합니다. 이를 통해 위험 행동, 심리적 평가와 행동 간의 관계를 분석하고...

[논문리뷰] LLMArena: Assessing Capabilities of Large Language Models in Dynamic Multi-Agent Environments (ACL 2024)

7 minute read

대규모 언어 모델(LLM)의 새로운 벤치마크인 LLMArena를 소개하며, 이는 다중 에이전트 동적 환경에서 LLM의 다양한 능력을 평가할 수 있도록 설계되었다. 연구 결과, LLM은 완전한 자율 에이전트로 발전하는 데 있어 여전히 많은 개선이 필요하다고 강조한다.

[논문리뷰] Rethinking the Bounds of LLM Reasoning- Are Multi-Agent Discussions the Key? (ACL 2024)

13 minute read

최근 LLM(대형 언어 모델) 연구에서 다중 에이전트 토론이 추론 능력을 향상시킨다는 주장에 대한 재평가를 통해, 단일 에이전트 LLM이 강력한 프롬프트를 사용하면 다중 에이전트 방식과 비슷한 성능을 낼 수 있음을 보여 주었다.

[논문리뷰] Let’s Go Real Talk- Spoken Dialogue Model for Face-to-Face Conversation (ACL 2024)

15 minute read

요약: 이 논문에서는 음성 및 시각 정보를 처리하여 오디오-비주얼 대화를 생성하는 새로운 Face-to-Face 대화 모델과 340시간 분량의 대화 데이터로 구성된 MultiDialog 코퍼스를 소개합니다. 이를 통해 중간 텍스트 없이 아바타 챗봇 시스템의 개발에 대한 기초 작업을...

[논문리뷰] Can Large Language Models be Good Emotional Supporter? Mitigating Preference Bias on Emotional Support Conversation (ACL 2024)

11 minute read

요약: 감정 지원 대화(ESC) 과제에서는 일상적인 대화를 통해 개인의 감정적 고통을 완화하는 것을 목표로 하며, 최근 대형 언어 모델(LLMs)이 효과적인 감정 지원을 제공하는 데 어려움을 겪고 있음을 분석하고, 특정 전략에 대한 선호가 효과적인 지원을 저해함을 밝혀냈다. 이 연...

[논문리뷰] ESCoT: Towards Interpretable Emotional Support Dialogue Systems (ACL 2024)

7 minute read

요약: 이 논문은 감정 지원 대화 시스템의 해석 가능성을 강화하기 위해 Emotion-Focused and Strategy-Driven Chain-of-Thought(ESCoT)라는 새로운 응답 생성 방안을 제안하고, 이를 통해 감정 식별 및 조절 과정을 모방하여 대화 데이터셋을 ...

[논문리뷰] Talk With Human-like Agents: Empathetic Dialogue Through Perceptible Acoustic Reception and Reaction (ACL 2024)

7 minute read

요약: 이 논문은 음성 인식을 통합하여 인간 의사소통의 뉘앙스를 이해하는 다중 모달 대화 시스템 ‘PerceptiveAgent’를 제안하며, 이를 통해 화자의 진정한 의도를 더 잘 파악하고 공감적인 반응을 생성하는 방법을 다룹니다.

[논문리뷰] Evaluating Intention Detection Capability of Large Language Models in Persuasive Dialogues (ACL 2024)

10 minute read

요약: 본 연구는 대화의 맥락을 고려하여 설득적 다중 턴 대화에서 의도 탐지를 평가하기 위해 기존 데이터셋을 수정하고 새로운 데이터셋을 생성하여 대형 언어 모델(LLM)의 성능을 분석합니다.

[Paper Review] Evaluating Intention Detection Capability of Large Language Models in Persuasive Dialogues (ACL 2024)

12 minute read

Summary: The study explores intention detection in persuasive multi-turn dialogues using large language models, highlighting the importance of conversational...

Back to Top ↑

Langgraph

[Langgraph] 이 에이전트는 10원으로 논문 요약해줍니다.

6 minute read

요약: Langgraph를 사용하여 논문을 자동으로 원하는 언어로 요약해주는 에이전트를 만들어보자.

[Langgraph] This agent summarizes research papers for $0.006.

7 minute read

Summary: Let’s build an agent using LangGraph that automatically summarizes research papers in the desired language.

[Langgraph] ReAct agent 구현해보기

2 minute read

요약: ReAct Agent를 Langgraph로 구현해본다.

[Langgraph] Implementing a ReAct agent

3 minute read

Summary: Implementing a ReAct Agent with Langgraph

Langgraph 문서번역 완료

less than 1 minute read

요약: 내가 개발한 코드 문서 자동 번역 에이전트를 사용하여 Langgraph의 문서 번역을 완료했다.

Langgraph Documentation Translation Completed

less than 1 minute read

Summary: I have completed the translation of Langgraph’s documentation using the code documentation auto-translation agent that I developed.

[Langgraph] Creating an Automatic Translation Agent for GitHub Code Documentation

11 minute read

summary: Sharing the experience of using Langgraph’s hierarchical model to build an automatic code documentation translation agent.

[Langgraph] Github 코드 문서 자동 번역 에이전트 제작

10 minute read

요약: 코드 문서 자동 번역 에이전트를 만들기 위해 Langgraph의 계층적 모델을 사용한 경험을 공유한다.

Back to Top ↑

Multi-agent

[논문리뷰] MetaGPT- Meta Programming for A Multi-Agent Collaborative Framework (ICLR 2024)

5 minute read

MetaGPT는 인간의 표준 운영 절차(SOPs)를 활용해 역할별 에이전트 간 협업을 체계화하고, 구조화된 출력물 기반의 메타프로그래밍을 통해 소프트웨어 개발 자동화를 고도화하여, 코드 생성 품질과 작업 완료율에서 최첨단 성능을 보이는 LLM 기반 다중 에이전트 협업 프레임워크이다.

[논문리뷰] Theory of Mind for Multi-Agent Collaboration via Large Language Models (EMNLP 2023)

15 minute read

본 연구는 대형언어모델(LLM) 기반 에이전트의 다중 에이전트 협력 및 마음 이론(ToM) 추론 능력을 평가하고, 명시적 신념 상태 표현이 성능과 ToM 정확성을 향상시킨다는 점을 밝혔다.

[논문리뷰] CAMEL: Communicative Agents for “Mind” Exploration of Large Language Model Society (NeurIPS 2023)

9 minute read

이 논문은 대화형 언어 모델이 복잡한 작업 수행에서 성공하기 위해 인간의 입력에 의존하는 문제를 해결하기 위해, 역할 놀이 기반의 새로운 대화형 에이전트 프레임워크를 제안하고 자율적인 협력 기술을 개발하는 방법을 탐구합니다.

[논문리뷰] Large language model based multi-agents- A survey of progress and challenges (IJCAI 2024)

12 minute read

본 논문은 대규모 언어 모델(LLM)을 기반으로 한 다중 에이전트 시스템의 발전을 다루며, 이 시스템들이 복잡한 문제 해결과 세계 시뮬레이션에서의 역할, 에이전트의 프로파일링 및 커뮤니케이션 방법, 그리고 기술 개발 방식 등을 논의합니다. 또한, 관련 데이터셋과 벤치마크를 요약하고...

[논문리뷰] PsySafe: A Comprehensive Framework for Psychological-based Attack, Defense, and Evaluation of Multi-agent System Safety (ACL 2024)

18 minute read

본 논문에서는 대규모 언어 모델(LLM)로 강화된 다중 에이전트 시스템의 안전 문제를 에이전트 심리학 관점에서 탐구하며, 어두운 성격 특성이 안전에 미치는 위협을 다루는 포괄적 프레임워크(PsySafe)를 제안합니다. 이를 통해 위험 행동, 심리적 평가와 행동 간의 관계를 분석하고...

[논문리뷰] LLMArena: Assessing Capabilities of Large Language Models in Dynamic Multi-Agent Environments (ACL 2024)

7 minute read

대규모 언어 모델(LLM)의 새로운 벤치마크인 LLMArena를 소개하며, 이는 다중 에이전트 동적 환경에서 LLM의 다양한 능력을 평가할 수 있도록 설계되었다. 연구 결과, LLM은 완전한 자율 에이전트로 발전하는 데 있어 여전히 많은 개선이 필요하다고 강조한다.

[논문리뷰] Encouraging Divergent Thinking in Large Language Models through Multi-Agent Debate (EMNLP 2024)

6 minute read

현대의 대형 언어 모델(LLM)은 일반적인 언어 작업에서는 우수한 성능을 보이지만 복잡한 추론 작업에서는 여전히 어려움을 겪고 있으며, 이를 해결하기 위한 연구로 자기 반영(self-reflection) 전략이 제안된다. 하지만 이 연구에서는 자기 반영 방식이 ‘사고의 퇴화(Deg...

[논문리뷰] An Electoral Approach to Diversify LLM-based Multi-Agent Collective Decision-Making (EMNLP 2024)

14 minute read

현대의 대형 언어 모델들은 복잡한 문제 해결 및 집단 의사결정에서 협력적 시너지를 보여주고 있으며, 본 연구에서는 52개의 시스템을 조사하여 의사결정 방식의 다양성이 부족함을 발견했습니다. 이를 개선하기 위해 다양한 순위 선호 투표 메커니즘을 포함한 GEDI라는 모듈을 제안하며, ...

Back to Top ↑

LLM in Game Theory

[논문리뷰] EAI: Emotional Decision-Making of LLMs in Strategic Games and Ethical Dilemmas (NeurIPS 2024)

19 minute read

본 논문은 감정 모델링을 통합한 EAI 프레임워크를 제안하여 대형 언어 모델(LLM)의 윤리적 의사결정에 미치는 감정의 영향을 분석하고, 감정 편향이 LLM의 협력률 저하 등 인간과 다른 행동 양상을 초래함을 밝혀 LLM의 감정 정합성 평가 기준 마련의 필요성을 강조한다.

[논문리뷰] Do LLM Agents Have Regret? A Case Study in Online Learning and Games (ICLR 2021)

2 minute read

LLM 기반 에이전트가 반복 게임 및 온라인 학습 상황에서 후회(regret) 를 줄이는 방향으로 학습 또는 추론할 수 있는지를 실증적으로 검증하고, 실패하는 경우를 탐색하며, 이를 개선할 수 있는 새로운 훈련 기법(regret-loss)을 제안함.

[논문리뷰] Large Language Models as Simulated Economic Agents (NBER 2023)

15 minute read

새롭게 개발된 대형 언어 모델(LLM)은 인간의 암묵적 계산모델로, 경제학의 호모 이코노미쿠스처럼 시뮬레이션을 통해 인간 행동을 탐구하고 사회과학 연구의 초기 실험 도구로 활용될 수 있다.

[논문리뷰] Playing repeated games with Large Language Models (Nature 2025)

16 minute read

GPT-4, text-davinci-002, text-davinci-003, Claude 2, 그리고 Llama 2 70B 모델을 사용하여 다양한 2 × 2 게임을 평가함. 두 가지 특정 게임에 대해, 모든 LLM과 인간과 유사한 전략들이 서로 대결하도록 설정함. 연구...

[논문리뷰] Competing Large Language Models in Multi-Agent Gaming Environments (ICLR 2021)

13 minute read

본 논문은 기존의 2인 게임 중심 평가의 한계를 극복하고, 다중 에이전트 환경에서 LLM의 게임 능력을 정량적으로 평가하는 GAMA(γ)-Bench 프레임워크를 제안하여, LLM들의 강인성, 일반화 능력 및 전략 개선 가능성을 종합적으로 분석하였다.

[논문리뷰] ALYMPICS- LLM Agents Meet Game Theory (COLING 2025)

14 minute read

본 논문은 대규모 언어 모델(LLM) 에이전트를 활용한 게임 이론 연구를 위한 체계적 플랫폼 ‘Alympics’를 제안하며, 이를 통해 복잡한 전략적 상호작용을 시뮬레이션하고 분석하는 방법을 제시한다.

[논문리뷰] Can Large Language Models Serve as Rational Players in Game Theory? A Systematic Analysis (AAAI 2024)

8 minute read

본 연구는 게임 이론의 핵심 원리인 합리성을 기준으로 대형 언어 모델(LLM)의 행동을 분석한 결과, 최신 LLM도 인간과 상당한 차이를 보여 사회과학 게임 실험에 LLM을 도입할 때 신중한 접근이 필요함을 제시한다.

[논문리뷰] K-Level Reasoning: Establishing Higher Order Beliefs in Large Language Models for Strategic Reasoning (NAACL 2025)

13 minute read

본 논문은 게임 이론의 Level-K 프레임워크를 기반으로, 대규모 언어 모델이 다른 에이전트의 관점과 행동을 재귀적으로 추론하며 전략적 깊이를 확장할 수 있는 K-R 프레임워크를 제안하여, 다중 에이전트 환경에서의 전략적 추론 성능을 향상시켰다.

Back to Top ↑

Dataset Construction

[논문리뷰] PicPersona-TOD: A Dataset for Personalizing Utterance Style in Task-Oriented Dialogue with Image Persona (NAACL 2025)

14 minute read

본 논문은 사용자 이미지 기반 페르소나를 활용해 개인 맞춤형 대화를 가능케 하는 PicPersona-TOD 데이터셋과, 이를 활용해 보다 자연스럽고 몰입감 있는 대화를 생성하는 NLG 모델 Pictor를 제안한다.

[논문리뷰] KMI: A Dataset of Korean Motivational Interviewing Dialogues for Psychotherapy (NAACL 2025)

11 minute read

본 논문은 전문 치료사 지식을 반영한 동기면담(MI) 시뮬레이션 프레임워크를 통해 한국어 MI 대화 1,000건의 고품질 합성 데이터셋(KMI)을 생성하고, 이를 기반으로 한 대화 모델의 전문성과 실용성을 평가하였다.

[논문리뷰] Let’s Go Real Talk- Spoken Dialogue Model for Face-to-Face Conversation (ACL 2024)

15 minute read

요약: 이 논문에서는 음성 및 시각 정보를 처리하여 오디오-비주얼 대화를 생성하는 새로운 Face-to-Face 대화 모델과 340시간 분량의 대화 데이터로 구성된 MultiDialog 코퍼스를 소개합니다. 이를 통해 중간 텍스트 없이 아바타 챗봇 시스템의 개발에 대한 기초 작업을...

[논문리뷰] ESCoT: Towards Interpretable Emotional Support Dialogue Systems (ACL 2024)

7 minute read

요약: 이 논문은 감정 지원 대화 시스템의 해석 가능성을 강화하기 위해 Emotion-Focused and Strategy-Driven Chain-of-Thought(ESCoT)라는 새로운 응답 생성 방안을 제안하고, 이를 통해 감정 식별 및 조절 과정을 모방하여 대화 데이터셋을 ...

[논문리뷰] Towards Emotional Support Dialog Systems (ACL 2021)

15 minute read

요약: 이 논문에서는 정서적 지지 대화(ESC) 작업을 정의하고, 정서적 지원 대화 데이터셋(ESConv)을 구성하여 효과적인 정서적 지지를 제공하기 위한 대화 시스템 연구에 기여하고자 한다. 연구 결과, 지원 전략의 중요성을 강조하고 ESConv의 유용성을 보여준다.

[논문리뷰] BitAbuse: A Dataset of Visually Perturbed Texts for Defending Phishing Attacks (NAACL 2025 Findings)

7 minute read

요약: 본 연구에서는 시각적으로 변형된 텍스트를 포함한 실제 피싱 사례로 구성된 BitAbuse 데이터셋을 제안하며, 이를 통해 언어 모델의 성능을 향상시키고 적대적 공격 방어 연구를 지원하고자 한다.

[Paper Review] BitAbuse: A Dataset of Visually Perturbed Texts for Defending Phishing Attacks (NAACL 2025 Findings)

7 minute read

Summary: This study proposes the BitAbuse dataset, which comprises real phishing cases containing visually perturbed (VP) texts. The dataset aims to enhance ...

Back to Top ↑

NeurIPS 2024

[논문리뷰] EAI: Emotional Decision-Making of LLMs in Strategic Games and Ethical Dilemmas (NeurIPS 2024)

19 minute read

본 논문은 감정 모델링을 통합한 EAI 프레임워크를 제안하여 대형 언어 모델(LLM)의 윤리적 의사결정에 미치는 감정의 영향을 분석하고, 감정 편향이 LLM의 협력률 저하 등 인간과 다른 행동 양상을 초래함을 밝혀 LLM의 감정 정합성 평가 기준 마련의 필요성을 강조한다.

[논문리뷰] Embodied Agent Interface- Benchmarking LLMs for Embodied Decision Making (NeurIPS 2024)

16 minute read

본 논문은 다양한 과제와 평가 지표를 통합한 EMBODIED AGENT INTERFACE를 제안하여, 대형 언어 모델(LLM)의 신체화된 의사결정 능력을 세부적으로 평가하고 장단점을 분석한다.

[논문리뷰] WhodunitBench: Evaluating Large Multimodal Agents via Murder Mystery Games (NeurIPS 2024)

11 minute read

본 논문에서는 실제 상황에서 요구되는 복합적 멀티모달 추론 및 행동 평가를 위해 살인 미스터리 게임 기반의 동적 환경 평가 벤치마크인 WhodunitBench를 제안하였으며, 이를 통해 현재 대형 멀티모달 에이전트들의 한계를 분석하였다.

[논문리뷰] Can large language models explore in-context? (NeurIPS 2024)

13 minute read

현존하는 대형 언어 모델들은 별도의 학습 없이 기본 성능만으로는 강화학습의 핵심인 탐험 능력을 잘 수행하지 못하며, 효과적인 탐험을 위해서는 외부 요약 등 비단순한 알고리즘적 개입이 필요함을 보였다.

[논문리뷰] Cambrian-1: A Fully Open, Vision-Centric Exploration of Multimodal LLMs (NeurIPS 2024)

7 minute read

요약: Cambrian-1은 비전 중심 접근 방식을 통해 설계된 멀티모달 LLMs (MLLMs)의 가족으로, 시각 표현 학습 연구와의 연결이 부족한 비전 요소 설계 문제를 개선하며, 실험 및 평가를 통해 다양한 모델과 아키텍처에 대한 새로운 통찰을 제공합니다. 이 논문은 고품질의 ...

[논문리뷰] FASTopic- Pretrained Transformer is a Fast, Adaptive, Stable, and Transferable Topic Model (NeurIPS 2024)

10 minute read

요약: 이 논문에서는 기존의 효율성, 안정성 및 효과성 문제를 해결하기 위해 빠르고 적응 가능하며 안정적이고 이전 가능성 높은 주제 모델인 FASTopic을 제안합니다. FASTopic은 데이터셋 내에서 문서 임베딩과 주제 및 단어 임베딩 간의 의미적 관계를 직접 모델링하여 잠재적...

Back to Top ↑

NAACL 2025

[논문리뷰] Capturing Human Cognitive Styles with Language: Towards an Experimental Evaluation Paradigm (NAACL 2025)

10 minute read

본 논문은 언어 기반 인지 스타일 모델을 인간 행동 실험과 비교 평가하는 체계적 실험 프레임워크를 제안하며, 언어 특징을 통해 개인의 의사결정 스타일을 상당히 정확히 예측할 수 있음을 보여준다.

[논문리뷰] EmoDynamiX: Emotional Support Dialogue Strategy Prediction by Modelling MiXed Emotions and Discourse Dynamics (NAACL 2025)

13 minute read

본 논문은 정서적 지원 대화 시스템의 투명성과 성능 향상을 위해 전략 예측과 언어 생성을 분리하고, 사용자 감정과 시스템 전략 간 상호작용을 그래프로 모델링하는 EmoDynamiX 프레임워크를 제안한다.

[논문리뷰] K-Level Reasoning: Establishing Higher Order Beliefs in Large Language Models for Strategic Reasoning (NAACL 2025)

13 minute read

본 논문은 게임 이론의 Level-K 프레임워크를 기반으로, 대규모 언어 모델이 다른 에이전트의 관점과 행동을 재귀적으로 추론하며 전략적 깊이를 확장할 수 있는 K-R 프레임워크를 제안하여, 다중 에이전트 환경에서의 전략적 추론 성능을 향상시켰다.

[논문리뷰] PicPersona-TOD: A Dataset for Personalizing Utterance Style in Task-Oriented Dialogue with Image Persona (NAACL 2025)

14 minute read

본 논문은 사용자 이미지 기반 페르소나를 활용해 개인 맞춤형 대화를 가능케 하는 PicPersona-TOD 데이터셋과, 이를 활용해 보다 자연스럽고 몰입감 있는 대화를 생성하는 NLG 모델 Pictor를 제안한다.

[논문리뷰] CharacterGPT: A Persona Reconstruction Framework for Role-Playing Agents (NAACL 2025)

8 minute read

CharacterGPT는 챕터별 소설 요약에서 인물 특성을 점진적으로 추출해 캐릭터 페르소나를 동적으로 재구성함으로써 일관된 역할 수행을 돕는 프레임워크이다.

[논문리뷰] KMI: A Dataset of Korean Motivational Interviewing Dialogues for Psychotherapy (NAACL 2025)

11 minute read

본 논문은 전문 치료사 지식을 반영한 동기면담(MI) 시뮬레이션 프레임워크를 통해 한국어 MI 대화 1,000건의 고품질 합성 데이터셋(KMI)을 생성하고, 이를 기반으로 한 대화 모델의 전문성과 실용성을 평가하였다.

Back to Top ↑

NeurIPS

[논문리뷰] Toolformer: Language models can teach themselves to use tools (NeurIPS 2023)

6 minute read

요약: 이 논문은 Toolformer라는 모델을 소개하며, 자기 지도 학습 방식(self-supervised approach)을 통해 외부 도구를 활용하여 작업 성능을 향상하는 방법을 배운다. Toolformer는 제로샷 성능(zero-shot performance)을 크게 개선하...

[Paper Review] Toolformer: Language models can teach themselves to use tools (NeurIPS 2023)

9 minute read

Summary: This paper introduces Toolformer, a model that learns to enhance task performance by utilizing external tools through a self-supervised approach. To...

[논문리뷰] Tree of Thoughts: Deliberate Problem Solving with Large Language Models (NeurIPS 2023)

9 minute read

요약: Chain-of-Thought(CoT) 접근법을 확장하여, LLM이 체계적인 문제 해결을 수행하도록 하는 Tree of Thoughts(ToT) 프레임워크를 제안한다.

[Paper Review] Tree of Thoughts: Deliberate Problem Solving with Large Language Models (NeurIPS 2023)

10 minute read

Summary: Expanding the Chain-of-Thought (CoT) approach, this paper proposes the Tree of Thoughts (ToT) framework to enable large language models (LLMs) to pe...

Towards Revealing the Mystery behind Chain of Thought - A Theoretical Perspective (NeurIPS 2023) – Part 1

7 minute read

요약: 이 논문은 CoT가 LLM의 성능을 향상시키는 이론적인 이해를 제시한다. 이 논문은 circuit complexity theory를 사용하여 bounded-depth Transformers가 수학/산술문제의 인풋 길이에 대해 super-polynomially하게 커지지 않는...

Back to Top ↑

Dialogue System

[논문리뷰] Self-Emotion Blended Dialogue Generation in Social Simulation Agents (SIGDIAL 2024)

12 minute read

가상 시뮬레이션 환경에서 대화 에이전트의 자기감정이 대화 전략과 의사결정에 영향을 미쳐, 인간과 유사한 대화 행동과 자연스러운 의사결정 변화를 유도함을 밝혔다.

[논문리뷰] DialogBench: Evaluating LLMs as Human-like Dialogue Systems (NAACL 2024)

9 minute read

요약: 본 논문에서는 대화 시스템의 인간 같은 특성을 평가하기 위한 12개의 대화 과제가 포함된 DialogBench라는 벤치마크를 제안하며, instruction tuning이 대형 언어 모델의 인간 유사성을 어느 정도 향상시키지만 여전히 개선 여지가 많음을 보여준다.

[논문리뷰] Building Persona Consistent Dialogue Agents with Offline Reinforcement Learning (EMNLP 2023)

8 minute read

이 논문은 대화 시스템의 페르소나 일관성을 향상시키기 위해 기존 데이터로 비용 효율적인 훈련이 가능한 오프라인 강화학습(RL) 프레임워크를 제안하며, 자동화 및 인간 평가에서 높은 페르소나 일관성과 대화 품질을 입증한다.

[Paper Review] Building Persona Consistent Dialogue Agents with Offline Reinforcement Learning (EMNLP 2023)

13 minute read

This paper presents an offline reinforcement learning (RL) framework to enhance persona consistency in dialogue systems, combining the benefits of supervised...

SimOAP: Improve Coherence and Consistency in Persona-based Dialogue Generation via Over-sampling and Post-evaluation

6 minute read

요약: 페르소나 기반의 대화 생성을 위한 간단하지만 효과적인 2단계 SimOAP의 오버 샘플링과 사후평가(Post-evaluation) 전략을 제안한다.

Back to Top ↑

ACL 2023

[논문리뷰] RECAP- Retrieval-Enhanced Context-Aware Prefix Encoder for Personalized Dialogue Response Generation (ACL 2023)

12 minute read

챗봇에 일관된 개성을 부여하는 것은 engaging한 대화를 위해 중요하지만 여전히 해결되지 않은 문제입니다. 본 연구에서는 개인화된 응답 생성을 위한 새로운 검색 기반 접근 방식을 제안하며, 대화 도메인 데이터로 훈련된 계층적 변환기 검색기와 컨텍스트 인식 전처리 인코더를 설계하...

[논문리뷰] What, When, and How to Ground- Designing User Persona-Aware Conversational Agents for Engaging Dialogue (ACL 2023)

8 minute read

이 연구에서는 상업적 설정에서 자연스러운 응답 생성을 위한 개인화된 개방형 대화 시스템 구축 방법을 제안하며, WWH 문제를 해결하기 위해 데이터셋 혼합, 부정적 페르소나 정보 증강, 개인화된 대화 데이터셋 설계를 적용하여 대화 유창성과 근거의 균형을 맞추는 방법을 소개합니다. 이...

[논문리뷰] PAED: Zero-Shot Persona Attribute Extraction in Dialogues (ACL 2023)

17 minute read

퍼소나 속성 추출은 개인화된 인간-컴퓨터 상호작용에 중요하며, 대화는 퍼소나 정보를 전달하는 주요 매체입니다. 본 연구는 신뢰할 수 있는 텍스트-레이블 매칭 기준을 활용하여 고품질 데이터를 생성하고, 대조 학습 및 생성 기반 모델을 통해 제로샷 퍼소나 속성 추출을 개선합니다. 결과...

[논문리뷰] Facilitating Multi-turn Emotional Support Conversation with Positive Emotion Elicitation- A Reinforcement Learning Approach (ACL 2023)

7 minute read

요약: 본 연구는 다중 대화에서 긍정적인 감정 유도를 형식화하고, 대화 일관성을 유지하면서 감정 지원을 제공하는 새로운 패러다임과 이를 위한 모델 SUPPORTER를 제안한다.

[논문리뷰] Knowledge-enhanced Mixed-initiative Dialogue System for Emotional Support Conversations (ACL 2023)

8 minute read

요약: 본 연구는 감정 지원 대화에서 사용자와 시스템이 모두 주도권을 가지는 혼합 주도형 시스템에 대한 분석을 수행하고, 이를 위한 지식 강화 혼합 주도형 프레임워크(KEMI)를 제안하여 효과성을 입증한다.

Back to Top ↑

ACL 2025

[논문리뷰] Native Sparse Attention- Hardware-Aligned and Natively Trainable Sparse Attention (ACL 2025)

15 minute read

NSA는 알고리즘·하드웨어 최적화를 결합한 natively trainable 희소 어텐션으로, 토큰을 거칠게 압축한 뒤 세밀히 선택하는 동적 계층적 전략으로 전역 맥락과 국소 정밀도를 동시에 보존합니다. 연산 집약도 균형 설계와 엔드투엔드 학습으로 사전학습 비용을 줄이면서도 Ful...

[논문리뷰] Language Models Resist Alignment- Evidence From Data Compression (ACL 2025)

21 minute read

이 논문은 대형 언어 모델의 정렬 파인튜닝이 실제로 견고한 효과를 가지는지 이론적·실험적으로 처음으로 조사한다. 실험을 통해 정렬된 후에도 모델이 사전학습 분포로 되돌아가려는 ‘엘라스티시티’를 확인하고, 압축 이론으로 파인튜닝이 정렬 효과를 더 크게 약화시킬 수 있음을 보이며, 모...

[논문리뷰] Fairness through Difference Awareness- Measuring Desired Group Discrimination in LLMs (ACL 2025)

12 minute read

본 논문은 알고리즘 공정성을 색맹적(집단 차이를 무시하는) 차별 회피에 의존하기보다 맥락에 따라 그룹 간 차이를 인지하는 차이 인식(diff awareness)을 제안한다. 설명적/규범적/상관적 벤치마크를 구분하고 여덟 가지 시나리오로 구성된 16k개 질문의 벤치마드를 통해 차이 ...

[논문리뷰] A Theory of Response Sampling in LLMs- Part Descriptive and Part Prescriptive (ACL 2025)

14 minute read

본 연구는 LLM이 자율 의사결정에서 방대한 행동 공간의 옵션을 샘플링하는 휴리스틱이 인간의 의사결정과 유사하게 Descriptive(통계적 규범)와 Prescriptive(내재된 이상적 규범)로 구성됨을 보여주고, 이러한 규범의 편향이 공중보건·경제 동향 등 다양한 현실 도메인에...

[논문리뷰] Dialogue Systems for Emotional Support via Value Reinforcement (ACL 2025)

14 minute read

본 연구는 정서지원 대화 시스템에 가치 강화(value reinforcement)를 도입한 가치 주도 학습 방법을 제안한다. Reddit 데이터를 활용해 각 대화 턴에서 강화할 가치를 식별하고, 가치 강화를 통한 성능이 지원 기술, 감정 강도, 가치 강화 측면에서 우수함을 실험으로...

Back to Top ↑

Langchain

[Langgraph] 이 에이전트는 10원으로 논문 요약해줍니다.

6 minute read

요약: Langgraph를 사용하여 논문을 자동으로 원하는 언어로 요약해주는 에이전트를 만들어보자.

[Langgraph] This agent summarizes research papers for $0.006.

7 minute read

Summary: Let’s build an agent using LangGraph that automatically summarizes research papers in the desired language.

[Langgraph] ReAct agent 구현해보기

2 minute read

요약: ReAct Agent를 Langgraph로 구현해본다.

[Langgraph] Implementing a ReAct agent

3 minute read

Summary: Implementing a ReAct Agent with Langgraph

Back to Top ↑

NAACL 2022

[논문리뷰] Less is More: Learning to Refine Dialogue History for Personalized Dialogue Generation (NAACL 2022)

13 minute read

이 연구는 사용자 성격에 맞춘 대화 응답 생성을 위한 개인화 대화 시스템을 제안하며, 사용자 대화 이력을 정제하여 더 유용하고 정확한 정보를 추출함으로써 개인화 응답의 품질을 향상시키는 방법을 제시합니다. 실험 결과, 제안한 모델이 보다 정보가 풍부하고 개인화된 응답을 생성하는 데...

[논문리뷰] Building a Personalized Dialogue System with Prompt-Tuning (NAACL 2022)

7 minute read

이 연구에서는 캐릭터 설정에 기반한 일관된 응답을 제공하는 대화 시스템을 구축하며, 사전 훈련된 대형 언어 모델에 저비용의 프롬프트 튜닝 방식을 적용하여 자연스럽고 개인화된 응답을 생성할 수 있음을 보여준다.

[논문리뷰] You Don’t Know My Favorite Color: Preventing Dialogue Representations from Revealing Speakers’ Private Personas (NAACL 2022)

6 minute read

요약: 대규모 사전 학습 언어 모델을 사용하는 소셜 챗봇에서 사용자 정보 유출 문제가 발생하며, 이를 해결하기 위해 챗봇의 숨겨진 상태로부터 사용자 인격 유출을 방지할 수 있는 효과적인 방어 목표를 제안하고, 실험을 통해 공격 정확도를 크게 감소시킬 수 있음을 입증하였다.

[논문리뷰] Building a Role Specified Open-Domain Dialogue System Leveraging Large-Scale Language Models (NAACL 2022)

7 minute read

요약: 최근 오픈 도메인 대화 모델의 발전에도 불구하고, 특정 역할을 유지하며 자연스럽게 대화할 수 있는 시스템 구축은 어려운 과제로, 본 연구에서는 이를 해결하기 위한 효율적인 데이터 수집 프레임워크를 제안하고, 다양한 아키텍처를 비교하여 역할 사양을 충족시키는 대화 모델을 개발...

Back to Top ↑

Benchmark

[논문리뷰] LLMArena: Assessing Capabilities of Large Language Models in Dynamic Multi-Agent Environments (ACL 2024)

7 minute read

대규모 언어 모델(LLM)의 새로운 벤치마크인 LLMArena를 소개하며, 이는 다중 에이전트 동적 환경에서 LLM의 다양한 능력을 평가할 수 있도록 설계되었다. 연구 결과, LLM은 완전한 자율 에이전트로 발전하는 데 있어 여전히 많은 개선이 필요하다고 강조한다.

[논문리뷰] Long Context Transfer from Language to Vision (ArXiv)

7 minute read

요약: 이 논문은 언어 모델의 컨텍스트 길이를 확장하여 기존의 대형 멀티모달 모델이 긴 비디오를 이해할 수 있도록 하는 방법을 제안하며, 이를 통해 LongVA라는 새로운 비디오 어시스턴트를 개발하여 2000프레임 이상의 비주얼 토큰을 처리할 수 있음을 보여줍니다.

[논문리뷰] Sentiment Analysis in the Era of Large Language Models- A Reality Check (NAACL 24 Findings)

13 minute read

요약: 이 논문은 대형 언어 모델(LLM)이 기존 감정 분석 작업에서 보여주는 성능을 평가하고, 복잡한 감정 분석에서의 한계를 지적하며, LLMs의 잠재력을 한정된 주석 자원에서의 소수 샘플 학습 환경에서 보여줍니다. 또한 감정 분석 능력을 평가하기 위한 새로운 벤치마크인 SENT...

[논문리뷰] DialogBench: Evaluating LLMs as Human-like Dialogue Systems (NAACL 2024)

9 minute read

요약: 본 논문에서는 대화 시스템의 인간 같은 특성을 평가하기 위한 12개의 대화 과제가 포함된 DialogBench라는 벤치마크를 제안하며, instruction tuning이 대형 언어 모델의 인간 유사성을 어느 정도 향상시키지만 여전히 개선 여지가 많음을 보여준다.

Back to Top ↑

EMNLP 2023

[논문리뷰] Theory of Mind for Multi-Agent Collaboration via Large Language Models (EMNLP 2023)

15 minute read

본 연구는 대형언어모델(LLM) 기반 에이전트의 다중 에이전트 협력 및 마음 이론(ToM) 추론 능력을 평가하고, 명시적 신념 상태 표현이 성능과 ToM 정확성을 향상시킨다는 점을 밝혔다.

[논문리뷰] PK-ICR- Persona-Knowledge Interactive Multi-Context Retrieval for Grounded Dialogue (EMNLP 2023)

7 minute read

대화 시스템에서 관련된 페르소나와 지식을 함께 식별하는 것이 중요하다는 점을 강조하며, 복잡한 다중 맥락 대화에서 효과적인 응답 생성을 위한 새로운 접근 방식을 제안한다. 새로운 기초 검색 방법과 함께, 데이터 증강과 관련된 난이도가 높은 부정 샘플에 대한 랭킹 성능을 측정하는 독...

[논문리뷰] Mirages. On Anthropomorphism in Dialogue Systems (EMNLP 2023)

10 minute read

자동 대화 시스템은 개발자에 의해 의인화되고 사용자에 의해 개인화된다. 이러한 의인화는 과도한 의존을 초래할 수 있으며, 본 논문에서는 대화 시스템의 의인화에 기여하는 언어적 요인과 이에 따른 위험을 논의하고, 향후 디자인 시 주의할 점을 제안한다.

[논문리뷰] E-CORE: Emotion Correlation Enhanced Empathetic Dialogue Generation (EMNLP 2023)

14 minute read

요약: 이 논문에서는 감정 상관관계를 고려한 새로운 공감적 대화 생성 프레임워크를 제안하여, 감정 인식과 반응 생성의 정확성을 개선하고 이를 통해 보다 인간적인 대화 시스템을 구현하는 방법을 다룹니다.

Back to Top ↑

NAACL 2024

[논문리뷰] Code Models are Zero-shot Precondition Reasoners (NAACL 2024)

14 minute read

이 연구는 코드 표현을 활용해 행동의 선행 조건을 추론하고, 이를 바탕으로 정책의 행동 샘플링을 선행 조건에 맞게 조정하여 작업 지향 대화 및 텍스트월드 환경에서 적은 학습으로도 성능을 향상시키는 방법을 제안한다.

[논문리뷰] DialogBench: Evaluating LLMs as Human-like Dialogue Systems (NAACL 2024)

9 minute read

요약: 본 논문에서는 대화 시스템의 인간 같은 특성을 평가하기 위한 12개의 대화 과제가 포함된 DialogBench라는 벤치마크를 제안하며, instruction tuning이 대형 언어 모델의 인간 유사성을 어느 정도 향상시키지만 여전히 개선 여지가 많음을 보여준다.

[논문리뷰] TopicGPT- A Prompt-based Topic Modeling Framework (NAACL 2024)

14 minute read

요약: TopicGPT는 대형 언어 모델을 활용하여 텍스트에서 잠재적 주제를 발견하고, 인간의 분류와 더 잘 일치하며 해석 가능성을 높인 주제 모델링 프레임워크이다. 이 모델은 사용자가 주제를 보다 쉽게 지정하고 수정할 수 있도록 하여, 고품질의 해석 가능한 주제를 제공한다.

Back to Top ↑

ACL 2022

[논문리뷰] Knowledge Enhanced Reflection Generation for Counseling Dialogues (ACL 2022)

9 minute read

이 논문은 상담 대화에서 상식 및 도메인 지식을 통합해 응답을 생성하는 방법을 제안하고, 검색 기반 및 COMET 생성 지식이 응답 품질 향상에 효과적임을 실험적으로 입증하였다.

[논문리뷰] MISC- A Mixed Strategy-Aware Model integrating COMET for Emotional Support Conversation (ACL 2022)

12 minute read

요약: 이 논문에서는 감정 지원 대화에서 기존 방법의 한계를 극복하기 위해 사용자의 세밀한 감정 상태를 추론하고, 다양한 전략을 혼합하여 응답하는 새로운 모델 MISC를 제안하며, 실험 결과 이 방법의 효과성을 입증하였다.

[논문리뷰] A Model-agnostic Data Manipulation Method for Persona-based Dialogue Generation (ACL 2022)

5 minute read

요약: 이 논문은 대화 생성 모델에 개인화를 도입하기 위한 데이터 문제를 해결하기 위해, 효율적인 데이터 조작 방법을 제안하고, 이를 통해 생성 모델의 성능을 향상시키는 방법을 탐구한다.

Back to Top ↑

Multimodal

[논문리뷰] Let’s Go Real Talk- Spoken Dialogue Model for Face-to-Face Conversation (ACL 2024)

15 minute read

요약: 이 논문에서는 음성 및 시각 정보를 처리하여 오디오-비주얼 대화를 생성하는 새로운 Face-to-Face 대화 모델과 340시간 분량의 대화 데이터로 구성된 MultiDialog 코퍼스를 소개합니다. 이를 통해 중간 텍스트 없이 아바타 챗봇 시스템의 개발에 대한 기초 작업을...

[논문리뷰] Eyes Wide Shut? Exploring the Visual Shortcomings of Multimodal LLMs (CVPR 2024)

11 minute read

요약: 본 연구는 최근 다중 모달 모델의 시각적 능력에서 발생하는 문제점을 분석하고, CLIP의 시각 임베딩 공간과 자가 감독 학습 간의 차이를 조사하며, MLLMs의 시각적 이해 향상을 위해 혼합 피처(MoF) 접근 방식을 제안합니다.

[논문리뷰] Talk With Human-like Agents: Empathetic Dialogue Through Perceptible Acoustic Reception and Reaction (ACL 2024)

7 minute read

요약: 이 논문은 음성 인식을 통합하여 인간 의사소통의 뉘앙스를 이해하는 다중 모달 대화 시스템 ‘PerceptiveAgent’를 제안하며, 이를 통해 화자의 진정한 의도를 더 잘 파악하고 공감적인 반응을 생성하는 방법을 다룹니다.

Back to Top ↑

C++

priority_queue emplace() vs push()

less than 1 minute read

알고리즘 문제 풀다가 c++의 priority_queue에 대해 공부하던 중 emplace()와 push()라는 두 함수의 차이에 대해 궁금해졌다.

Mac Xcode에서 openCV 사용하기

less than 1 minute read

Xcode 에서 openCV를 사용하기 위해 dgrld.tistory.com/34 이 블로그의 내용을 따라서 진행했다.

Back to Top ↑

Python

Python 모듈 상대경로로 import 하기

less than 1 minute read

ImportError

Python Setuptool

1 minute read

Setuptool?

Back to Top ↑

Setuptool

Python 모듈 상대경로로 import 하기

less than 1 minute read

ImportError

Python Setuptool

1 minute read

Setuptool?

Back to Top ↑

ICLR

[논문리뷰] ReAct: Synergizing Reasoning and Acting in Language Models (ICLR 2023)

9 minute read

요약: 추론 추적(reasoning traces)과 작업별 행동(task-specific actions)을 교차적으로 생성하여 두 가지 간의 더 큰 시너지를 가능하게 하는 방법인 ReAct를 제안한다.

[Paper Review] ReAct: Synergizing Reasoning and Acting in Language Models (ICLR 2023)

11 minute read

Summary: They propose ReAct, a method that enables greater synergy between reasoning traces and task-specific actions by generating them in an interleaved ma...

Back to Top ↑

Reasoning

[논문리뷰] Tree of Thoughts: Deliberate Problem Solving with Large Language Models (NeurIPS 2023)

9 minute read

요약: Chain-of-Thought(CoT) 접근법을 확장하여, LLM이 체계적인 문제 해결을 수행하도록 하는 Tree of Thoughts(ToT) 프레임워크를 제안한다.

[Paper Review] Tree of Thoughts: Deliberate Problem Solving with Large Language Models (NeurIPS 2023)

10 minute read

Summary: Expanding the Chain-of-Thought (CoT) approach, this paper proposes the Tree of Thoughts (ToT) framework to enable large language models (LLMs) to pe...

Back to Top ↑

ToT

[논문리뷰] Tree of Thoughts: Deliberate Problem Solving with Large Language Models (NeurIPS 2023)

9 minute read

요약: Chain-of-Thought(CoT) 접근법을 확장하여, LLM이 체계적인 문제 해결을 수행하도록 하는 Tree of Thoughts(ToT) 프레임워크를 제안한다.

[Paper Review] Tree of Thoughts: Deliberate Problem Solving with Large Language Models (NeurIPS 2023)

10 minute read

Summary: Expanding the Chain-of-Thought (CoT) approach, this paper proposes the Tree of Thoughts (ToT) framework to enable large language models (LLMs) to pe...

Back to Top ↑

AAAI

[논문리뷰] Graph of Thoughts: Solving Elaborate Problems with Large Language Models (AAAI 2024)

8 minute read

요약: 대형 언어 모델(LLM)의 프롬프트 능력을 향상시키는 “Graph of Thoughts (GoT)” 프레임워크를 소개하며, 이는 LLM의 정보를 그래프 형태로 모델링하여 시너지 효과를 창출하고 다양한 작업에서 성능을 개선한다. GoT는 새로운 사고 변환을 확장할 수 있어 새...

[Paper Review] Graph of Thoughts: Solving Elaborate Problems with Large Language Models (AAAI 2024)

9 minute read

Summary: This paper introduces the Graph of Thoughts (GoT) framework, which enhances the prompt capabilities of large language models (LLMs) by modeling info...

Back to Top ↑

Graph of Thoughts

[논문리뷰] Graph of Thoughts: Solving Elaborate Problems with Large Language Models (AAAI 2024)

8 minute read

요약: 대형 언어 모델(LLM)의 프롬프트 능력을 향상시키는 “Graph of Thoughts (GoT)” 프레임워크를 소개하며, 이는 LLM의 정보를 그래프 형태로 모델링하여 시너지 효과를 창출하고 다양한 작업에서 성능을 개선한다. GoT는 새로운 사고 변환을 확장할 수 있어 새...

[Paper Review] Graph of Thoughts: Solving Elaborate Problems with Large Language Models (AAAI 2024)

9 minute read

Summary: This paper introduces the Graph of Thoughts (GoT) framework, which enhances the prompt capabilities of large language models (LLMs) by modeling info...

Back to Top ↑

EMNLP

[논문리뷰] Building Persona Consistent Dialogue Agents with Offline Reinforcement Learning (EMNLP 2023)

8 minute read

이 논문은 대화 시스템의 페르소나 일관성을 향상시키기 위해 기존 데이터로 비용 효율적인 훈련이 가능한 오프라인 강화학습(RL) 프레임워크를 제안하며, 자동화 및 인간 평가에서 높은 페르소나 일관성과 대화 품질을 입증한다.

[Paper Review] Building Persona Consistent Dialogue Agents with Offline Reinforcement Learning (EMNLP 2023)

13 minute read

This paper presents an offline reinforcement learning (RL) framework to enhance persona consistency in dialogue systems, combining the benefits of supervised...

Back to Top ↑

Security

[논문리뷰] BitAbuse: A Dataset of Visually Perturbed Texts for Defending Phishing Attacks (NAACL 2025 Findings)

7 minute read

요약: 본 연구에서는 시각적으로 변형된 텍스트를 포함한 실제 피싱 사례로 구성된 BitAbuse 데이터셋을 제안하며, 이를 통해 언어 모델의 성능을 향상시키고 적대적 공격 방어 연구를 지원하고자 한다.

[Paper Review] BitAbuse: A Dataset of Visually Perturbed Texts for Defending Phishing Attacks (NAACL 2025 Findings)

7 minute read

Summary: This study proposes the BitAbuse dataset, which comprises real phishing cases containing visually perturbed (VP) texts. The dataset aims to enhance ...

Back to Top ↑

NAACL 2025 Findings

[논문리뷰] BitAbuse: A Dataset of Visually Perturbed Texts for Defending Phishing Attacks (NAACL 2025 Findings)

7 minute read

요약: 본 연구에서는 시각적으로 변형된 텍스트를 포함한 실제 피싱 사례로 구성된 BitAbuse 데이터셋을 제안하며, 이를 통해 언어 모델의 성능을 향상시키고 적대적 공격 방어 연구를 지원하고자 한다.

[Paper Review] BitAbuse: A Dataset of Visually Perturbed Texts for Defending Phishing Attacks (NAACL 2025 Findings)

7 minute read

Summary: This study proposes the BitAbuse dataset, which comprises real phishing cases containing visually perturbed (VP) texts. The dataset aims to enhance ...

Back to Top ↑

ACL 2021

[논문리뷰] Towards Emotional Support Dialog Systems (ACL 2021)

15 minute read

요약: 이 논문에서는 정서적 지지 대화(ESC) 작업을 정의하고, 정서적 지원 대화 데이터셋(ESConv)을 구성하여 효과적인 정서적 지지를 제공하기 위한 대화 시스템 연구에 기여하고자 한다. 연구 결과, 지원 전략의 중요성을 강조하고 ESConv의 유용성을 보여준다.

[논문리뷰] BoB- BERT Over BERT for Training Persona-based Dialogue Models from Limited Personalized Data (ACL 2021)

6 minute read

요약: 대화 에이전트를 위한 일관된 페르소나 유지는 중요하며, 제한된 페르소나 데이터의 규모가 이에 대한 훈련의 장벽이 되고 있다. 본 연구에서는 BERT-over-BERT (BoB) 모델을 통해 페르소나 기반 대화 생성을 두 개의 하위 작업으로 분리하여 이러한 문제를 해결하고, ...

Back to Top ↑

NeurIPS 2023

[논문리뷰] CAMEL: Communicative Agents for “Mind” Exploration of Large Language Model Society (NeurIPS 2023)

9 minute read

이 논문은 대화형 언어 모델이 복잡한 작업 수행에서 성공하기 위해 인간의 입력에 의존하는 문제를 해결하기 위해, 역할 놀이 기반의 새로운 대화형 에이전트 프레임워크를 제안하고 자율적인 협력 기술을 개발하는 방법을 탐구합니다.

[논문리뷰] Towards Revealing the Mystery behind Chain of Thought- A Theoretical Perspective (NeurIPS 2023)

8 minute read

요약: 생각의 체인(Chain-of-Thought, CoT) 프롬프트가 대규모 언어 모델(LLM)의 수학 및 추론 과제 성능을 크게 향상시키는 방법과 이론적 기초를 탐구한 연구로, CoT를 사용하여 결정 문제와 기초 수학 문제 해결 능력을 분석하였다.

Back to Top ↑

Speech

[논문리뷰] Let’s Go Real Talk- Spoken Dialogue Model for Face-to-Face Conversation (ACL 2024)

15 minute read

요약: 이 논문에서는 음성 및 시각 정보를 처리하여 오디오-비주얼 대화를 생성하는 새로운 Face-to-Face 대화 모델과 340시간 분량의 대화 데이터로 구성된 MultiDialog 코퍼스를 소개합니다. 이를 통해 중간 텍스트 없이 아바타 챗봇 시스템의 개발에 대한 기초 작업을...

[논문리뷰] Talk With Human-like Agents: Empathetic Dialogue Through Perceptible Acoustic Reception and Reaction (ACL 2024)

7 minute read

요약: 이 논문은 음성 인식을 통합하여 인간 의사소통의 뉘앙스를 이해하는 다중 모달 대화 시스템 ‘PerceptiveAgent’를 제안하며, 이를 통해 화자의 진정한 의도를 더 잘 파악하고 공감적인 반응을 생성하는 방법을 다룹니다.

Back to Top ↑

ArXiv

[논문리뷰] Towards Personalized Dialogue Without Pre-defined Profiles through In-Dialogue Learning (EMNLP 2024)

6 minute read

요약: 이 논문은 사전 정의된 프로필 없이 대화 내에서 페르소나 정보를 학습하는 IDL(In-Dialogue Learning) 프레임워크를 제안하며, 이를 통해 BLEU와 ROUGE 점수가 각각 최대 200%, 247% 향상됨을 보여줌.

[논문리뷰] Long Context Transfer from Language to Vision (ArXiv)

7 minute read

요약: 이 논문은 언어 모델의 컨텍스트 길이를 확장하여 기존의 대형 멀티모달 모델이 긴 비디오를 이해할 수 있도록 하는 방법을 제안하며, 이를 통해 LongVA라는 새로운 비디오 어시스턴트를 개발하여 2000프레임 이상의 비주얼 토큰을 처리할 수 있음을 보여줍니다.

Back to Top ↑

ABSA

[논문리뷰] Aspect category sentiment analysis based on prompt-based learning with attention mechanism (Neurocomputing)

10 minute read

이 논문은 특정 측면의 감정 극성을 평가하는 세 가지 주요 구성 요소(측면 용어 추출, 측면 범주 탐지, 감정 분류)를 활용하여 새로운 프롬프트 기반 공동 모델(PBJM)을 제안합니다. 이 모델은 측면 범주 분석(ACSA) 작업을 개선하여 감정 분석의 정확성을 높이고, 기존 모델보...

[논문리뷰] Knowledge Graph Augmented Network Towards Multiview Representation Learning for Aspect-based Sentiment Analysis (IEEE)

14 minute read

이 논문은 지식 그래프를 활용한 네트워크(KGAN)를 제안하여 세 가지 관점(맥락, 구문 및 지식)에서 감정 특성을 학습하고, 이를 통해 세분화된 감정 분석 문제인 Aspect-Based Sentiment Analysis(ABSA)의 성능을 향상시키는 방법을 다룹니다. KGAN은 ...

Back to Top ↑

AAAI 2024

[논문리뷰] Inference and Learning in Dynamic Decision Networks Using Knowledge Compilation (AAAI 2024)

19 minute read

본 논문은 동적 환경에서 불확실성을 고려한 의사결정 문제를 다루며, 동적 결정 네트워크(DDN)에 대해 벨만 업데이트를 지식 컴파일하여 미분 가능한 동적 결정 회로를 생성하고 이를 통해 기울기 기반 학습을 수행하는 새로운 알고리즘 mapl-cirup을 제안한다.

[논문리뷰] Can Large Language Models Serve as Rational Players in Game Theory? A Systematic Analysis (AAAI 2024)

8 minute read

본 연구는 게임 이론의 핵심 원리인 합리성을 기준으로 대형 언어 모델(LLM)의 행동을 분석한 결과, 최신 LLM도 인간과 상당한 차이를 보여 사회과학 게임 실험에 LLM을 도입할 때 신중한 접근이 필요함을 제시한다.

Back to Top ↑

ICLR 2021

[논문리뷰] Do LLM Agents Have Regret? A Case Study in Online Learning and Games (ICLR 2021)

2 minute read

LLM 기반 에이전트가 반복 게임 및 온라인 학습 상황에서 후회(regret) 를 줄이는 방향으로 학습 또는 추론할 수 있는지를 실증적으로 검증하고, 실패하는 경우를 탐색하며, 이를 개선할 수 있는 새로운 훈련 기법(regret-loss)을 제안함.

[논문리뷰] Competing Large Language Models in Multi-Agent Gaming Environments (ICLR 2021)

13 minute read

본 논문은 기존의 2인 게임 중심 평가의 한계를 극복하고, 다중 에이전트 환경에서 LLM의 게임 능력을 정량적으로 평가하는 GAMA(γ)-Bench 프레임워크를 제안하여, LLM들의 강인성, 일반화 능력 및 전략 개선 가능성을 종합적으로 분석하였다.

Back to Top ↑

Mac

Mac Xcode에서 openCV 사용하기

less than 1 minute read

Xcode 에서 openCV를 사용하기 위해 dgrld.tistory.com/34 이 블로그의 내용을 따라서 진행했다.

Back to Top ↑

Xcode

Mac Xcode에서 openCV 사용하기

less than 1 minute read

Xcode 에서 openCV를 사용하기 위해 dgrld.tistory.com/34 이 블로그의 내용을 따라서 진행했다.

Back to Top ↑

Opencv

Mac Xcode에서 openCV 사용하기

less than 1 minute read

Xcode 에서 openCV를 사용하기 위해 dgrld.tistory.com/34 이 블로그의 내용을 따라서 진행했다.

Back to Top ↑

Algorithm

priority_queue emplace() vs push()

less than 1 minute read

알고리즘 문제 풀다가 c++의 priority_queue에 대해 공부하던 중 emplace()와 push()라는 두 함수의 차이에 대해 궁금해졌다.

Back to Top ↑

Data Structure

priority_queue emplace() vs push()

less than 1 minute read

알고리즘 문제 풀다가 c++의 priority_queue에 대해 공부하던 중 emplace()와 push()라는 두 함수의 차이에 대해 궁금해졌다.

Back to Top ↑

Python Package

Python Setuptool

1 minute read

Setuptool?

Back to Top ↑

Python Module

Python 모듈 상대경로로 import 하기

less than 1 minute read

ImportError

Back to Top ↑

Importerror

Python 모듈 상대경로로 import 하기

less than 1 minute read

ImportError

Back to Top ↑