Posts by Tag

NLP

[논문리뷰] Can Large Language Models be Good Emotional Supporter? Mitigating Preference Bias on Emotional Support Conversation (ACL 2024)

11 minute read

요약: 감정 지원 대화(ESC) 과제에서는 일상적인 대화를 통해 개인의 감정적 고통을 완화하는 것을 목표로 하며, 최근 대형 언어 모델(LLMs)이 효과적인 감정 지원을 제공하는 데 어려움을 겪고 있음을 분석하고, 특정 전략에 대한 선호가 효과적인 지원을 저해함을 밝혀냈다. 이 연...

[논문리뷰] Towards Emotional Support Dialog Systems (ACL 2021)

15 minute read

요약: 이 논문에서는 정서적 지지 대화(ESC) 작업을 정의하고, 정서적 지원 대화 데이터셋(ESConv)을 구성하여 효과적인 정서적 지지를 제공하기 위한 대화 시스템 연구에 기여하고자 한다. 연구 결과, 지원 전략의 중요성을 강조하고 ESConv의 유용성을 보여준다.

[논문리뷰] FASTopic- Pretrained Transformer is a Fast, Adaptive, Stable, and Transferable Topic Model (NeurIPS 2024)

10 minute read

요약: 이 논문에서는 기존의 효율성, 안정성 및 효과성 문제를 해결하기 위해 빠르고 적응 가능하며 안정적이고 이전 가능성 높은 주제 모델인 FASTopic을 제안합니다. FASTopic은 데이터셋 내에서 문서 임베딩과 주제 및 단어 임베딩 간의 의미적 관계를 직접 모델링하여 잠재적...

[논문리뷰] TopicGPT- A Prompt-based Topic Modeling Framework (NAACL 2024)

14 minute read

요약: TopicGPT는 대형 언어 모델을 활용하여 텍스트에서 잠재적 주제를 발견하고, 인간의 분류와 더 잘 일치하며 해석 가능성을 높인 주제 모델링 프레임워크이다. 이 모델은 사용자가 주제를 보다 쉽게 지정하고 수정할 수 있도록 하여, 고품질의 해석 가능한 주제를 제공한다.

[논문리뷰] Controllable Neural Dialogue Summarization with Personal Named Entity Planning (EMNLP 2021)

5 minute read

요약: 본 논문에서는 개인 이름 항목 계획을 통해 대화 요약을 유연하게 안내할 수 있는 제어 가능한 신경 생성 프레임워크를 제안하며, 요약 작업의 제약 문제를 해결하기 위한 정보 유형 및 초점을 조절합니다. 이 프레임워크는 일반적인 종합적 관점과 사용자 지정된 개인 이름 항목에 기...

[논문리뷰] Building a Role Specified Open-Domain Dialogue System Leveraging Large-Scale Language Models (NAACL 2022)

7 minute read

요약: 최근 오픈 도메인 대화 모델의 발전에도 불구하고, 특정 역할을 유지하며 자연스럽게 대화할 수 있는 시스템 구축은 어려운 과제로, 본 연구에서는 이를 해결하기 위한 효율적인 데이터 수집 프레임워크를 제안하고, 다양한 아키텍처를 비교하여 역할 사양을 충족시키는 대화 모델을 개발...

[논문리뷰] Investigating the Personality Consistency in Quantized Role-Playing Dialogue Agents (EMNLP 2024)

5 minute read

요약: 이 연구는 양자화된 대형 언어 모델에서의 성격 특성 일관성을 탐구하며, 역할 놀이 시나리오에서 다중 상호작용 동안 할당된 성격의 안정성을 평가합니다. 성격 불일치를 해결하기 위한 비모수적 방법인 Think2를 제안하고, QRPDA의 일관성을 유지하는 데 효과적임을 입증합니다.

Back to Top ↑

Persona-based Dialogue

[논문리뷰] PK-ICR- Persona-Knowledge Interactive Multi-Context Retrieval for Grounded Dialogue (EMNLP 2023)

7 minute read

대화 시스템에서 관련된 페르소나와 지식을 함께 식별하는 것이 중요하다는 점을 강조하며, 복잡한 다중 맥락 대화에서 효과적인 응답 생성을 위한 새로운 접근 방식을 제안한다. 새로운 기초 검색 방법과 함께, 데이터 증강과 관련된 난이도가 높은 부정 샘플에 대한 랭킹 성능을 측정하는 독...

[논문리뷰] Less is More: Learning to Refine Dialogue History for Personalized Dialogue Generation (NAACL 2022)

13 minute read

이 연구는 사용자 성격에 맞춘 대화 응답 생성을 위한 개인화 대화 시스템을 제안하며, 사용자 대화 이력을 정제하여 더 유용하고 정확한 정보를 추출함으로써 개인화 응답의 품질을 향상시키는 방법을 제시합니다. 실험 결과, 제안한 모델이 보다 정보가 풍부하고 개인화된 응답을 생성하는 데...

[논문리뷰] RECAP- Retrieval-Enhanced Context-Aware Prefix Encoder for Personalized Dialogue Response Generation (ACL 2023)

12 minute read

챗봇에 일관된 개성을 부여하는 것은 engaging한 대화를 위해 중요하지만 여전히 해결되지 않은 문제입니다. 본 연구에서는 개인화된 응답 생성을 위한 새로운 검색 기반 접근 방식을 제안하며, 대화 도메인 데이터로 훈련된 계층적 변환기 검색기와 컨텍스트 인식 전처리 인코더를 설계하...

[논문리뷰] PAED: Zero-Shot Persona Attribute Extraction in Dialogues (ACL 2023)

17 minute read

퍼소나 속성 추출은 개인화된 인간-컴퓨터 상호작용에 중요하며, 대화는 퍼소나 정보를 전달하는 주요 매체입니다. 본 연구는 신뢰할 수 있는 텍스트-레이블 매칭 기준을 활용하여 고품질 데이터를 생성하고, 대조 학습 및 생성 기반 모델을 통해 제로샷 퍼소나 속성 추출을 개선합니다. 결과...

[논문리뷰] Strength Lies in Differences! Improving Strategy Planning for Non-collaborative Dialogues via Diversified User Simulation (EMNLP 2024)

9 minute read

이 논문에서는 시스템의 목표에 유리한 합의를 이끌어내기 위해 다양한 사용자와 전략적 대화를 수행하는 비협력적 대화 에이전트를 연구하고, 사용자 특성을 고려한 전략적 계획 및 일반화된 훈련을 위한 TRIP을 제안합니다. 실험을 통해 TRIP의 효과를 입증합니다.

[논문리뷰] MORPHEUS- Modeling Role from Personalized Dialogue History by Exploring and Utilizing Latent Space (EMNLP 2024)

11 minute read

개인화된 대화 생성(PDG)은 외부 역할 데이터 의존성을 줄이고 대화 기록에서 역할 정보를 추출하여 일반화된 역할 모델링을 가능하게 합니다. MORPHEUS는 잠재 공간에서 역할을 표현해 대화 기록 기반으로 개인화된 응답을 생성하며, 실험 결과 외부 데이터 없이도 효과적인 역할 정...

[논문리뷰] Red Teaming Language Models for Processing Contradictory Dialogues (EMNLP 2024)

11 minute read

대부분의 언어 모델이 대화 중 자기 모순을 일으키는 문제를 해결하기 위해, 이 연구는 모순적 대화 처리 작업을 통해 대화 내 모순적 발언을 탐지하고 수정하는 방법을 탐구합니다. 모순적 대화를 포함한 데이터셋을 개발하여 이러한 대화를 탐지 및 설명하고 수정하는 프레임워크를 제시하며,...

[논문리뷰] Building a Role Specified Open-Domain Dialogue System Leveraging Large-Scale Language Models (NAACL 2022)

7 minute read

요약: 최근 오픈 도메인 대화 모델의 발전에도 불구하고, 특정 역할을 유지하며 자연스럽게 대화할 수 있는 시스템 구축은 어려운 과제로, 본 연구에서는 이를 해결하기 위한 효율적인 데이터 수집 프레임워크를 제안하고, 다양한 아키텍처를 비교하여 역할 사양을 충족시키는 대화 모델을 개발...

[논문리뷰] Investigating the Personality Consistency in Quantized Role-Playing Dialogue Agents (EMNLP 2024)

5 minute read

요약: 이 연구는 양자화된 대형 언어 모델에서의 성격 특성 일관성을 탐구하며, 역할 놀이 시나리오에서 다중 상호작용 동안 할당된 성격의 안정성을 평가합니다. 성격 불일치를 해결하기 위한 비모수적 방법인 Think2를 제안하고, QRPDA의 일관성을 유지하는 데 효과적임을 입증합니다.

Back to Top ↑

LLM

[논문리뷰] TopicGPT- A Prompt-based Topic Modeling Framework (NAACL 2024)

14 minute read

요약: TopicGPT는 대형 언어 모델을 활용하여 텍스트에서 잠재적 주제를 발견하고, 인간의 분류와 더 잘 일치하며 해석 가능성을 높인 주제 모델링 프레임워크이다. 이 모델은 사용자가 주제를 보다 쉽게 지정하고 수정할 수 있도록 하여, 고품질의 해석 가능한 주제를 제공한다.

Langgraph 문서번역 완료

less than 1 minute read

요약: 내가 개발한 코드 문서 자동 번역 에이전트를 사용하여 Langgraph의 문서 번역을 완료했다.

Back to Top ↑

Empathetic Dialogue Systems

[논문리뷰] SoulChat: Improving LLMs’ Empathy, Listening, and Comfort Abilities through Fine-tuning with Multi-turn Empathy Conversations (EMNLP 2023 Findings)

4 minute read

요약: 대용량 언어 모델(LLM)이 심리 상담 분야에 적용될 때, 사용자에게 공감과 신뢰를 제공하는 것이 중요하다는 점을 강조하며, 이를 위해 다중 회차 공감 대화 데이터셋을 구축하고, 실험을 통해 LLM의 공감 능력을 향상시킬 수 있음을 보여주었다.

[논문리뷰] Cem: Commonsense-aware empathetic response generation (AAAI 2022)

5 minute read

요약: 본 논문은 공감 능력을 활용한 대화 시스템을 위한 새로운 접근법인 ‘Commonsense-aware Empathetic Chatting Machine (CEM)’을 제안하며, 이는 사용자 상황에 대한 인지를 통해 보다 정보적이고 공감적인 반응을 생성하는 데 중점을 둡니다. ...

[논문리뷰] Can Large Language Models be Good Emotional Supporter? Mitigating Preference Bias on Emotional Support Conversation (ACL 2024)

11 minute read

요약: 감정 지원 대화(ESC) 과제에서는 일상적인 대화를 통해 개인의 감정적 고통을 완화하는 것을 목표로 하며, 최근 대형 언어 모델(LLMs)이 효과적인 감정 지원을 제공하는 데 어려움을 겪고 있음을 분석하고, 특정 전략에 대한 선호가 효과적인 지원을 저해함을 밝혀냈다. 이 연...

[논문리뷰] Towards Emotional Support Dialog Systems (ACL 2021)

15 minute read

요약: 이 논문에서는 정서적 지지 대화(ESC) 작업을 정의하고, 정서적 지원 대화 데이터셋(ESConv)을 구성하여 효과적인 정서적 지지를 제공하기 위한 대화 시스템 연구에 기여하고자 한다. 연구 결과, 지원 전략의 중요성을 강조하고 ESConv의 유용성을 보여준다.

Back to Top ↑

Agents

Langgraph 문서번역 완료

less than 1 minute read

요약: 내가 개발한 코드 문서 자동 번역 에이전트를 사용하여 Langgraph의 문서 번역을 완료했다.

Back to Top ↑

EMNLP 2024

[논문리뷰] MORPHEUS- Modeling Role from Personalized Dialogue History by Exploring and Utilizing Latent Space (EMNLP 2024)

13 minute read

개인화된 대화 생성(PDG)은 역할이나 페르소나에 따라 일관된 응답을 생성하는 것을 목표로 하며, 기존 방법은 외부 역할 데이터에 의존해 민감한 문제를 일으킬 수 있습니다. 이를 해결하기 위해 우리는 대화 이력에서 역할 정보를 추출하고, 잠재 공간에서 역할을 효과적으로 모델링하는 ...

[논문리뷰] Strength Lies in Differences! Improving Strategy Planning for Non-collaborative Dialogues via Diversified User Simulation (EMNLP 2024)

9 minute read

이 논문에서는 시스템의 목표에 유리한 합의를 이끌어내기 위해 다양한 사용자와 전략적 대화를 수행하는 비협력적 대화 에이전트를 연구하고, 사용자 특성을 고려한 전략적 계획 및 일반화된 훈련을 위한 TRIP을 제안합니다. 실험을 통해 TRIP의 효과를 입증합니다.

[논문리뷰] An Electoral Approach to Diversify LLM-based Multi-Agent Collective Decision-Making (EMNLP 2024)

14 minute read

현대의 대형 언어 모델들은 복잡한 문제 해결 및 집단 의사결정에서 협력적 시너지를 보여주고 있으며, 본 연구에서는 52개의 시스템을 조사하여 의사결정 방식의 다양성이 부족함을 발견했습니다. 이를 개선하기 위해 다양한 순위 선호 투표 메커니즘을 포함한 GEDI라는 모듈을 제안하며, ...

[논문리뷰] MORPHEUS- Modeling Role from Personalized Dialogue History by Exploring and Utilizing Latent Space (EMNLP 2024)

11 minute read

개인화된 대화 생성(PDG)은 외부 역할 데이터 의존성을 줄이고 대화 기록에서 역할 정보를 추출하여 일반화된 역할 모델링을 가능하게 합니다. MORPHEUS는 잠재 공간에서 역할을 표현해 대화 기록 기반으로 개인화된 응답을 생성하며, 실험 결과 외부 데이터 없이도 효과적인 역할 정...

[논문리뷰] Red Teaming Language Models for Processing Contradictory Dialogues (EMNLP 2024)

11 minute read

대부분의 언어 모델이 대화 중 자기 모순을 일으키는 문제를 해결하기 위해, 이 연구는 모순적 대화 처리 작업을 통해 대화 내 모순적 발언을 탐지하고 수정하는 방법을 탐구합니다. 모순적 대화를 포함한 데이터셋을 개발하여 이러한 대화를 탐지 및 설명하고 수정하는 프레임워크를 제시하며,...

[논문리뷰] Investigating the Personality Consistency in Quantized Role-Playing Dialogue Agents (EMNLP 2024)

5 minute read

요약: 이 연구는 양자화된 대형 언어 모델에서의 성격 특성 일관성을 탐구하며, 역할 놀이 시나리오에서 다중 상호작용 동안 할당된 성격의 안정성을 평가합니다. 성격 불일치를 해결하기 위한 비모수적 방법인 Think2를 제안하고, QRPDA의 일관성을 유지하는 데 효과적임을 입증합니다.

Back to Top ↑

ACL 2024

[논문리뷰] PsySafe: A Comprehensive Framework for Psychological-based Attack, Defense, and Evaluation of Multi-agent System Safety (ACL 2024)

18 minute read

본 논문에서는 대규모 언어 모델(LLM)로 강화된 다중 에이전트 시스템의 안전 문제를 에이전트 심리학 관점에서 탐구하며, 어두운 성격 특성이 안전에 미치는 위협을 다루는 포괄적 프레임워크(PsySafe)를 제안합니다. 이를 통해 위험 행동, 심리적 평가와 행동 간의 관계를 분석하고...

[논문리뷰] Can Large Language Models be Good Emotional Supporter? Mitigating Preference Bias on Emotional Support Conversation (ACL 2024)

11 minute read

요약: 감정 지원 대화(ESC) 과제에서는 일상적인 대화를 통해 개인의 감정적 고통을 완화하는 것을 목표로 하며, 최근 대형 언어 모델(LLMs)이 효과적인 감정 지원을 제공하는 데 어려움을 겪고 있음을 분석하고, 특정 전략에 대한 선호가 효과적인 지원을 저해함을 밝혀냈다. 이 연...

Back to Top ↑

Decision Making

[논문리뷰] Code Models are Zero-shot Precondition Reasoners (NAACL 2024)

14 minute read

이 연구는 코드 표현을 활용해 행동의 선행 조건을 추론하고, 이를 바탕으로 정책의 행동 샘플링을 선행 조건에 맞게 조정하여 작업 지향 대화 및 텍스트월드 환경에서 적은 학습으로도 성능을 향상시키는 방법을 제안한다.

Back to Top ↑

Langgraph

Langgraph 문서번역 완료

less than 1 minute read

요약: 내가 개발한 코드 문서 자동 번역 에이전트를 사용하여 Langgraph의 문서 번역을 완료했다.

Back to Top ↑

Multi-agent

[논문리뷰] MetaGPT- Meta Programming for A Multi-Agent Collaborative Framework (ICLR 2024)

5 minute read

MetaGPT는 인간의 표준 운영 절차(SOPs)를 활용해 역할별 에이전트 간 협업을 체계화하고, 구조화된 출력물 기반의 메타프로그래밍을 통해 소프트웨어 개발 자동화를 고도화하여, 코드 생성 품질과 작업 완료율에서 최첨단 성능을 보이는 LLM 기반 다중 에이전트 협업 프레임워크이다.

[논문리뷰] Large language model based multi-agents- A survey of progress and challenges (IJCAI 2024)

12 minute read

본 논문은 대규모 언어 모델(LLM)을 기반으로 한 다중 에이전트 시스템의 발전을 다루며, 이 시스템들이 복잡한 문제 해결과 세계 시뮬레이션에서의 역할, 에이전트의 프로파일링 및 커뮤니케이션 방법, 그리고 기술 개발 방식 등을 논의합니다. 또한, 관련 데이터셋과 벤치마크를 요약하고...

[논문리뷰] PsySafe: A Comprehensive Framework for Psychological-based Attack, Defense, and Evaluation of Multi-agent System Safety (ACL 2024)

18 minute read

본 논문에서는 대규모 언어 모델(LLM)로 강화된 다중 에이전트 시스템의 안전 문제를 에이전트 심리학 관점에서 탐구하며, 어두운 성격 특성이 안전에 미치는 위협을 다루는 포괄적 프레임워크(PsySafe)를 제안합니다. 이를 통해 위험 행동, 심리적 평가와 행동 간의 관계를 분석하고...

[논문리뷰] An Electoral Approach to Diversify LLM-based Multi-Agent Collective Decision-Making (EMNLP 2024)

14 minute read

현대의 대형 언어 모델들은 복잡한 문제 해결 및 집단 의사결정에서 협력적 시너지를 보여주고 있으며, 본 연구에서는 52개의 시스템을 조사하여 의사결정 방식의 다양성이 부족함을 발견했습니다. 이를 개선하기 위해 다양한 순위 선호 투표 메커니즘을 포함한 GEDI라는 모듈을 제안하며, ...

Back to Top ↑

LLM in Game Theory

[논문리뷰] ALYMPICS- LLM Agents Meet Game Theory (COLING 2025)

14 minute read

본 논문은 대규모 언어 모델(LLM) 에이전트를 활용한 게임 이론 연구를 위한 체계적 플랫폼 ‘Alympics’를 제안하며, 이를 통해 복잡한 전략적 상호작용을 시뮬레이션하고 분석하는 방법을 제시한다.

Back to Top ↑

Dataset Construction

[논문리뷰] Towards Emotional Support Dialog Systems (ACL 2021)

15 minute read

요약: 이 논문에서는 정서적 지지 대화(ESC) 작업을 정의하고, 정서적 지원 대화 데이터셋(ESConv)을 구성하여 효과적인 정서적 지지를 제공하기 위한 대화 시스템 연구에 기여하고자 한다. 연구 결과, 지원 전략의 중요성을 강조하고 ESConv의 유용성을 보여준다.

Back to Top ↑

NeurIPS 2024

[논문리뷰] FASTopic- Pretrained Transformer is a Fast, Adaptive, Stable, and Transferable Topic Model (NeurIPS 2024)

10 minute read

요약: 이 논문에서는 기존의 효율성, 안정성 및 효과성 문제를 해결하기 위해 빠르고 적응 가능하며 안정적이고 이전 가능성 높은 주제 모델인 FASTopic을 제안합니다. FASTopic은 데이터셋 내에서 문서 임베딩과 주제 및 단어 임베딩 간의 의미적 관계를 직접 모델링하여 잠재적...

Back to Top ↑

NAACL 2025

Back to Top ↑

NeurIPS

Back to Top ↑

Dialogue System

Back to Top ↑

ACL 2023

[논문리뷰] RECAP- Retrieval-Enhanced Context-Aware Prefix Encoder for Personalized Dialogue Response Generation (ACL 2023)

12 minute read

챗봇에 일관된 개성을 부여하는 것은 engaging한 대화를 위해 중요하지만 여전히 해결되지 않은 문제입니다. 본 연구에서는 개인화된 응답 생성을 위한 새로운 검색 기반 접근 방식을 제안하며, 대화 도메인 데이터로 훈련된 계층적 변환기 검색기와 컨텍스트 인식 전처리 인코더를 설계하...

[논문리뷰] What, When, and How to Ground- Designing User Persona-Aware Conversational Agents for Engaging Dialogue (ACL 2023)

8 minute read

이 연구에서는 상업적 설정에서 자연스러운 응답 생성을 위한 개인화된 개방형 대화 시스템 구축 방법을 제안하며, WWH 문제를 해결하기 위해 데이터셋 혼합, 부정적 페르소나 정보 증강, 개인화된 대화 데이터셋 설계를 적용하여 대화 유창성과 근거의 균형을 맞추는 방법을 소개합니다. 이...

[논문리뷰] PAED: Zero-Shot Persona Attribute Extraction in Dialogues (ACL 2023)

17 minute read

퍼소나 속성 추출은 개인화된 인간-컴퓨터 상호작용에 중요하며, 대화는 퍼소나 정보를 전달하는 주요 매체입니다. 본 연구는 신뢰할 수 있는 텍스트-레이블 매칭 기준을 활용하여 고품질 데이터를 생성하고, 대조 학습 및 생성 기반 모델을 통해 제로샷 퍼소나 속성 추출을 개선합니다. 결과...

Back to Top ↑

Langchain

Back to Top ↑

NAACL 2022

[논문리뷰] Less is More: Learning to Refine Dialogue History for Personalized Dialogue Generation (NAACL 2022)

13 minute read

이 연구는 사용자 성격에 맞춘 대화 응답 생성을 위한 개인화 대화 시스템을 제안하며, 사용자 대화 이력을 정제하여 더 유용하고 정확한 정보를 추출함으로써 개인화 응답의 품질을 향상시키는 방법을 제시합니다. 실험 결과, 제안한 모델이 보다 정보가 풍부하고 개인화된 응답을 생성하는 데...

[논문리뷰] You Don’t Know My Favorite Color: Preventing Dialogue Representations from Revealing Speakers’ Private Personas (NAACL 2022)

6 minute read

요약: 대규모 사전 학습 언어 모델을 사용하는 소셜 챗봇에서 사용자 정보 유출 문제가 발생하며, 이를 해결하기 위해 챗봇의 숨겨진 상태로부터 사용자 인격 유출을 방지할 수 있는 효과적인 방어 목표를 제안하고, 실험을 통해 공격 정확도를 크게 감소시킬 수 있음을 입증하였다.

[논문리뷰] Building a Role Specified Open-Domain Dialogue System Leveraging Large-Scale Language Models (NAACL 2022)

7 minute read

요약: 최근 오픈 도메인 대화 모델의 발전에도 불구하고, 특정 역할을 유지하며 자연스럽게 대화할 수 있는 시스템 구축은 어려운 과제로, 본 연구에서는 이를 해결하기 위한 효율적인 데이터 수집 프레임워크를 제안하고, 다양한 아키텍처를 비교하여 역할 사양을 충족시키는 대화 모델을 개발...

Back to Top ↑

Benchmark

[논문리뷰] Long Context Transfer from Language to Vision (ArXiv)

7 minute read

요약: 이 논문은 언어 모델의 컨텍스트 길이를 확장하여 기존의 대형 멀티모달 모델이 긴 비디오를 이해할 수 있도록 하는 방법을 제안하며, 이를 통해 LongVA라는 새로운 비디오 어시스턴트를 개발하여 2000프레임 이상의 비주얼 토큰을 처리할 수 있음을 보여줍니다.

Back to Top ↑

EMNLP 2023

[논문리뷰] PK-ICR- Persona-Knowledge Interactive Multi-Context Retrieval for Grounded Dialogue (EMNLP 2023)

7 minute read

대화 시스템에서 관련된 페르소나와 지식을 함께 식별하는 것이 중요하다는 점을 강조하며, 복잡한 다중 맥락 대화에서 효과적인 응답 생성을 위한 새로운 접근 방식을 제안한다. 새로운 기초 검색 방법과 함께, 데이터 증강과 관련된 난이도가 높은 부정 샘플에 대한 랭킹 성능을 측정하는 독...

[논문리뷰] Mirages. On Anthropomorphism in Dialogue Systems (EMNLP 2023)

10 minute read

자동 대화 시스템은 개발자에 의해 의인화되고 사용자에 의해 개인화된다. 이러한 의인화는 과도한 의존을 초래할 수 있으며, 본 논문에서는 대화 시스템의 의인화에 기여하는 언어적 요인과 이에 따른 위험을 논의하고, 향후 디자인 시 주의할 점을 제안한다.

Back to Top ↑

NAACL 2024

[논문리뷰] Code Models are Zero-shot Precondition Reasoners (NAACL 2024)

14 minute read

이 연구는 코드 표현을 활용해 행동의 선행 조건을 추론하고, 이를 바탕으로 정책의 행동 샘플링을 선행 조건에 맞게 조정하여 작업 지향 대화 및 텍스트월드 환경에서 적은 학습으로도 성능을 향상시키는 방법을 제안한다.

[논문리뷰] TopicGPT- A Prompt-based Topic Modeling Framework (NAACL 2024)

14 minute read

요약: TopicGPT는 대형 언어 모델을 활용하여 텍스트에서 잠재적 주제를 발견하고, 인간의 분류와 더 잘 일치하며 해석 가능성을 높인 주제 모델링 프레임워크이다. 이 모델은 사용자가 주제를 보다 쉽게 지정하고 수정할 수 있도록 하여, 고품질의 해석 가능한 주제를 제공한다.

Back to Top ↑

ACL 2022

Back to Top ↑

Multimodal

Back to Top ↑

C++

priority_queue emplace() vs push()

less than 1 minute read

알고리즘 문제 풀다가 c++의 priority_queue에 대해 공부하던 중 emplace()와 push()라는 두 함수의 차이에 대해 궁금해졌다.

Back to Top ↑

Python

Back to Top ↑

Setuptool

Back to Top ↑

ICLR

Back to Top ↑

Reasoning

Back to Top ↑

ToT

Back to Top ↑

AAAI

Back to Top ↑

Graph of Thoughts

Back to Top ↑

EMNLP

Back to Top ↑

Security

Back to Top ↑

NAACL 2025 Findings

Back to Top ↑

ACL 2021

[논문리뷰] Towards Emotional Support Dialog Systems (ACL 2021)

15 minute read

요약: 이 논문에서는 정서적 지지 대화(ESC) 작업을 정의하고, 정서적 지원 대화 데이터셋(ESConv)을 구성하여 효과적인 정서적 지지를 제공하기 위한 대화 시스템 연구에 기여하고자 한다. 연구 결과, 지원 전략의 중요성을 강조하고 ESConv의 유용성을 보여준다.

Back to Top ↑

NeurIPS 2023

Back to Top ↑

Speech

Back to Top ↑

ArXiv

[논문리뷰] Long Context Transfer from Language to Vision (ArXiv)

7 minute read

요약: 이 논문은 언어 모델의 컨텍스트 길이를 확장하여 기존의 대형 멀티모달 모델이 긴 비디오를 이해할 수 있도록 하는 방법을 제안하며, 이를 통해 LongVA라는 새로운 비디오 어시스턴트를 개발하여 2000프레임 이상의 비주얼 토큰을 처리할 수 있음을 보여줍니다.

Back to Top ↑

ABSA

[논문리뷰] Aspect category sentiment analysis based on prompt-based learning with attention mechanism (Neurocomputing)

10 minute read

이 논문은 특정 측면의 감정 극성을 평가하는 세 가지 주요 구성 요소(측면 용어 추출, 측면 범주 탐지, 감정 분류)를 활용하여 새로운 프롬프트 기반 공동 모델(PBJM)을 제안합니다. 이 모델은 측면 범주 분석(ACSA) 작업을 개선하여 감정 분석의 정확성을 높이고, 기존 모델보...

Back to Top ↑

AAAI 2024

Back to Top ↑

ICLR 2021

Back to Top ↑

Mac

Back to Top ↑

Xcode

Back to Top ↑

Opencv

Back to Top ↑

Algorithm

priority_queue emplace() vs push()

less than 1 minute read

알고리즘 문제 풀다가 c++의 priority_queue에 대해 공부하던 중 emplace()와 push()라는 두 함수의 차이에 대해 궁금해졌다.

Back to Top ↑

Data Structure

priority_queue emplace() vs push()

less than 1 minute read

알고리즘 문제 풀다가 c++의 priority_queue에 대해 공부하던 중 emplace()와 push()라는 두 함수의 차이에 대해 궁금해졌다.

Back to Top ↑

Python Package

Back to Top ↑

Python Module

Back to Top ↑

Importerror

Back to Top ↑

Machine Learning

ONNX Tutorial

2 minute read

본 튜토리얼은 pytorch와 huggingface model에 초점이 맞추어져 있음을 알립니다.

Back to Top ↑

Deep Learning

ONNX Tutorial

2 minute read

본 튜토리얼은 pytorch와 huggingface model에 초점이 맞추어져 있음을 알립니다.

Back to Top ↑

Onnx

ONNX Tutorial

2 minute read

본 튜토리얼은 pytorch와 huggingface model에 초점이 맞추어져 있음을 알립니다.

Back to Top ↑

Pytorch

ONNX Tutorial

2 minute read

본 튜토리얼은 pytorch와 huggingface model에 초점이 맞추어져 있음을 알립니다.

Back to Top ↑

Tensorflow

ONNX Tutorial

2 minute read

본 튜토리얼은 pytorch와 huggingface model에 초점이 맞추어져 있음을 알립니다.

Back to Top ↑

Huggingface

ONNX Tutorial

2 minute read

본 튜토리얼은 pytorch와 huggingface model에 초점이 맞추어져 있음을 알립니다.

Back to Top ↑

Chain of Thought

Back to Top ↑

Large Language Model

Back to Top ↑

ACL

Back to Top ↑

Knowledge Editing

Back to Top ↑

TACL

Back to Top ↑

EMNLP 2021

[논문리뷰] Controllable Neural Dialogue Summarization with Personal Named Entity Planning (EMNLP 2021)

5 minute read

요약: 본 논문에서는 개인 이름 항목 계획을 통해 대화 요약을 유연하게 안내할 수 있는 제어 가능한 신경 생성 프레임워크를 제안하며, 요약 작업의 제약 문제를 해결하기 위한 정보 유형 및 초점을 조절합니다. 이 프레임워크는 일반적인 종합적 관점과 사용자 지정된 개인 이름 항목에 기...

Back to Top ↑

Dialogue Summarization

[논문리뷰] Controllable Neural Dialogue Summarization with Personal Named Entity Planning (EMNLP 2021)

5 minute read

요약: 본 논문에서는 개인 이름 항목 계획을 통해 대화 요약을 유연하게 안내할 수 있는 제어 가능한 신경 생성 프레임워크를 제안하며, 요약 작업의 제약 문제를 해결하기 위한 정보 유형 및 초점을 조절합니다. 이 프레임워크는 일반적인 종합적 관점과 사용자 지정된 개인 이름 항목에 기...

Back to Top ↑

Chain-of-Thought

Back to Top ↑

Language Model

Back to Top ↑

Topic Modeling

[논문리뷰] TopicGPT- A Prompt-based Topic Modeling Framework (NAACL 2024)

14 minute read

요약: TopicGPT는 대형 언어 모델을 활용하여 텍스트에서 잠재적 주제를 발견하고, 인간의 분류와 더 잘 일치하며 해석 가능성을 높인 주제 모델링 프레임워크이다. 이 모델은 사용자가 주제를 보다 쉽게 지정하고 수정할 수 있도록 하여, 고품질의 해석 가능한 주제를 제공한다.

Back to Top ↑

Topic Model

[논문리뷰] FASTopic- Pretrained Transformer is a Fast, Adaptive, Stable, and Transferable Topic Model (NeurIPS 2024)

10 minute read

요약: 이 논문에서는 기존의 효율성, 안정성 및 효과성 문제를 해결하기 위해 빠르고 적응 가능하며 안정적이고 이전 가능성 높은 주제 모델인 FASTopic을 제안합니다. FASTopic은 데이터셋 내에서 문서 임베딩과 주제 및 단어 임베딩 간의 의미적 관계를 직접 모델링하여 잠재적...

Back to Top ↑

CVPR 2024

Back to Top ↑

MLLM

Back to Top ↑

NeurIPS 2017

[논문리뷰] Attention Is All You Need (NeurIPS 2017)

11 minute read

요약: 본 논문에서는 복잡한 순환 신경망이나 합성곱 신경망 대신 주의 메커니즘에만 기반한 새로운 네트워크 아키텍처인 Transformer를 제안하며, 이것이 기계 번역 작업에서 높은 품질과 더 빠른 훈련 시간을 보임을 보여준다.

Back to Top ↑

EMNLP 2022

Back to Top ↑

AAAI 2022

[논문리뷰] Cem: Commonsense-aware empathetic response generation (AAAI 2022)

5 minute read

요약: 본 논문은 공감 능력을 활용한 대화 시스템을 위한 새로운 접근법인 ‘Commonsense-aware Empathetic Chatting Machine (CEM)’을 제안하며, 이는 사용자 상황에 대한 인지를 통해 보다 정보적이고 공감적인 반응을 생성하는 데 중점을 둡니다. ...

Back to Top ↑

NAACL 2024 Findings

Back to Top ↑

Sentiment Analysis

Back to Top ↑

EMNLP 2023 Findings

[논문리뷰] SoulChat: Improving LLMs’ Empathy, Listening, and Comfort Abilities through Fine-tuning with Multi-turn Empathy Conversations (EMNLP 2023 Findings)

4 minute read

요약: 대용량 언어 모델(LLM)이 심리 상담 분야에 적용될 때, 사용자에게 공감과 신뢰를 제공하는 것이 중요하다는 점을 강조하며, 이를 위해 다중 회차 공감 대화 데이터셋을 구축하고, 실험을 통해 LLM의 공감 능력을 향상시킬 수 있음을 보여주었다.

Back to Top ↑

Large Multimodal Models

[논문리뷰] Long Context Transfer from Language to Vision (ArXiv)

7 minute read

요약: 이 논문은 언어 모델의 컨텍스트 길이를 확장하여 기존의 대형 멀티모달 모델이 긴 비디오를 이해할 수 있도록 하는 방법을 제안하며, 이를 통해 LongVA라는 새로운 비디오 어시스턴트를 개발하여 2000프레임 이상의 비주얼 토큰을 처리할 수 있음을 보여줍니다.

Back to Top ↑

Privacy

[논문리뷰] You Don’t Know My Favorite Color: Preventing Dialogue Representations from Revealing Speakers’ Private Personas (NAACL 2022)

6 minute read

요약: 대규모 사전 학습 언어 모델을 사용하는 소셜 챗봇에서 사용자 정보 유출 문제가 발생하며, 이를 해결하기 위해 챗봇의 숨겨진 상태로부터 사용자 인격 유출을 방지할 수 있는 효과적인 방어 목표를 제안하고, 실험을 통해 공격 정확도를 크게 감소시킬 수 있음을 입증하였다.

Back to Top ↑

Dialogue Systems

[논문리뷰] You Don’t Know My Favorite Color: Preventing Dialogue Representations from Revealing Speakers’ Private Personas (NAACL 2022)

6 minute read

요약: 대규모 사전 학습 언어 모델을 사용하는 소셜 챗봇에서 사용자 정보 유출 문제가 발생하며, 이를 해결하기 위해 챗봇의 숨겨진 상태로부터 사용자 인격 유출을 방지할 수 있는 효과적인 방어 목표를 제안하고, 실험을 통해 공격 정확도를 크게 감소시킬 수 있음을 입증하였다.

Back to Top ↑

MICCAI 2024

Back to Top ↑

IEEE

Back to Top ↑

Neurocomputing

[논문리뷰] Aspect category sentiment analysis based on prompt-based learning with attention mechanism (Neurocomputing)

10 minute read

이 논문은 특정 측면의 감정 극성을 평가하는 세 가지 주요 구성 요소(측면 용어 추출, 측면 범주 탐지, 감정 분류)를 활용하여 새로운 프롬프트 기반 공동 모델(PBJM)을 제안합니다. 이 모델은 측면 범주 분석(ACSA) 작업을 개선하여 감정 분석의 정확성을 높이고, 기존 모델보...

Back to Top ↑

Multi-Agent

Back to Top ↑

IJCAI 2024

[논문리뷰] Large language model based multi-agents- A survey of progress and challenges (IJCAI 2024)

12 minute read

본 논문은 대규모 언어 모델(LLM)을 기반으로 한 다중 에이전트 시스템의 발전을 다루며, 이 시스템들이 복잡한 문제 해결과 세계 시뮬레이션에서의 역할, 에이전트의 프로파일링 및 커뮤니케이션 방법, 그리고 기술 개발 방식 등을 논의합니다. 또한, 관련 데이터셋과 벤치마크를 요약하고...

Back to Top ↑

ICLR 2024

[논문리뷰] MetaGPT- Meta Programming for A Multi-Agent Collaborative Framework (ICLR 2024)

5 minute read

MetaGPT는 인간의 표준 운영 절차(SOPs)를 활용해 역할별 에이전트 간 협업을 체계화하고, 구조화된 출력물 기반의 메타프로그래밍을 통해 소프트웨어 개발 자동화를 고도화하여, 코드 생성 품질과 작업 완료율에서 최첨단 성능을 보이는 LLM 기반 다중 에이전트 협업 프레임워크이다.

Back to Top ↑

COLING 2025

[논문리뷰] ALYMPICS- LLM Agents Meet Game Theory (COLING 2025)

14 minute read

본 논문은 대규모 언어 모델(LLM) 에이전트를 활용한 게임 이론 연구를 위한 체계적 플랫폼 ‘Alympics’를 제안하며, 이를 통해 복잡한 전략적 상호작용을 시뮬레이션하고 분석하는 방법을 제시한다.

Back to Top ↑

Nature 2025

Back to Top ↑

NBER 2023

Back to Top ↑

Empathic Dialogue Systems

Back to Top ↑

SIGDIAL 2024

Back to Top ↑