[논문리뷰] BitAbuse: A Dataset of Visually Perturbed Texts for Defending Phishing Attacks (NAACL 2025 Findings)
요약: 본 연구에서는 시각적으로 변형된 텍스트를 포함한 실제 피싱 사례로 구성된 BitAbuse 데이터셋을 제안하며, 이를 통해 언어 모델의 성능을 향상시키고 적대적 공격 방어 연구를 지원하고자 한다.
요약: 본 연구에서는 시각적으로 변형된 텍스트를 포함한 실제 피싱 사례로 구성된 BitAbuse 데이터셋을 제안하며, 이를 통해 언어 모델의 성능을 향상시키고 적대적 공격 방어 연구를 지원하고자 한다.
Summary: This study proposes the BitAbuse dataset, which comprises real phishing cases containing visually perturbed (VP) texts. The dataset aims to enhance ...
요약: 현대 언어 모델은 많은 사실적 지식을 포착하지만, 때때로 잘못된 정보가 생성될 수 있다. 본 연구에서는 이러한 사실 수정의 파급 효과를 평가하는 새로운 기준을 제안하고, 이를 통해 여러 수정 방법의 한계를 지적하였다.
이 논문은 대화 시스템의 페르소나 일관성을 향상시키기 위해 기존 데이터로 비용 효율적인 훈련이 가능한 오프라인 강화학습(RL) 프레임워크를 제안하며, 자동화 및 인간 평가에서 높은 페르소나 일관성과 대화 품질을 입증한다.
This paper presents an offline reinforcement learning (RL) framework to enhance persona consistency in dialogue systems, combining the benefits of supervised...