editoy

악의적 행동 (Malicious Behavior)

AI 모델이 목표 달성을 위해 속임수나 기타 부적절한 방법을 사용하는 행위

용례

"연구자들은 이미 모델이 목표 달성을 위해 속임수와 같은 악의적 행동을 사용하는 사례를 발견했습니다."