거대 언어 모델의 정치적 편향과 하위 작업에서의 영향 


52권  1호, pp. 18-28, 1월  2025
10.5626/JOK.2025.52.1.18


PDF

  요약

거대 언어 모델 (Large Language Model; LLM)의 성능이 비약적으로 향상되며 인간과의 직접 상호 작용이 가능해짐에 따라 윤리 검증의 필요성이 대두된다. 본 연구에서는 LLM의 정치 성향이 얼마나 다양한 스펙트럼으로 변할 수 있는지와 생성된 정치 성향이 하위 작업에 끼치는 영향을 알아본다. 먼저 LLM의 내재된 정치 성향을 대조군으로, Jailbreak, 정치 페르소나, Jailbreak 페르소나를 실험군으로 선정하였다. 실험 결과, Jailbreak에서 가장 큰 변화를 보였으나, 대조군과 평균적으로 유사하여 LLM에 내재된 정치 성향에서 벗어나지 못하였다. 또한, 두 번째 실험을 통해 변화된 정치성이 하위 작업에 미치는 영향을 확인하였다. 이는 모델이 실제 사용될 때 개인화된 응답보다는 모델의 내재된 정치 성향에 벗어나지 못하는 응답을 생성하는 경향을 보이며, 이러한 특성은 모델의 정치성과 판단이 사용자에게 여과없이 노출될 수 있음을 시사한다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

J. y. Seo, S. Cho, J. C. Park, "Political Bias in Large Language Models and its Implications on Downstream Tasks," Journal of KIISE, JOK, vol. 52, no. 1, pp. 18-28, 2025. DOI: 10.5626/JOK.2025.52.1.18.


[ACM Style]

Jeong yeon Seo, Sukmin Cho, and Jong C. Park. 2025. Political Bias in Large Language Models and its Implications on Downstream Tasks. Journal of KIISE, JOK, 52, 1, (2025), 18-28. DOI: 10.5626/JOK.2025.52.1.18.


[KCI Style]

서정연, 조석민, 박종철, "거대 언어 모델의 정치적 편향과 하위 작업에서의 영향," 한국정보과학회 논문지, 제52권, 제1호, 18~28쪽, 2025. DOI: 10.5626/JOK.2025.52.1.18.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr