์ด๋ค ๋จ๋ฝ์ ์ด๋ค ๋ด์ฉ์ด ์๋์ง ๋น ๋ฅด๊ฒ ํ์ ํ๊ณ , ํด๋น ๋จ๋ฝ์์ ์๊ฐ๋๋ ๋ ผ๋ฌธ์ ์ฐพ๋๋ฐ์ ๋์์ด ๋๊ณ ์ ์ ๋ฆฌํ์ต๋๋ค.
1. Introduction

์ต๊ทผ ๋ํ ์ธ์ด ๋ชจ๋ธ(LLM)์ ๋น์ฝ์ ์ธ ๋ฐ์ ๊ณผ ํจ๊ป, **์ญํ ๋์ด ์ธ์ด ์์ด์ ํธ(RPLA)**๊ฐ ์ฃผ๋ชฉ๋ฐ๊ณ ์์ต๋๋ค. ์ด๋ค ์์ด์ ํธ๋ ์ฃผ์ด์ง ํ๋ฅด์๋๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ญ์ฌ์ ์ธ๋ฌผ, ์์ค ์ ์บ๋ฆญํฐ, ๋๋ ๊ฐ์ธ์ ํน์ฑ์ ์์ํ๊ฒ ์ฌํํจ์ผ๋ก์จ ๊ฐ์ฑ ๋๋ฐ์, ๊ฒ์ ์บ๋ฆญํฐ, ๊ฐ์ธ ๋น์ ๋ฑ ๋ค์ํ ์์ฉ ๋ถ์ผ์ ํ์ฉ๋๊ณ ์์ต๋๋ค. ์ด๋ฒ ํฌ์คํ ์์๋ ๋ ผ๋ฌธ์ ์ ์ฒด ๊ตฌ์กฐ์ ์ธ๋ถ ๋ด์ฉโํ๋ฅด์๋์ ๋ถ๋ฅ, ๊ตฌ์ถ ๋ฐฉ๋ฒ๋ก , ํ๊ฐ ์ฒด๊ณ, ๊ทธ๋ฆฌ๊ณ ์ ์ฌ์ ์ํ ์์์ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅโ์ ์์ธํ ์ดํด๋ณด๊ฒ ์ต๋๋ค.
๋ฐฐ๊ฒฝ ๋ฐ ๋ฐ์ ๋ํฅ: LLM์ ์ต์ ์ฐ๊ตฌ ๋ํฅ๊ณผ ๊ทธ๋ก ์ธํ RPLA์ ๋ฐ์ ๊ณผ์ ์ ์ค๋ช ํฉ๋๋ค.
RPLA์ ๊ฐ๋ ๊ณผ ์ ์: ์ญํ ๋์ด ์ธ์ด ์์ด์ ํธ์ ๊ธฐ๋ณธ ๊ฐ๋ , ๊ทธ๋ฆฌ๊ณ ์ด๋ฅผ ๊ตฌ์ฑํ๋ ํต์ฌ ์์๋ค์ ์ ์ํฉ๋๋ค.
ํ๋ฅด์๋ ๋ถ๋ฅ ์ฒด๊ณ:
- Demographic Persona: ์ง๋จ์ ํต๊ณ์ ํน์ฑ๊ณผ ๊ณ ์ ๋ ์ฌํ์ ์ญํ (์: ์ง์ , ์ฑ๋ณ, ์ฑ๊ฒฉ ์ ํ)์ ๋ฐ์.
- Character Persona: ์ญ์ฌ์ ์ธ๋ฌผ์ด๋ ์์ค, ์ํ ์ ์ ์๋ ค์ง ์บ๋ฆญํฐ์ ๊ตฌ์ฒด์ ์ธ ํน์ฑ์ ์ฌํ.
- Individualized Persona: ์ฌ์ฉ์์ ๊ฐ์ธ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ง์์ ์ผ๋ก ๊ฐฑ์ ๋๋ ๋ง์ถคํ ํ๋กํ.
๊ตฌ์ถ ๋ฐฉ๋ฒ๋ก :
- Parametric Training: ๋๊ท๋ชจ ์ฌ์ ํ์ต, ์ง๋ํ์ต, ๊ฐํํ์ต์ ํตํด ํ๋ฅด์๋์ ๋ด์ฌ์ ์ง์์ ์ฃผ์ .
- Nonparametric Prompting: ํ๋กฌํํธ ๊ธฐ๋ฐ ์ธ-์ปจํ ์คํธ ๋ฌ๋์ ํ์ฉํ์ฌ, ๋ณ๋์ ์ฌํ์ต ์์ด๋ ํ๋ฅด์๋๋ฅผ ์ฆ๊ฐ์ ์ผ๋ก ๊ตฌํ.
ํ๊ฐ ์ฒด๊ณ: ์ญํ ์ํ ๋ฅ๋ ฅ(๋ํ ๋ชฐ์ ๋, ์ ์ฐฝ์ฑ ๋ฑ)๊ณผ ํ๋ฅด์๋ ์ถฉ์ค๋(์ธ์ด ์คํ์ผ, ์ง์, ์ฑ๊ฒฉ ์ฌํ ๋ฑ)๋ฅผ ๋ค์ํ ์๋ ๋ฐ ์ธ๊ฐ ํ๊ฐ ๊ธฐ๋ฒ์ผ๋ก ๊ฒ์ฆ.
์ํ ์์ ๋ฐ ํ๊ณ: ํธํฅ, ๋ ์ฑ(ํ xic) ๋ฌธ์ , ํ ๋ฃจ์๋ค์ด์ ๋ฑ RPLA ๊ฐ๋ฐ์ ๋ฐ๋ฅธ ๋ถ์ ์ ์ธก๋ฉด๊ณผ ์ด๋ฅผ ์ํํ๊ธฐ ์ํ ์ฐ๊ตฌ ๋ฐฉํฅ.
๋ฏธ๋ ์ฐ๊ตฌ ๋ฐฉํฅ: ์์ ํ๊ณ ์ค๋ฆฌ์ ์ธ AI ๋๋ฐ์ ๊ตฌํ, ๊ฐ์ธํ์ ์ง์์ ์งํ, ๋ค์ค ๋ชจ๋ฌ ๋ฐ์ดํฐ ํตํฉ ๋ฑ ์์ผ๋ก์ ๋์ ๊ณผ์ ์ ๋ฐ์ ๊ฐ๋ฅ์ฑ.
2. Preliminary
2.1 The Roadmap of Large Language Models
์ต๊ทผ LLM์ ์ธ-์ปจํ ์คํธ ๋ฌ๋, ์ธ์คํธ๋ญ์ ํ๋ก์, ๋จ๊ณ๋ณ ์ถ๋ก ๋ฑ ๋ค์ํ ์ธ๊ฐ ์ ์ฌ ๋ฅ๋ ฅ์ ๋ณด์ฌ์ฃผ๋ฉฐ, ๊ทธ ๊ฒฐ๊ณผ๋ก ์ญํ ๋์ด์ ๊ฐ์ ๋ณต์กํ ์ฌํ์ ์ํธ์์ฉ์ ์ฌํํ ์ ์๊ฒ ๋์์ต๋๋ค.
- Emerged Abilities in LLMs: LLM์์ ์๋กญ๊ฒ ๋ฑ์ฅํ ํต์ฌ ๋ฅ๋ ฅ๋ค์ ์์ธํ ์ค๋ช ํฉ๋๋ค. ์ธ-์ปจํ ์คํธ ๋ฌ๋, ์ธ์คํธ๋ญ์ ํ๋ก์, ๋จ๊ณ๋ณ ์ถ๋ก ๋ฐ ์ฌํ์ ์ง๋ฅ๊ณผ ๊ฐ์ ๊ธฐ๋ฅ๋ค์ด LLM์ด ๋ณต์กํ ์ญํ ๋์ด๋ฅผ ์ํํ ์ ์๋๋ก ํ๋ ๊ธฐ๋ฐ์์ ๊ฐ์กฐํฉ๋๋ค.
- Anthropomorphic Cognition in LLMs: LLM์ด ์ ์ฐจ ์ธ๊ฐ๊ณผ ์ ์ฌํ ์ธ์ง ๋ฐ ๊ฐ์ ์ ํน์ฑ์ ๋ํ๋ด๊ธฐ ์์ํ์์ ๋ ผ์ํฉ๋๋ค. ์ด๊ธฐ์๋ ์์์ ์ถํ ๋ ผ์๊ฐ ์์์ผ๋, ํ์ฌ๋ ์๊ฐ, ๊ฐ์น, ๊ฐ์ ์ธ์, ์ฌ๋ฆฌ์ ํน์ฑ ๋ฑ ๋ค์ํ ์ธ๊ฐ์ ์์๋ฅผ ๋ชจ๋ฐฉํ๋ ๋ฅ๋ ฅ์ด ๊ฐ์กฐ๋ฉ๋๋ค. ๋จ, ์ด๋ ์ค์ ์์์ ์ฆ๊ฑฐ๊ฐ ์๋๋ผ ์ญํ ๋์ด ์ฑ๊ฒฉ์ ๊ฒฐ๊ณผ์์ ์ธ๊ธํฉ๋๋ค.
- Retrieval-augmented Generation of LLMs: ์ธ๋ถ ์ ๋ณด ๊ฒ์์ ํตํฉํ๋ Retrieval-augmented Generation(RAG) ๊ธฐ๋ฒ์ ์๊ฐํฉ๋๋ค. RAG๋ ์์ฑ ๊ณผ์ ์ค ์ค์๊ฐ์ผ๋ก ์ธ๋ถ ๋ฐ์ดํฐ๋ฅผ ์ฐธ์กฐํ์ฌ ์ฌ์ค ์ค๋ฅ๋ฅผ ์ค์ด๊ณ , ๊ธด ์ปจํ ์คํธ๋ฅผ ์ฒ๋ฆฌํ ์ ์๊ฒ ํ์ฌ ์ญํ ๋์ด ์๋๋ฆฌ์ค์์ ์ ์ฉํจ์ ์ค๋ช ํฉ๋๋ค.
2.2 LLM-powed Language Agnets
์ ํต์ ์ธ ์ฌ๋ณผ๋ฆญ ์์ด์ ํธ์ ๊ฐํํ์ต ๊ธฐ๋ฐ ์์ด์ ํธ์ ํ๊ณ๋ฅผ ์ธ๊ธํ๋ฉฐ, ์ต๊ทผ LLM ๊ธฐ๋ฐ ์ธ์ด ์์ด์ ํธ๊ฐ ์ธ๊ฐ ์์ค์ ์ง๋ฅ๊ณผ ์ํธ์์ฉ ๋ฅ๋ ฅ์ ๋ฐํ์ผ๋ก ๋ฑ์ฅํ๊ณ ์์์ ์๊ฐํฉ๋๋ค.
- Planning Module: ์ค์ ์ํฉ์์ ์์ด์ ํธ๊ฐ ๋ณต์กํ ์์ ์ ํด๊ฒฐํ๊ธฐ ์ํด ์ฅ๊ธฐ ๊ณํ์ ์๋ฆฝํ๋ ๋ฐฉ๋ฒ์ ์ค๋ช ํฉ๋๋ค. LLM ์์ด์ ํธ๋ Chain-of-Thought๋ ReAct ๊ฐ์ ์ ๋ต์ ์ฌ์ฉํด ์์ ์ ์ธ๋ถํํ๊ณ ํ๊ฒฝ ํผ๋๋ฐฑ์ ๋ฐ๋ผ ๋์ ์ผ๋ก ๊ณํ์ ์กฐ์ ํฉ๋๋ค.
- Tool-usage Module: LLM์ด ํน์ ์ ๋ฌธ ์์ญ์์ ๋ฐ์ํ ์ ์๋ ์ง์์ ํ๊ณ๋ ํ ๋ฃจ์๋ค์ด์ ๋ฌธ์ ๋ฅผ ๋ณด์ํ๊ธฐ ์ํด, ์ธ๋ถ API, ์ง์ ๋ฒ ์ด์ค ๋ฑ ์ธ๋ถ ๋๊ตฌ๋ฅผ ํ์ฉํ์ฌ ๋ณด๋ค ์ ํํ๊ณ ๋งฅ๋ฝ์ ์ ํฉํ ์๋ต์ ์์ฑํ ์ ์์์ ์ค๋ช ํฉ๋๋ค.
- Memory Mechanism: ์์ด์ ํธ๊ฐ ์ฌ์ฉ์ ๋ฐ ํ๊ฒฝ ์ ๋ณด๋ฅผ ์ ์ฅํ์ฌ ์ง์์ ์ธ ๋ํ ๋งฅ๋ฝ์ ์ ์งํ๋ ๋ฉ๋ชจ๋ฆฌ ๋ฉ์ปค๋์ฆ์ ์ค์์ฑ์ ๋ค๋ฃน๋๋ค. ๋จ๊ธฐ ๋ฉ๋ชจ๋ฆฌ(ํธ๋์คํฌ๋จธ์ ์ปจํ ์คํธ ํ๊ณ ๋ด ์ ๋ณด)์ ์ฅ๊ธฐ ๋ฉ๋ชจ๋ฆฌ(์ธ๋ถ ์ ์ฅ์)๋ฅผ ๊ตฌ๋ถํ์ฌ, ๊ฐ์ธํ๋ ์๋ต๊ณผ ์ฐ์์ ์ธ ์ํธ์์ฉ์ ๊ฐ๋ฅํ๊ฒ ํ๋ ์ญํ ์ ์ค๋ช ํฉ๋๋ค.
3. Overview of RPLAs


3.1 RPLA Definition
RPLA๋ฅผ ๊ตฌ์ฑํ๋ ํต์ฌ ํ๋ฅด์๋๋ฅผ ์ธ ๊ฐ์ง๋ก ๊ตฌ๋ถํ๋ ์ ์ฒด์ ์ธ ํ์ ์ ์ํฉ๋๋ค. ์ฆ, ํ๋ฅด์๋๋ ๋ฒ์๊ฐ ๋์ ์ง๋จ ํน์ฑ์ ๋ฐ์ํ๋ Demographic Persona, ์ ํ๋ฆฝ๋ ์ธ๋ฌผ์ด๋ ์บ๋ฆญํฐ๋ฅผ ๋ํ๋ด๋ Character Persona, ๊ทธ๋ฆฌ๊ณ ์ฌ์ฉ์ ๊ฐ๊ฐ์ธ์ ํ๋๊ณผ ์ ํธ๋ฅผ ๋ฐ์ํ์ฌ ์ง์์ ์ผ๋ก ๊ฐฑ์ ๋๋ Individualized Persona๋ก ๋ถ๋ฅ๋ฉ๋๋ค.
(1) Demographic Persona
Demographic Persona๋ ์ง์ , ์ฑ๋ณ, ์ธ์ข , ์ฑ๊ฒฉ ๋ฑ๊ณผ ๊ฐ์ด ํต๊ณ์ ๋๋ ์ง๋จ์ ํน์ฑ์ ๋ฐ์ํ๋ ํ๋ฅด์๋์ ๋๋ค. ์ด๋ค์ LLM์ด ์ฌ์ ํ์ต ๋ฐ์ดํฐ์ ๋ด์ฌํ ํต๊ณ์ ํจํด์ ํ์ฉํด ๊ฐ๋จํ ํ๋กฌํํธ(์: โ๋น์ ์ ์ํ์์ ๋๋คโ)๋ก ์ฝ๊ฒ ํ์ฑํ๋๋ฉฐ, ํน์ ์ง๋จ์ ์ ํ์ ์ธ ํ๋๊ณผ ์ธ์ด ํจํด์ ์๋ฎฌ๋ ์ด์ ํ๋ ๋ฐ ํจ๊ณผ์ ์ ๋๋ค.
(2) Character Persona
Character Persona๋ ์ญ์ฌ์ ์ธ๋ฌผ, ์์ค, ์ํ ๋ฑ์์ ์ ์๋ ค์ง ์ธ๋ฌผ์ด๋ ์บ๋ฆญํฐ์ ๊ณ ์ ํน์ฑ์ ์ฌํํ๋ ๋ฐ ์ค์ ์ ๋ก๋๋ค. ์ด ํ๋ฅด์๋๋ ์ ๊ธฐ, ์์ค, ์ํ ์คํฌ๋ฆฝํธ ๋ฑ ๋ค์ํ ์๋ฃ๋ก๋ถํฐ ๋ฐ์ดํฐ๋ฅผ ์์งํ์ฌ, ํด๋น ์ธ๋ฌผ์ ๋ฐฐ๊ฒฝ, ์ฑ๊ฒฉ, ์ธ์ด ์คํ์ผ ๋ฐ ๋ด๋ฌํฐ๋ธ๋ฅผ ์ถฉ์คํ๊ฒ ๋ฐ์ํ๋ ์ญํ ์ ์ํํฉ๋๋ค. ์ฃผ๋ก ์ํฐํ ์ธ๋จผํธ๋ ๊ฐ์ฑ์ ๋ชฐ์ ์ ์ํ ์์ฉ์ ์ฌ์ฉ๋ฉ๋๋ค.
(3) Individualized Persona
Individualized Persona๋ ๊ฐ๋ณ ์ฌ์ฉ์์ ๋ํ, ํ๋, ์ ํธ๋ ๋ฑ์์ ์ถ์ถ๋ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ตฌ์ถ๋ฉ๋๋ค. ์ด๋ฌํ ํ๋ฅด์๋๋ ์ฌ์ฉ์์ ์ง์์ ์ธ ์ํธ์์ฉ์ ํตํด ๋ณํํ๋ฉฐ, ๊ฐ์ธํ๋ ์๋น์ค(์: ๊ฐ์ธ ๋น์, ๋์งํธ ํด๋ก )๋ฅผ ์ ๊ณตํ๊ธฐ ์ํด ์ฌ์ฉ๋ฉ๋๋ค. ๋ฐ์ดํฐ๊ฐ ์ง์์ ์ผ๋ก ๊ฐฑ์ ๋จ์ ๋ฐ๋ผ ์์ด์ ํธ์ ์๋ต๋ ๋์ ์ผ๋ก ๋ณํํ๊ฒ ๋ฉ๋๋ค.
3.2 RPLA Construction
RPLA๊ฐ ์ด๋ป๊ฒ ๋ณต์กํ ํ๋ฅด์๋๋ฅผ ์๋ฎฌ๋ ์ด์ ํ๊ธฐ ์ํด ๋ค์ํ ๋ฐ์ดํฐ(์ค๋ช ์ ์์ , ๋ํ, ์ญ์ฌ์ ํ๋, ๋ฌธํ ๋ฑ)๋ฅผ ํ์ฉํ์ฌ ๊ตฌ์ถ๋๋์ง ๊ฐ๊ดํฉ๋๋ค. ์ฆ, RPLA๋ ๋ค์ํ ์๋ฃ๋ก๋ถํฐ ์ป์ ํ๋ฅด์๋ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์์ด์ ํธ์ ์ญํ ๊ณผ ํ๋์ ๊ตฌ์ฑํฉ๋๋ค.
Parametric Training ์ ๊ทผ๋ฒ
Parametric Training์ RPLA ๊ตฌ์ถ์ ์ํ ์ฃผ์ ๋ฐฉ๋ฒ ์ค ํ๋๋ก, ์ฌ์ ํ์ต(pre-training), ์ง๋ ํ์ต(Supervised Fine-Tuning), ๊ทธ๋ฆฌ๊ณ ๊ฐํ ํ์ต(Reinforcement Learning)์ ํฌํจํฉ๋๋ค.
- ์ฌ์ ํ์ต: ๋๊ท๋ชจ ์์ ํ ์คํธ(์: ๋ฌธํ ์ํ, ๋ฐฑ๊ณผ์ฌ์ ๋ฑ)๋ฅผ ํตํด ๋ชจ๋ธ์ด ํญ๋์ ํ๋ฅด์๋ ๊ด๋ จ ์ง์์ ๋ด์ฌํํฉ๋๋ค.
- ์ง๋ ํ์ต: ์ญํ ๋์ด ๋ฐ์ดํฐ์ ์ ํ์ฉํ์ฌ, ํน์ ํ๋ฅด์๋์ ํน์ฑ์ ๋์ฑ ์ธ๋ฐํ๊ฒ ๋ฐ์ํ๋๋ก ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ํฉ๋๋ค.
- ๊ฐํ ํ์ต: ์ฌ์ฉ์ ํผ๋๋ฐฑ์ด๋ ์ ํธ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก, ๋ชจ๋ธ์ด ์ผ๋ฐ ์ฌ์ฉ์์์ ์ํธ์์ฉ์์ ์ค๋ฆฌ์ ์ด๊ณ ์ฌํ์ ์ผ๋ก ์ ์ ํ ์๋ต์ ์์ฑํ ์ ์๋๋ก ์ถ๊ฐ์ ์ผ๋ก ์ต์ ํํฉ๋๋ค.
Nonparametric Prompting ์ ๊ทผ๋ฒ
Nonparametric Prompting์ ๋ณ๋์ ์ฌํ์ต ์์ด๋ ํ๋กฌํํธ ๋ด์์ ํ๋ฅด์๋ ์ ๋ณด๋ฅผ ์ ๊ณตํ์ฌ ๋ชจ๋ธ์ด ์ฆ๊ฐ์ ์ผ๋ก ์ญํ ์ ์ํํ๋๋ก ํ๋ ๊ธฐ๋ฒ์ ๋๋ค.
- ํ๋กฌํํธ ๊ตฌ์ฑ ์์: ํ๋ฅด์๋์ ์ค๋ช (ํ๋กํ)๊ณผ ํจ๊ป ํด๋น ์ญํ ์ ๋ง๋ ๋ํ ์์(๋ฐ๋ชจ)๋ฅผ ํฌํจํ์ฌ ๋ชจ๋ธ์ ์ ๋ฌํฉ๋๋ค.
- ๋ฐ์ดํฐ ์ ์ ๋ฐฉ๋ฒ: ์จ๋ผ์ธ ๋ฆฌ์์ค(์: Wikipedia, Fandom), ์๋ ์ถ์ถ(LLM์ผ๋ก ์ฑ ์ด๋ ์คํฌ๋ฆฝํธ์์ ์ถ์ถ), ๋ํ ํฉ์ฑ(์ญํ ์ ํ์ตํ LLM์ ์ด์ฉํ ๋ํ ๋ฐ์ดํฐ ์์ฑ), ๊ทธ๋ฆฌ๊ณ ์ธ๊ฐ ์ฃผ์(์ฌ๋์ด ์ง์ ํ๋ฅด์๋ ์ค๋ช , ๋ํ ์์ ์ ์) ๋ฑ์ ๋ฐฉ๋ฒ์ ํตํด ํ๋ฅด์๋ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๊ณ ์ ์ ํฉ๋๋ค.
- ๊ธฐํ ๋ณด์ ๊ธฐ๋ฒ: ์ปจํ ์คํธ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด ๋ฉ๋ชจ๋ฆฌ ๋ชจ๋์ ๋์ ํ์ฌ, ๋ชจ๋ธ์ด ํ์ํ ๋ ๋ฐฉ๋ํ ํ๋ฅด์๋ ์ ๋ณด๋ฅผ ์ธ๋ถ ์ ์ฅ์์์ ๋์ ์ผ๋ก ๋ถ๋ฌ์ฌ ์ ์๋๋ก ํฉ๋๋ค.
3.3 RPLA Evaluation
RPLA์ ํ๊ฐ ๊ธฐ์ค์ ํฌ๊ฒ ๋ ์ถ์ผ๋ก ๊ตฌ๋ถ๋ฉ๋๋ค. ํ๋๋ ์ ์ฒด์ ์ธ ์ญํ ์ํ ๋ฅ๋ ฅ(์: ๋ํ ๋ชฐ์ ๋, ์ ์ฐฝ์ฑ, ์ฌํ์ ์ํธ์์ฉ ๋ฑ)์ด๋ฉฐ, ๋ค๋ฅธ ํ๋๋ ํน์ ํ๋ฅด์๋๋ฅผ ์ผ๋ง๋ ์ถฉ์คํ๊ฒ ์ฌํํ๋์ง(์ธ์ด ์คํ์ผ, ๋ฐฐ๊ฒฝ ์ง์, ์ฑ๊ฒฉ ๋ฐ ์ฌ๊ณ ๊ณผ์ ๋ฑ)๋ฅผ ํ๊ฐํ๋ ๊ฒ์ ๋๋ค.
์ญํ ์ํ ๋ฅ๋ ฅ ํ๊ฐ
์์ด์ ํธ์ ์ญํ ์ํ ๋ฅ๋ ฅ์ ์ฃผ๋ก ๊ธฐ๋ณธ ๋ชจ๋ธ์ ๋ฅ๋ ฅ๊ณผ ๊ตฌ์ถ๋ ํ๋ ์์ํฌ์ ๊ธฐ๋ฐํ์ฌ ํ๊ฐ๋ฉ๋๋ค. ์ฌ๊ธฐ์๋ LLM์ ์ธ๋ฅ ๋ชจ๋ฐฉ ๋ฅ๋ ฅ, ๋ํ ์ฐธ์ฌ๋, ๋ชฐ์ ๊ฐ, ๊ฐ์ ์ดํด, ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ ๋ฑ ์ธ๋ถ ์งํ๋ค์ด ํฌํจ๋ฉ๋๋ค. ์ด ํ๊ฐ ๋ฐฉ์์ RPLA๊ฐ ์ฌ์ฉ์์ ๊ธฐ๋์ ๋ถํฉํ๋ โ์ธ๊ฐ ๊ฐ์โ ๋ํ๋ฅผ ์ผ๋ง๋ ์ ์ ๊ณตํ๋์ง๋ฅผ ์ธก์ ํฉ๋๋ค.
ํ๋ฅด์๋ ์ถฉ์ค๋ ํ๊ฐ
ํ๋ฅด์๋ ์ถฉ์ค๋๋ ๊ฐ RPLA๊ฐ ์๋๋ ์บ๋ฆญํฐ์ ํน์ฑ(์ง์, ์ธ์ด ์ต๊ด, ์ฑ๊ฒฉ, ์ ๋ , ๊ฒฐ์ ๊ณผ์ ๋ฑ)์ ์ผ๋ง๋ ์ ํํ๊ฒ ์ฌํํ๋์ง๋ฅผ ํ๊ฐํฉ๋๋ค. ์ด ๊ณผ์ ์์๋ ๋ชจ๋ธ์ด ์ ๊ณตํด์ผ ํ๋ ํต์ฌ ์ ๋ณด์ ํํ ๋ฐฉ์์ด ์ฌ๋ฐ๋ฅด๊ฒ ๋ฐ์๋๋์ง๋ฅผ ์ค์ ์ ์ผ๋ก ์ดํด๋ด ๋๋ค.
ํ๊ฐ ๋ฐฉ๋ฒ๋ก
ํ๊ฐ์๋ ์ฃผ๋ก ๋ค ๊ฐ์ง ๋ฐฉ๋ฒ์ด ์ฌ์ฉ๋ฉ๋๋ค.
- ์๋ ํ๊ฐ(ground truth ๊ธฐ๋ฐ): ์ ๋ต๊ณผ์ ์ ์ฌ๋ ์ธก์ ์ ํตํด ๊ฐ๊ด์ ์ฑ๋ฅ ์ ์๋ฅผ ์ฐ์ถ.
- ์๋ ํ๊ฐ(ground truth ์์ด): LLM์ ํ๊ฐ์๋ก ํ์ฉํ๊ฑฐ๋ ์ ํด์ง ๊ธฐ์ค์ผ๋ก ๋ชจ๋ธ์ ์๋ต์ ๋ถ๋ฅ.
- ๋ค์ง์ ๋คํ ํ๊ฐ: ๋ฏธ๋ฆฌ ์ค์ ๋ ์ต์ ์ค ์ฌ๋ฐ๋ฅธ ์๋ต ์ ํ ์ฌ๋ถ๋ฅผ ํ๊ฐ.
- ์ธ๊ฐ ํ๊ฐ: ์ ๋ฌธ๊ฐ ๋๋ ๊ด๋ จ ๋ถ์ผ ํ๊ฐ์๊ฐ ์ง์ ์๋ต์ ์ง๊ณผ ํ๋ฅด์๋ ์ถฉ์ค๋๋ฅผ ๊ฒํ .
ํ์ฌ RPLA๋ ์ ์ฐจ ๊ฐ์ ๋๊ณ ์์ผ๋, ์ฌ์ ํ ์์ ํ ์ธ๊ฐ ์์ค์ ์ญํ ์ฌํ์๋ ๋ฏธ์น์ง ๋ชปํ๋ฉฐ, ํนํ ํ๋ฅด์๋ ์ถฉ์ค๋ ์ธก๋ฉด์์๋ ๋ณด๋ค ์ธ๋ฐํ ํ๊ฐ ๋ฐฉ๋ฒ์ด ์๊ตฌ๋ฉ๋๋ค.
4. Demographic Persona
4.1 Definition
RPLA์ ํ ๋น๋ Demographic Persona๋ ํน์ ์ง๋จ์ ์ ํ์ ์ธ ํน์ฑโ์๋ฅผ ๋ค์ด, ์ง์ (์ํ์), ์ทจ๋ฏธ(์ผ๊ตฌ๊ด), ์ฑ๊ฒฉ(ENFJ) ๋ฑโ์ ๋ฐ์ํ๋๋ก ์ค๊ณ๋ฉ๋๋ค. ์ด ๋ฌธ๋จ์ ์ด๋ฌํ ํ๋ฅด์๋๊ฐ ํด๋น ์ง๋จ์ ์ธ์ด ์คํ์ผ, ์ ๋ฌธ ์ง์, ํ๋ ์์์ ํตํฉํ์ฌ ์ฌํ๋๋ค๋ ์ ์ ๊ฐ์กฐํฉ๋๋ค.
4.2 Analysis of Demographics
RPLA๋ ์ธ๊ฐ๊ณผ ์ ์ฌํ ๋ด์ฌ์ ํน์ฑ(์ฑ๊ฒฉ, ์ ์น์ ์ ๋ , ์ค๋ฆฌ์ ๊ณ ๋ ค ๋ฑ)์ ๋ฐ์ํฉ๋๋ค. ์ด๋ค์ ์ง์ ๋ ํ๋ฅด์๋์ ๋ฐ๋ผ ํ๋์ ๋ณํ์ํฌ ์ ์์ผ๋, ๋์์ ๋ถ์ ์ ํ๊ฑฐ๋ ๋ ์ฑ์ด ์๋ ์๋ต์ ์ ๋ฐํ ์ํ๋ ๋ดํฌํฉ๋๋ค.
Inherent Demographics
RPLA๊ฐ ์ฌ์ ํ์ต ๋ฐ์ดํฐ์ ๋ด์ฌํ ํจํด ๋๋ถ์ ํน์ ์ธ๊ตฌ ํต๊ณ์ ํน์ฑ์ ์์ฐ์ค๋ฝ๊ฒ ๋ฐ์ํ ์ ์์์ ์ค๋ช ํฉ๋๋ค. ์ด ๊ณผ์ ์์ ์ธ๊ฐ์ ํธํฅ๊ณผ ํ๋ ์์์ด ํ ์คํธ ์ถ๋ ฅ์ ์ํฅ์ ๋ฏธ์ณ, ํน์ ์ง๋จ์ ํน์ฑ์ด ๊ณผ๋ํ๊ฒ ๋๋ฌ๋ ์ ์์์ ์ง์ ํฉ๋๋ค.
Demographic Role-Playing
Demographic Role-Playing์ ๋ช ์์ ์ผ๋ก ํ๋ฅด์๋๋ฅผ ์ง์ํ๋ ํ๋กฌํํธ๋ฅผ ํตํด ๋ชจ๋ธ์ด ํน์ ์ธ๊ตฌ ํต๊ณ์ ์ญํ ์ ์ํํ๋๋ก ์ ๋ํ๋ ์ ๊ทผ๋ฒ์ ๋๋ค. ์๋ฅผ ๋ค์ด, โ๋น์ ์ ํ๋ฐํ๊ณ ์ฌ๊ต์ ์ธ ์ฌ๋์ ๋๋คโ์ ๊ฐ์ ํ๋กฌํํธ๋ ์์ด์ ํธ๊ฐ ํด๋น ์ญํ ์ ๋ง๋ ์ธ์ด ์คํ์ผ๊ณผ ํ๋์ ๋ชจ๋ฐฉํ๋๋ก ํฉ๋๋ค.
4.3 Application of Demographics
ํน์ ์ธ๊ตฌ ํต๊ณ์ ํ๋ฅด์๋๋ฅผ ํ ๋นํ๋ฉด, LLM์ด ๋จ๋ ๋๋ ๋ค์ค ์์ด์ ํธ ์์คํ ์์ ๋ค์ด์คํธ๋ฆผ ์์ ์ํ ์ ์ฑ๋ฅ์ด ํฅ์๋จ์ ์ค๋ช ํฉ๋๋ค. ์ด๋ ์ ๋ฌธ ์ง์์ด ์๊ตฌ๋๋ ์์ ์ด๋ ํ์ ์ํฉ์์ ํฐ ๋์์ด ๋ฉ๋๋ค.
Improving Task Solving in Single-Agent Systems
๋จ์ผ ์์ด์ ํธ์ ํน์ Demographic Persona๋ฅผ ํ ๋นํ๋ฉด, ํด๋น ๋ถ์ผ์ ์ ๋ฌธ ์ง์์ด ๊ฐํ๋์ด ์๋ต์ ๊น์ด์ ์ง์ด ํฅ์๋ฉ๋๋ค. ํนํ, ์ฌ์ ํ๋ จ ์์ด๋ ๋ณต์กํ ์ ๋ก์ท ๋ฌธ์ ํด๊ฒฐ ๋ฑ์์ ๋ ํต์ฐฐ๋ ฅ ์๋ ๋ต๋ณ์ ์ ๊ณตํ ์ ์๊ฒ ๋ฉ๋๋ค.
Improving Task Solving in Multi-Agent Systems
๋ค์ค ์์ด์ ํธ ํ๊ฒฝ์์ ๋ค์ํ ์ธ๊ตฌ ํต๊ณ์ ํ๋ฅด์๋๋ฅผ ์ ์ฉํ๋ฉด, ๊ฐ ์์ด์ ํธ๊ฐ ์๋ก ๋ค๋ฅธ ์ญํ ์ ๋งก์ ํ๋ ฅ์ ๋ฌธ์ ํด๊ฒฐ ๋ฐ ์ํํธ์จ์ด ๊ฐ๋ฐ ๊ฐ์ ๋ณต์กํ ์์ ์ ํจ์จ์ ๋์ผ ์ ์์ต๋๋ค. ์ค์ ์ฌ๋ก๋ก ChatDev์ MetaGPT์ ๊ฐ์ ์์คํ ์ด ์๊ฐ๋ฉ๋๋ค.
Simulating Collective Social Behaviors in Multi-Agent Systems
RPLA๋ ์ ๋ต ๊ฒ์์ด๋ ์ฌํ ์ถ๋ฆฌ ๊ฒ์ ๋ฑ์์ ์ธ๊ฐ๊ณผ ์ ์ฌํ ๋ณต์กํ ์ํธ์์ฉ์ ์๋ฎฌ๋ ์ด์ ํ ์ ์์ต๋๋ค. ์ด๋ฌํ ํ๊ฒฝ์์๋ ์์ด์ ํธ๋ค์ด ๊ณต์ ํจ ๋๋ ์ด๊ธฐ์ ์ธ ํ๋์ ํตํด ์ง๋จ์ ์ด์ต์ ๊ธฐ์ฌํ๊ฑฐ๋, ์ธ๊ต ๋ฐ ์ ์ ์๋ฎฌ๋ ์ด์ ์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ด๋ ๋ฑ, ๋ค์ํ ์ฌํ์ ํ๋ ํจํด์ ์ฌํํ ์ ์์์ ๋ณด์ฌ์ค๋๋ค.
5. Character Persona
5.1 Definition
Character Persona ๊ฐ๋ ์๊ฐ
Character Persona๋ ๋์ค์๊ฒ ๋๋ฆฌ ์๋ ค์ง ์ญ์ฌ์ ์ธ๋ฌผ, ์์คยท์ํ ์บ๋ฆญํฐ ๋ฑ ๊ตฌ์ฒด์ ์ด๊ณ ํ๋ฆฝ๋ ์ธ๋ฌผ์ ํน์ฑ์ ์ฌํํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค. ์ฌ๊ธฐ์๋ ๊ธฐ์กด์ ์ ์๋ ค์ง ์บ๋ฆญํฐ๋ฟ ์๋๋ผ, ๊ฐ๋ณ ์ฌ์ฉ์๊ฐ ์ฐฝ์ํ ์๋ณธ ์บ๋ฆญํฐ๋ ํฌํจ๋ฉ๋๋ค. ์ด๋ฌํ ํ๋ฅด์๋๋ ์ต๊ทผ Character.ai์ ๊ฐ์ด ๊ด๋ จ ๋ถ์ผ์์ ๊ธ๋ถ์ํ๋ฉฐ, LLM์ ์ญํ ๋์ด ์์ฉ์์ ์ค์ํ ์ฐ๊ตฌ ์ฃผ์ ๋ก ์๋ฆฌ์ก๊ณ ์์ต๋๋ค.
ํจ๊ณผ์ ์ธ ์ญํ ๋์ด๋ฅผ ์ํ ํ์ ์๊ฑด
ํจ๊ณผ์ ์ธ ์บ๋ฆญํฐ ์ญํ ์ฌํ์ ์ํด LLM์ด ํด๋น ์บ๋ฆญํฐ์ ํน์ฑ์ ์ดํดํ๋ ๋ฅ๋ ฅ์ด ํ์์ ์ ๋๋ค. ์ด๊ธฐ ์ฐ๊ตฌ์์๋ โCharacter Predictionโ๊ณผ โPersonality Understandingโ์ด๋ผ๋ ๋ ๊ฐ์ง ์ธก๋ฉด์ ํตํด, ๋ชจ๋ธ์ด ํ ์คํธ์์ ์บ๋ฆญํฐ์ ์ ์ฒด, ๊ด๊ณ, ๊ทธ๋ฆฌ๊ณ ์ฑ๊ฒฉ์ ํน์ฑ์ ์ธ์ํ๊ณ , ๋ฏธ๋ ํ๋์ ์์ธกํ ์ ์๋์ง์ ๋ํด ํ๊ตฌํ์์ต๋๋ค.
์ต๊ทผ ์ฐ๊ตฌ ์ฌ๋ก
์บ๋ฆญํฐ์ ์ดํฌ, ์ง์, ์ฑ๊ฒฉ, ์์ฌ ๊ฒฐ์ ์ ๋ํ ์ฌํ๊ณผ ๊ด๋ จ๋ ์ฐ๊ตฌ๋ค์ด ์งํ๋๊ณ ์์ต๋๋ค.
5.2 Data for Character RPLAs

์บ๋ฆญํฐ RPLA๋ฅผ ๊ตฌ์ถํ๊ธฐ ์ํด์๋ ํด๋น ์บ๋ฆญํฐ์ ๋ํ ํ๋ถํ๊ณ ์ ํํ ๋ฐ์ดํฐ๊ฐ ํ์์ ์ ๋๋ค. ์ด ๋ฐ์ดํฐ๋ ์บ๋ฆญํฐ์ ์ ์ฒด์ฑ, ๋ฐฐ๊ฒฝ, ๊ด๊ณ์ ๊ฐ์ ๊ธฐ๋ณธ ์ ๋ณด์ ํจ๊ป, ์บ๋ฆญํฐ์ ๊ณ ์ ํ ํน์ฑ์ ๋ชจ๋ธ์ด ํ์ตํ๋๋ก ๋์ต๋๋ค. ๊ฒฐ๊ตญ, ์ด ์ ๋ณด๋ค์ด ๋ชจ๋ธ์ด ์์ฒญ ์ ํด๋น ์บ๋ฆญํฐ๋ฅผ ์ฌ๋ฐ๋ฅด๊ฒ ํ์ํ๊ณ ์ฌํํ ์ ์๋ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
์บ๋ฆญํฐ ๋ฐ์ดํฐ๋ฅผ ๋ ๊ฐ์ง ์ฃผ์ ์ ํ์ผ๋ก ๊ตฌ๋ถํฉ๋๋ค.
- ์ค๋ช (Description) ๋ฐ์ดํฐ: ์บ๋ฆญํฐ์ ์ด๋ฆ, ์์, ์ ์ฒด์ฑ, ๋ฐฐ๊ฒฝ ๋ฑ ์ ์ ์ธ ํน์ฑ์ ์ง์ ์์ ํ ์ ๋ณด๋ก, ๋ชจ๋ธ์ด ์บ๋ฆญํฐ์ ๊ธฐ๋ณธ์ ์ธ ํน์ฑ์ ๊ธฐ์ตํ๊ณ ์ฌํํ๋ ๋ฐ ๋์์ ์ค๋๋ค.
- ๋ฐ๋ชจ(Demonstration) ๋ฐ์ดํฐ: ์บ๋ฆญํฐ์ ์ธ์ด ์คํ์ผ, ์ธ์ง ๋ฐ ํ๋ ํจํด ๋ฑ ๋์ ์ธ ํน์ฑ์ ๋ํ๋ ์ํฉ ์์ฐ์ ํตํด ๋ณด์ฌ์ฃผ๋ ์ ๋ณด์ ๋๋ค.
๋ ๋ฐ์ดํฐ ์ ํ์ ์ํธ ๋ณด์์ ์ผ๋ก ์์ฉํ์ฌ, ๋ชจ๋ธ์ด ์บ๋ฆญํฐ์ ์๋๊ฐ ์๊ณ ์ผ๊ด๋ ํํ์ ์์ฑํ ์ ์๋๋ก ์ง์ํฉ๋๋ค.
์บ๋ฆญํฐ ๋ฐ์ดํฐ์ ํ๊ณ์ ์ถ์ฒ
- ์ฌ์ฉ ๊ฐ๋ฅํ ์บ๋ฆญํฐ ๋ฐ์ดํฐ๋ ํ์ฌ ์ ํ์ ์ด๋ฉฐ, ์ฃผ๋ก ์์์ ์ ์๋ ค์ง ์บ๋ฆญํฐ์ ๊ตญํ๋ฉ๋๋ค.
- ์ค๋ช ๋ฐ์ดํฐ๋ ์ฃผ๋ก ์ ๋ขฐํ ์ ์๋ ๋ฐฑ๊ณผ์ฌ์ ์ด๋ ์๋ณธ ์ํ์์ ์์ง๋๋ฉฐ, ์์์ ๋๋ ์ต์ LLM์ ํ์ฉํด ์ฒ๋ฆฌ๋ฉ๋๋ค.
๋ฐ๋ชจ ๋ฐ์ดํฐ ์์ฑ ๋ฐฉ๋ฒ
๊ฒฝํ ์ถ์ถ(Experience Extraction):
- ์๋ณธ ์คํฌ๋ฆฝํธ๋ ๋๋ณธ์์ ์บ๋ฆญํฐ์ ๋ํ ๋ฐ ์ฅ๋ฉด์ ์ง์ ์ถ์ถํฉ๋๋ค.
- ์ถ์ถ๋ ๋ฐ์ดํฐ๋ ์บ๋ฆญํฐ์ ํน์ฑ์ ์ถฉ์คํ๊ฒ ๋ด์ง๋ง, ๋ฐฐ๊ฒฝ ์ง์์ด ๋ถ์กฑํด ์ค์ RPLA ํ์ต์ ํ๊ณ๊ฐ ์์ ์ ์์ต๋๋ค.
๋ํ ํฉ์ฑ(Dialogue Synthesis):
- ์ต์ LLM์ ํ์ฉํด ์บ๋ฆญํฐ ๋ํ๋ฅผ ์์ฑ ๋ฐ ๋ณด๊ฐํฉ๋๋ค.
- ๋ฌธํ, ์ผ๋ฐ ์์ ์ง์, ์ฑ๊ฒฉ ํ ์คํธ ๋ฑ ๋ค์ํ ์ฃผ์ ๋ก ํฉ์ฑํ๋ฉฐ, ์ธ-์ปจํ ์คํธ ๋ฌ๋์ด๋ ์ง์ ์ญํ ๋์ด๋ฅผ ํตํด ๋ฐ์ดํฐ๋ฅผ ์์ฐํฉ๋๋ค.
- ๋จ, ์์ฑ๋ ๋ํ์ ํ์ง์ โteacherโ LLM์ ํ๊ณ๋ก ์ธํด ์ถ๊ฐ์ ์ธ ํํฐ๋ง์ด ํ์ํ ์ ์์ต๋๋ค.
์ธ๊ฐ ์ฃผ์(Human Annotation):
- ์ค์ ์ธ๋ ฅ์ด ์ง์ ์บ๋ฆญํฐ ์ญํ ๋์ด๋ฅผ ์ํํ์ฌ ๋ํ ๋ฐ์ดํฐ๋ฅผ ์์งํฉ๋๋ค.
- ๋์ ๋ฐ์ดํฐ ํ์ง์ ๋ณด์ฅํ์ง๋ง, ๋น์ฉ๊ณผ ์๊ฐ์ด ๋ง์ด ์์๋ฉ๋๋ค.
- ์ด๋ฅผ ํตํด ๊ธฐ์กด ์บ๋ฆญํฐ๋ฟ ์๋๋ผ, ์๋ก์ด ์๋ณธ ์บ๋ฆญํฐ ๋ฐ์ดํฐ๋ ํ๋ณดํ ์ ์์ต๋๋ค.
์ํธ์์ฉ ๋ฐ์ดํฐ ๋ฐ ์๊ฐ์ ์ญํ ์ฌํ
- RPLA์ ์ฌ์ฉ์ ๊ฐ์ ์ํธ์์ฉ์ ํตํด ์ถ๊ฐ์ ์ธ ๋ํ ๋ฐ์ดํฐ๊ฐ ์ง์์ ์ผ๋ก ์์ฑ๋๋ฉฐ, ์ด๋ ๊ธฐ์กด ์บ๋ฆญํฐ ๋ฐ์ดํฐ๋ฅผ ๋ณด์ํฉ๋๋ค.
- ์ด ์ํธ์์ฉ ๋ฐ์ดํฐ๋ ์บ๋ฆญํฐ ํ๋ฅด์๋๊ฐ ์ฌ์ฉ์ ๊ฐ๋ณ ์ ํธ์ ๋ง์ถฐ ์ ์ง์ ์ผ๋ก ๋ณํํ๋๋ก ๋์ต๋๋ค.
- ๋ํ, ํน์ ์์ ์ ์ญํ ๋์ด(์: ์ด๋ฆฐ ์์ ์ ํด๋ฆฌ ํฌํฐ)๋ฅผ ์๊ตฌํ๋ ์์ฉ ์ฌ๋ก๋ ์บ๋ฆญํฐ ์ง์์ ์์ ๋ณ ์ ํ์ด๋ผ๋ ์ถ๊ฐ์ ์ธ ๋์ ๊ณผ์ ๋ฅผ ์ ์ํฉ๋๋ค.
5.3 Contruction of Character RPLAs
LLM์ ์บ๋ฆญํฐ ๋ฐ์ดํฐ๋ฅผ ์ฃผ์ ํ์ฌ ์บ๋ฆญํฐ RPLA๋ฅผ ๊ตฌ์ถํ๋ ๊ณผ์ ์ ์ค๋ช ํฉ๋๋ค. LLM์ ์ด๋ฏธ ์ธ์คํธ๋ญ์ ํ๋ก์๊ณผ ์บ๋ฆญํฐ ์ดํด ๋ฅ๋ ฅ์ ๊ฐ์ถ๊ณ ์์ผ๋ฏ๋ก, ์ ๊ณต๋ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ํน์ ์บ๋ฆญํฐ ์ญํ ์ ์ํํ ์ ์๊ฒ ๋ฉ๋๋ค.
Parametric Training ์ ๊ทผ๋ฒ
Parametric Training ๋ฐฉ๋ฒ์ ์ฌ์ ํ์ต(Pre-training)๊ณผ ์ง๋ํ์ต(Supervised Fine-Tuning)์ ํตํด, ๋๊ท๋ชจ ๋ฌธํ๊ณผ ๋ฐฑ๊ณผ์ฌ์ ๋ฑ์์ ์บ๋ฆญํฐ ๊ด๋ จ ์ง์์ ํ์ต์ํต๋๋ค. ์ด๋ฅผ ํตํด LLM์ Hermione Granger๋ Socrates์ ๊ฐ์ ๊ธฐ์กด ์บ๋ฆญํฐ์ ์ญํ ์ ์์ฐ์ค๋ฝ๊ฒ ์ํํ ์ ์๋๋ก ์ค๋น๋ฉ๋๋ค.
Nonparametric Prompting ์ ๊ทผ๋ฒ ๋ฐ ๋ฉ๋ชจ๋ฆฌ ๋ชจ๋
Nonparametric Prompting์ ํ๋กฌํํธ ๋ด์ ์บ๋ฆญํฐ ๋ฐ์ดํฐ๋ฅผ ์ง์ ํฌํจํ์ฌ LLM์ด ํด๋น ์บ๋ฆญํฐ๋ก ์ฆ๊ฐ ์ ํํ๋๋ก ์ ๋ํฉ๋๋ค. ๋ค๋ง, ์บ๋ฆญํฐ ๋ฐ์ดํฐ์ ์์ด ๋ง๊ณ ์ง์์ ์ธ ์ํธ์์ฉ ๋ฐ์ดํฐ๊ฐ ๋์ ๋จ์ ๋ฐ๋ผ, ์ปจํ ์คํธ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด ์ธ๋ถ ๋ฉ๋ชจ๋ฆฌ ๋ชจ๋์ ๋์ ํ๋ ๋ณด์์ ์ ๊ทผ์ด ํ์ํฉ๋๋ค.
5.4 Evaluation of Character RPLAs
์บ๋ฆญํฐ RPLA ํ๊ฐ์์๋ ๋ชจ๋ธ์ ์ญํ ์ํ ๋ฅ๋ ฅ(์บ๋ฆญํฐ ๋ ๋ฆฝ์ ๊ธฐ๋ฅ)๊ณผ ํน์ ์บ๋ฆญํฐ์ ์ถฉ์ค๋(์ธ์ด ์คํ์ผ, ์ง์, ์ฑ๊ฒฉ, ์ฌ๊ณ ๊ณผ์ )๋ผ๋ ๋ ์ถ์ผ๋ก ๋๋์ด ํ๊ฐํฉ๋๋ค.
Character-independent Capabilities
์ด ๋ถ๋ถ์ ๋ชจ๋ธ์ด ์ญํ ๋์ด ์์ ์์ฒด๋ฅผ ์ผ๋ง๋ ์ ์ํํ๋์ง ํ๊ฐํฉ๋๋ค. ํ๊ฐ ์์๋ก๋ ๋ํ ์ฐธ์ฌ, ๋ชฐ์ ๊ฐ, ์ ์ฐฝํ ์ธ์ด ์์ฑ, ๊ฐ์ ์ดํด, ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ ๋ฑ์ด ์์ผ๋ฉฐ, ๋ค์ํ ์ํธ์์ฉ ์์ค์ ๋ฐ๋ผ ๊ธฐ๋ณธ ์ญํ ์ํ ๋ฅ๋ ฅ๋ถํฐ ์ธ๊ฐ์ ๊ฐ๊น์ด โ์ธ๋ฅ ๋ชจ๋ฐฉโ ๋ฅ๋ ฅ๊น์ง ์ธก์ ํฉ๋๋ค.
Role-playing Engagement
RPLA๊ฐ ์ญํ ๋์ด ์ํฉ์์ ์ผ๋ง๋ ์ ๊ทน์ ์ผ๋ก ์ฐธ์ฌํ๋ฉฐ ๋ชฐ์ ํ๋์ง๋ฅผ ํ๊ฐํฉ๋๋ค. ์์ด์ ํธ๋ ๋ํ ํ์์ ์๋ต์ ์์ฑํ๊ณ , ๋ํ ์ ๋ฐ์ ๊ฑธ์ณ ์ผ๊ด๋ ์ธ๊ฒฉ๊ณผ ์ญํ ์ ์ ์งํด์ผ ํฉ๋๋ค. ๋น์ธ๊ฒฉ์ ์ธ ํํ(์: โ๋๋ AI ๋ชจ๋ธ์ ๋๋คโ)์ ํผํ๊ณ , ๋ํ์ ํ๋ฆ์ ์์ฐ์ค๋ฝ๊ฒ ๋ น์๋ค์ด์ผ ํ๋ค๋ ์ ์ ๊ฐ์กฐํฉ๋๋ค.
High-quality Conversations
RPLA๊ฐ ์์ฐ์ค๋ฝ๊ณ ์ ์ฐฝํ ๋ํ๋ฅผ ์์ฑํ๋ ๋ฅ๋ ฅ์ ํ๊ฐํฉ๋๋ค. ๋ํ์ ์์ ์ฑ, ์ ๋ณด ์ ๋ฌ์ ๋ช ํ์ฑ, ๊ทธ๋ฆฌ๊ณ ์ ์ฐฝํ ๋ฌธ์ฅ ๊ตฌ์ฑ์ด ์ฃผ์ ํ๊ฐ ์์๋ก ์ธ๊ธ๋ฉ๋๋ค. ๋ํ, ์ค๋ฆฌ์ ๊ธฐ์ค ์ค์๋ฅผ ํตํด ๋ถ์ ์ ํ๊ฑฐ๋ ํด๋ก์ด ์ฝํ ์ธ ์์ฑ์ด ๋ฐฉ์ง๋์ด์ผ ํจ์ ๊ฐ์กฐํฉ๋๋ค.
Anthropomorphic Capabilities
RPLA๊ฐ ์ธ๊ฐ๊ณผ ์ ์ฌํ ์ธ์ง, ๊ฐ์ , ์ฌํ์ ์ง๋ฅ์ ์ผ๋ง๋ ํจ๊ณผ์ ์ผ๋ก ๋ชจ๋ฐฉํ๋์ง๋ฅผ ํ๊ฐํฉ๋๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ๋ํ์ ๋งค๋ ฅ๋, ํ์ธ์ ์ฌ๋ฆฌ๋ฅผ ์ดํดํ๋ ๋ฅ๋ ฅ(Theory of Mind), ๊ณต๊ฐ ๋ฅ๋ ฅ, ๊ฐ์ฑ ์ง๋ฅ, ๊ทธ๋ฆฌ๊ณ ๋ชฉํ ์งํฅ์ ์ฌํ ๊ธฐ์ ๋ฑ ๋ค์ํ ์ฐจ์์ ์ธ๊ฐ์ ํน์ฑ์ด ๋ฐ์๋์ด์ผ ํจ์ ์ค๋ช ํฉ๋๋ค.
Character Fidelity
ํน์ ์บ๋ฆญํฐ๋ฅผ ์ฌํํ๋ ๋ฐ ์์ด, RPLA๊ฐ ์ผ๋ง๋ ๊ทธ ์บ๋ฆญํฐ์ ์ธ์ด ์คํ์ผ, ๋ฐฐ๊ฒฝ ์ง์, ์ฑ๊ฒฉ ๋ฐ ์ฌ๊ณ ๊ณผ์ ์ ์ ํํ๊ฒ ๋ฐ์ํ๋์ง๋ฅผ ํ๊ฐํฉ๋๋ค. ์ด ๊ณผ์ ์์๋ ์บ๋ฆญํฐ ํ ๋ฃจ์๋ค์ด์ (๋ชจ๋ธ์ด ์บ๋ฆญํฐ์ ๋ฒ์๋ฅผ ๋์ด์ ์ ๋ณด๋ฅผ ์์ฑํ๋ ๋ฌธ์ )๋ ํจ๊ป ๊ณ ๋ ค๋ฉ๋๋ค.
Linguistic Style
RPLA๊ฐ ํด๋น ์บ๋ฆญํฐ์ ๊ณ ์ ํ ์ธ์ด์ ์คํ์ผ๊ณผ ์ด์กฐ๋ฅผ ์ผ๋ง๋ ์ถฉ์คํ ๋ชจ๋ฐฉํ๋์ง๋ฅผ ํ๊ฐํฉ๋๋ค. ์บ๋ฆญํฐ์ ํํ ๋ฐฉ์, ์ดํ ์ฌ์ฉ, ๋ฌธ์ฒด ๋ฑ์ด ์ธ-์ปจํ ์คํธ ๋ฌ๋์ ํตํด ์ฌํ๋์ด์ผ ํ๋ฉฐ, ์ด๋ฅผ ํตํด ์บ๋ฆญํฐ์ ์ ์ฒด์ฑ์ด ์์ฐ์ค๋ฝ๊ฒ ์ ๋ฌ๋๋์ง ํ์ธํฉ๋๋ค.
Knowledge
๋ชจ๋ธ์ด ํด๋น ์บ๋ฆญํฐ๊ฐ ๋ณด์ ํด์ผ ํ๋ ๋ฐฐ๊ฒฝ ์ง์๊ณผ ์ ์ฒด์ฑ ์ ๋ณด๋ฅผ ์ ํํ ๊ธฐ์ตํ๊ณ ์ฌํํ๋ ๋ฅ๋ ฅ์ ์ค์ ์ ์ผ๋ก ๋ค๋ฃน๋๋ค. ์บ๋ฆญํฐ์ ์ด๋ฆ, ์์, ๊ด๊ณ, ๊ฒฝํ ๋ฑ ํต์ฌ ์ ๋ณด๋ฅผ ์ฌ๋ฐ๋ฅด๊ฒ ๋ฐ์ํ๋ฉฐ, ๋ถํ์ํ๊ฒ ์บ๋ฆญํฐ ๋ฒ์๋ฅผ ๋์ด์ ์ ๋ณด๋ฅผ ์์ฑํ๋ โ์บ๋ฆญํฐ ํ ๋ฃจ์๋ค์ด์ โ์ ๋ฐฉ์งํ๋ ๊ฒ์ด ์ค์ํ๋ค๊ณ ์ค๋ช ํฉ๋๋ค.
Personality and Thinking Process
RPLA๊ฐ ์บ๋ฆญํฐ์ ๋ด๋ฉด์ ์ฑ๊ฒฉ๊ณผ ์ฌ๊ณ ๊ณผ์ ์ ์ผ๋ง๋ ์ ๋ชจ๋ฐฉํ๋์ง๋ฅผ ํ๊ฐํฉ๋๋ค. ์บ๋ฆญํฐ์ ๋๊ธฐ, ๊ฒฐ์ ๊ณผ์ , ๊ทธ๋ฆฌ๊ณ ์ฌ๋ฆฌ์ ํน์ฑ์ ์ฌํํจ์ผ๋ก์จ, ๋จ์ํ ์ธ์ด ์คํ์ผ์ ๋์ด ์ง์ ํ โ์บ๋ฆญํฐ์ ๋ด๋ฉดโ์ ํํํ๋์ง์ ์ด์ ์ ๋ง์ถฅ๋๋ค. ์ด๋ฅผ ์ํด ์ฌ๋ฆฌ ํ๊ฐ ๋๊ตฌ ๋ฑ์ ํ์ฉํด ์ ๋ฐํ๊ฒ ๋ถ์ํ ์ ์์์ ์ธ๊ธํฉ๋๋ค.
Evaluation methods
ํ๊ฐ ๋ฐฉ๋ฒ์ผ๋ก๋ ์๋ ํ๊ฐ(ground truth ๊ธฐ๋ฐ ๋ฐ ๋น๊ธฐ๋ฐ), ๋ค์ง์ ๋คํ ๋ฌธ์ , ๊ทธ๋ฆฌ๊ณ ์ ๋ฌธ๊ฐ๋ ์ธ๊ฐ ํ๊ฐ์์ ์ํ ์ธ์ ํ๊ฐ๊ฐ ์ฌ์ฉ๋ฉ๋๋ค. ์ด๋ฌํ ๋ณตํฉ ํ๊ฐ ๋ฐฉ์์ ํตํด, ์บ๋ฆญํฐ RPLA์ ์ญํ ์ํ๊ณผ ์ถฉ์ค๋๋ฅผ ์ข ํฉ์ ์ผ๋ก ๊ฒ์ฆํฉ๋๋ค.
Automatic Evaluation with Ground Truth
์ ๋ต(ground truth) ๋ฐ์ดํฐ๊ฐ ์์ ๋, ์๋ ํ๊ฐ ๊ธฐ๋ฒ์ ํ์ฉํ์ฌ RPLA์ ์๋ต๊ณผ ๊ธฐ์ค ๋ต๋ณ ๊ฐ์ ์ ์ฌ๋๋ฅผ ์ธก์ ํ๋ ๋ฐฉ๋ฒ์ ์ค๋ช ํฉ๋๋ค. ์ด๊ธฐ์๋ Rouge-L ๊ฐ์ ์ ํต์ ์ ์ฌ๋ ์งํ๊ฐ ์ฌ์ฉ๋์์ผ๋, ์ต๊ทผ์๋ GPT-4์ ๊ฐ์ ์ฒจ๋จ LLM์ ํ๊ฐ์๋ก ํ์ฉํ์ฌ, ์ฃผ์ด์ง ๊ธฐ์ค(๋๊ฐ ๊ณ ๊ธ LLM์ด ์์ฑํ ์ ๋ต)์ ๋ฐํ์ผ๋ก ์๋ต ์ ์๋ ์ฐ์ ๋ต๋ณ์ ์ฐ์ถํ๋ ๋ฐฉ์์ด ์ฃผ๋ฅ๋ฅผ ์ด๋ฃจ๊ณ ์์์ ์ธ๊ธํฉ๋๋ค.
Automatic Evaluation without Ground Truth
์ ๋ต ๋ฐ์ดํฐ๊ฐ ๋ถ์กฑํ ์ํฉ์์, ํ๊ฐ LLM์ด ์บ๋ฆญํฐ ํ๋กํ ๋ฑ์ ์ ๋ณด๋ฅผ ์ฐธ๊ณ ํ์ฌ RPLA ์๋ต์ ํ๊ฐํ๋ ๋ฐฉ๋ฒ์ ๋ํด ๋ค๋ฃน๋๋ค. ์ด ๋ฐฉ์์ ์บ๋ฆญํฐ ๋ ๋ฆฝ์ ๋ฅ๋ ฅ์ด๋ ์ธ์ด ์คํ์ผ ํ๊ฐ์ ํจ๊ณผ์ ์ด์ง๋ง, ์บ๋ฆญํฐ ๊ณ ์ ์ ์ง์๊ณผ ์ฌ๊ณ ๊ณผ์ ์ ํ๊ฐํ๋ ๋ฐ๋ ํ๊ณ๊ฐ ์์ด, ์ต์ํ์ง ์์ ์บ๋ฆญํฐ์ ๋ํด์๋ ๋ถ์ ํํ ํ๋จ์ ๋ด๋ฆด ์ํ์ด ์์์ ์ง์ ํฉ๋๋ค.
Multi-choice Questions
๊ฐ๊ด์ ๋ฌธ์ ๋ฅผ ํ์ฉํ ํ๊ฐ ๋ฐฉ์์ ์๊ฐํฉ๋๋ค. RPLA๊ฐ ๋ฏธ๋ฆฌ ์ ํด์ง ์ ํ์ง ์ค์์ ๋ต์ ์ ํํ๋๋ก ํจ์ผ๋ก์จ, ์๋ต์ ์ถ๋ ฅ ๊ณต๊ฐ์ ์ถ์ํ๊ณ ํ๊ฐ๋ฅผ ๋จ์ํํ ์ ์์ต๋๋ค. ํนํ, ์บ๋ฆญํฐ์ ์ฌ๊ณ ๊ณผ์ ์ด๋ ํ๋ ์์ธก ๋ฑ์์ ์ ๋ต๊ณผ ๋ค์ ์ฐจ์ด๊ฐ ์๋๋ผ๋ ํฉ๋ฆฌ์ ์ธ ์๋ต์ ํ๊ฐํ ์ ์๋ ์ฅ์ ์ด ๊ฐ์กฐ๋ฉ๋๋ค.
Human Evaluation
์ธ๊ฐ ํ๊ฐ์์ ์ง์ ํ๊ฐ ๋ฐฉ์์ ์ค๋ช ํฉ๋๋ค. ์ธ๊ฐ ํ๊ฐ์๋ RPLA์ ์๋ต์ ์ ๋ฐํ๊ฒ ๋ถ์ํ ์ ์์ผ๋, ์๊ฐ๊ณผ ๋น์ฉ์ด ๋ง์ด ๋ค๊ณ ์ฌํ์ฑ์ด ๋ฎ์ ๋จ์ ์ด ์์ต๋๋ค. ๋ํ, ์บ๋ฆญํฐ์ ๋ํด ๊น์ ์ดํด๋ฅผ ๊ฐ์ง ํ๊ฐ์๋ฅผ ํ๋ณดํ๊ธฐ ์ด๋ ต๋ค๋ ์ ์ด ์ธ๊ธ๋๋ฉฐ, ์ผ๋ถ ์ฐ๊ตฌ์์๋ ์๋ ํ๊ฐ์ ์ธ๊ฐ ํ๊ฐ๋ฅผ ๊ฒฐํฉํ์ฌ ํ๊ฐ LLM์ ๋ฏธ์ธ ์กฐ์ ํ๋ ์๋๋ ์งํ๋๊ณ ์์์ ์๊ฐํฉ๋๋ค.
6. Individualized Persona(lization)
6.1 Definition
๊ฐ๋ณํ ํ๋ฅด์๋๋ ์ฌ์ฉ์์ ๊ณ ์ ํ ํน์ฑ, ๊ฒฝํ, ์ ํธ ๋ฑ์ ๋ฐ์ํ์ฌ LLM ๊ธฐ๋ฐ ์์ด์ ํธ๋ฅผ ๋ง์ถคํ์ผ๋ก ๋ง๋๋ ๊ณผ์ ์ ์๋ฏธํฉ๋๋ค. ์ด๋ฅผ ํตํด ๋์งํธ ํด๋ก ์ด๋ ๊ฐ์ธ ๋น์์ฒ๋ผ, ์ฌ์ฉ์์ ๊ฐ๋ณ ์๊ตฌ์ ์ต์ ํ๋ ์๋น์ค๋ฅผ ์ ๊ณตํ ์ ์์ต๋๋ค.
๊ฐ์ธํ๋ RPLA์ ์์ฉ์ ์ฃผ๋ก ์ธ ๊ฐ์ง ์์ญ์ผ๋ก ๊ตฌ๋ถ๋ฉ๋๋ค.
- ๋ํ: ์ฌ์ฉ์์ ์คํ์ผ๊ณผ ์ทจํฅ์ ๋ง์ถ ์ํธ์์ฉ ์ง์
- ์ถ์ฒ: ๊ฐ์ธ์ ์ ํธ๋ฅผ ๋ฐ์ํ ๋ง์ถคํ ์ถ์ฒ ๊ธฐ๋ฅ ์ ๊ณต
- ๊ณผ์ ํด๊ฒฐ: ๋ณต์กํ ์์ ์ ์์จ์ ์ผ๋ก ์ํํ ์ ์๋ ๊ธฐ๋ฅ ๊ตฌํ
๊ฐ์ธํ ํ๋ฅด์๋ ๊ตฌ์ถ์ ๋ ๊ฐ์ง ์ฃผ์ ๋จ๊ณ๋ก ์ด๋ฃจ์ด์ง๋๋ค.
- ํ๋ฅด์๋ ๋ฐ์ดํฐ ์์ง: ์ฌ์ฉ์ ํ๋กํ, ๋ํ ๊ธฐ๋ก, ๋๋ฉ์ธ ์ง์ ๋ฑ ๋ค์ํ ํํ์ ๋ฐ์ดํฐ๋ฅผ ๋ชจ์๋๋ค.
- ํ๋ฅด์๋ ๋ชจ๋ธ๋ง: ์์ง๋ ๋ฐฉ๋ํ ๋ฐ์ดํฐ ๋ด์์ ๋ ธ์ด์ฆ์ ํฌ์์ฑ์ ๊ทน๋ณตํ๋ฉฐ, ์ฌ์ฉ์์ ๊ณ ์ ํน์ฑ์ ํจ๊ณผ์ ์ผ๋ก ๋ด์ฌํํ๋ ๋ชจ๋ธ์ ์ค๊ณํฉ๋๋ค.
6.2 Data Collection of Individualized Persona

๊ฐ์ธํ ํ๋ฅด์๋๋ฅผ ๊ตฌ์ถํ๊ธฐ ์ํด ์์งํด์ผ ํ๋ ๋ฐ์ดํฐ๋ ์ฃผ๋ก ์ธ ๊ฐ์ง ์ ํ์ผ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
- ํ๋กํ ๋ฐ์ดํฐ: ์ฌ์ฉ์์ ๋์ด, ์ฑ๋ณ, ์ง์ ๋ฑ ๊ธฐ๋ณธ ์ ๋ณด๋ฅผ ํฌํจํฉ๋๋ค.
- ์ํธ์์ฉ ๋ฐ์ดํฐ: ์ฌ์ฉ์์ ๋ํ ๊ธฐ๋ก ๋ฐ ํ๋ ํจํด์ ์บก์ฒํฉ๋๋ค.
- ๋๋ฉ์ธ ์ง์: ์ฌ์ฉ์์ ๊ด์ฌ์ฌ๋ ํน์ ๋ถ์ผ ๊ด๋ จ ์ ๋ฌธ ์ ๋ณด๋ฅผ ๋ฐ์ํฉ๋๋ค.
์์ง๋ ๋ค์ํ ๋ฐ์ดํฐ๋ ์์ด ๋ง๊ณ ํฌ์ํ๋ฉฐ ๋ ธ์ด์ฆ๊ฐ ํฌํจ๋ ๊ฐ๋ฅ์ฑ์ด ์์ผ๋ฏ๋ก, ์ด๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ ์ฒ๋ฆฌํ๊ณ ํตํฉํ๋ ๊ณผ์ ์ด ํ์์ ์ ๋๋ค.
6.3 Modeling Individualized Persona
๊ฐ๋ณํ ํ๋ฅด์๋ ๋ชจ๋ธ๋ง์ ๋ชฉํ์ ํ์์ฑ์ ์๊ฐํ๋ฉฐ, ๋ ๊ฐ์ง ์ฃผ์ ํ์ต ์ ๋ต์ธ offline learning(์ฌ์ ๋ฐฐ์น ํ์ต)๊ณผ online learning(์ค์๊ฐ ์ ๋ฐ์ดํธ)์ด ์ํธ ๋ณด์์ ์ผ๋ก ํ์ฉ๋๋ค๋ ์ ์ฒด ๊ฐ์๋ฅผ ์ ์ํฉ๋๋ค.
Offline Learning
์คํ๋ผ์ธ ํ์ต์ ์ฌ์ฉ์ ํ๋กํ, ๋ํ ๊ธฐ๋ก, ๋๋ฉ์ธ ์ง์ ๋ฑ ๊ณผ๊ฑฐ์ ์์ง๋ ์ ์ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ชจ๋ธ์ ์ด๊ธฐ ํ์ต์ํค๋ ๋ฐฉ๋ฒ์ ์ค๋ช ํฉ๋๋ค. ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๋ฐ ํตํฉ ๊ณผ์ ์ ํตํด ๋ ธ์ด์ฆ์ ํฌ์์ฑ์ ๊ทน๋ณตํ๊ณ , ์ฌ์ฉ์์ ๊ณ ์ ํน์ฑ์ ์์ ์ ์ผ๋ก ๋ด์ฌํํ๋ ๋ชจ๋ธ์ ๊ตฌ์ถํฉ๋๋ค. ์ด๊ธฐ ํ๋ฅด์๋ ํํ์ ๊ธฐ์ด๋ฅผ ๋ง๋ จํ์ฌ, ์ดํ ์ค์๊ฐ ์ ๋ฐ์ดํธ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
Online Learning
์จ๋ผ์ธ ํ์ต์ ์ค์ ์ฌ์ฉ์์์ ์ํธ์์ฉ์ ํตํด ์ง์์ ์ผ๋ก ๋ชจ๋ธ์ ์ ๋ฐ์ดํธํ๋ ๋ฐฉ๋ฒ์ ๋ค๋ฃน๋๋ค. ์ฌ์ฉ์ ํผ๋๋ฐฑ๊ณผ ์ต์ ์ํธ์์ฉ ๋ฐ์ดํฐ๋ฅผ ๋ฐ์ํ์ฌ, ๊ฐ๋ณ ํ๋ฅด์๋๊ฐ ์๊ฐ์ ๋ฐ๋ผ ๋ณํํ๋ ์ฌ์ฉ์์ ํน์ฑ์ ์ค์๊ฐ์ผ๋ก ํฌ์ฐฉํฉ๋๋ค. ๋ชจ๋ธ์ ์ ์ฐ์ฑ์ ๋์ฌ, ์ต์ ์ฌ์ฉ์ ์ ๋ณด์ ๊ธฐ๋ฐํ ๋ง์ถค ์๋ต์ ์ ๊ณตํ๋๋ก ๋ณด์ํฉ๋๋ค.
์คํ๋ผ์ธ ํ์ต์ผ๋ก ๊ตฌ์ถ๋ ์ด๊ธฐ ํ๋ฅด์๋์ ์จ๋ผ์ธ ํ์ต์ผ๋ก ๋ฐ์๋๋ ์ต์ ์ ๋ณด ์ฌ์ด์ ๊ท ํ ์ ์ง๊ฐ ํ์ํจ์ ๊ฐ์กฐํฉ๋๋ค.
6.4 Evaluation for LLMs and Individualized Persona
ํ๊ฐ ๊ธฐ์ค์ LLM์ด ์ฌ์ฉ์ ๊ฐ๋ณ ํน์ฑ์ ์ผ๋ง๋ ํจ๊ณผ์ ์ผ๋ก ๋ฐ์ํ๋์ง, ๊ทธ๋ฆฌ๊ณ ๋ค์ํ ์์ฉ ์ํฉ์์ ๋ง์ถคํ ์๋ต์ ์ ๊ณตํ๋์ง์ ์ค์ ์ ๋ก๋๋ค.
ํ๊ฐ ํญ๋ชฉ์ ๋ํ, ์ถ์ฒ, ๊ณผ์ ํด๊ฒฐ ๋ฑ ์๋ก ๋ค๋ฅธ ์ฌ์ฉ ์ฌ๋ก์ ๋ฐ๋ผ ๊ตฌ๋ถ๋๋ฉฐ, ๊ฐ ๋ฒ์ฃผ๋ณ๋ก ์ธ๋ถ ํ๊ฐ ๊ธฐ์ค์ด ์กด์ฌํจ์ ์ค๋ช ํฉ๋๋ค.
Converstaion
์ฌ์ฉ์์ ๋ํ ์คํ์ผ, ๋ฌธ์ฒด, ๊ทธ๋ฆฌ๊ณ ์ํฉ์ ๋ง๋ ์๋ต ์์ฑ ๋ฅ๋ ฅ ๋ฑ, ๋ํ์ ๋ชฐ์ ๋์ ๊ฐ์ธํ ์ ๋๊ฐ ์ฃผ์ ํ๊ฐ ์์๋ก ๋ค๋ค์ง๋๋ค.
Recommendation
์ฌ์ฉ์ ์ ํธ์ ๊ณผ๊ฑฐ ์ํธ์์ฉ์ ๋ฐ์ํด ๊ด๋ จ์ฑ ๋์ ์ถ์ฒ์ ์์ฑํ๋์ง, ๊ทธ๋ฆฌ๊ณ ์ถ์ฒ ๊ณผ์ ์ด ๋ค์ค ํด ๋ํ ์์์ ์์ฐ์ค๋ฝ๊ฒ ์ด๋ฃจ์ด์ง๋์ง๋ฅผ ์ค์ ์ ์ผ๋ก ์ดํด๋ด ๋๋ค.
Task Solving
์ฌ์ฉ์ ๊ฐ๋ณ ๋ฐ์ดํฐ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํ์ฉํ์ฌ ๋๋ฉ์ธ๋ณ ๋ฌธ์ ํด๊ฒฐ, ๊ณํ ์๋ฆฝ ๋ฑ ๊ณ ์ฐจ์์ ์ธ ์์ ์ ์์จ์ ์ผ๋ก ์ฒ๋ฆฌํ ์ ์๋์ง, ๊ทธ๋ฆฌ๊ณ ๊ทธ ๊ฒฐ๊ณผ๋ฌผ์ด ์ผ๋ง๋ ์ค์ฉ์ ์ธ์ง๋ฅผ ๊ฒํ ํฉ๋๋ค.
7. Risks Beneath RPLA Applications
7.1 Toxicity
Inherent Toxicity in LLMs
LLM์ ๋๊ท๋ชจ ํ ์คํธ ๋ฐ์ดํฐ์์ ํ์ตํ๋ฉด์, ๋ฐ์ดํฐ์ ๋ด์ฌํ ๋ถ์ ์ ์ธ์ด ํจํด, ์ฌํ์ ํธํฅ, ๊ณ ์ ๊ด๋ ๋ฑ์ ํจ๊ป ํ์ตํฉ๋๋ค. ์ด๋ก ์ธํด ๋ชจ๋ธ์ ๊ธฐ๋ณธ์ ์ผ๋ก ๋ ์ฑ(toxic) ์ธ์ด๋ฅผ ์์ฑํ ๊ฐ๋ฅ์ฑ์ด ์์ผ๋ฉฐ, ์ด๋ ์๋์น ์๊ฒ ํด๋ก์ด ํํ์ด๋ ๊ณต๊ฒฉ์ ์ธ ์ธ์ด๋ก ์ด์ด์ง ์ ์์ต๋๋ค.
The RPLAs Conundrum
์ญํ ๋์ด ์์ด์ ํธ(RPLA)๋ ํน์ ํ๋ฅด์๋๋ฅผ ์๋ฎฌ๋ ์ด์ ํ๊ธฐ ์ํด ๊ณ ์์ ์ผ๋ก ๋ค์ํ ์ธ๊ฒฉ์ ํน์ฑ์ ๊ตฌํํฉ๋๋ค. ๊ทธ๋ฌ๋ ์ด๋ฌํ ํ๋ฅด์๋ ๊ตฌํ ๊ณผ์ ์์, ๋ ์ฑ ํํ์ด๋ ๋ถ์ ์ ํ ํ๋์ด ๋์ฑ ๋ถ๊ฐ๋ ์ ์๋ ๋๋ ๋ง(Conundrum)๊ฐ ๋ฐ์ํฉ๋๋ค. ์ฆ, ์ญํ ์ฌํ์ ์ฌ์ค์ฑ๊ณผ ๋ชฐ์ ๊ฐ์ ๋์ด๋ ค ํ ์๋ก, ์๋ ๋ด์ฌ๋์ด ์๋ ๋ ์ฑ ๋ฌธ์ ๋ ํจ๊ป ๋ ธ์ถ๋ ์ํ์ด ์ปค์ง๋๋ค.
Strategies for Balancing Safety and Performance
๋ ์ฑ ๋ฌธ์ ๋ฅผ ์ํํ๋ฉด์๋ ์์ด์ ํธ์ ์ญํ ์ํ ๋ฅ๋ ฅ์ ์ ์งํ๊ธฐ ์ํ ๋ค์ํ ์ ๋ต๋ค์ด ๋ ผ์๋ฉ๋๋ค. ์ฌ๊ธฐ์๋ ๊ฐํํ์ต(์: ์ธ๊ฐ ํผ๋๋ฐฑ ๊ฐํ ํ์ต: RLHF), ํ๋กฌํํธ ์ค๊ณ์ ์ ๊ตํ, ์์ ํํฐ ๋ฐ ํ์ฒ๋ฆฌ ๊ธฐ๋ฒ ๋ฑ์ด ํฌํจ๋์ด, ๋ ์ฑ์ด ๋ฎ์ ๋์์ ์ฑ๋ฅ ์ข์ ์ถ๋ ฅ์ ๋์ถํ๋ ค๋ ๋ ธ๋ ฅ์ด ๊ฐ์กฐ๋ฉ๋๋ค.
7.2 Bias
Bias Manifestation in Role-Playing Scenarios
์ญํ ๋์ด ์ํฉ์์๋ LLM์ด ํ์ต ๋ฐ์ดํฐ์ ์กด์ฌํ๋ ์ฌํ์ , ๋ฌธํ์ ํธํฅ์ ๊ทธ๋๋ก ์ฌํํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ํน์ ์ธ๋ฌผ์ด๋ ์ง๋จ์ ๋ํด ๊ณ ์ ๊ด๋ ์ ์ธ ์์ ์ด๋ ๋ถ์ ํํ ํํ์ด ๋ํ๋ ์ ์์ผ๋ฉฐ, ์ด๋ ์ฌ์ฉ์ ๊ฒฝํ์ ๋ถ์ ์ ์ํฅ์ ๋ฏธ์นฉ๋๋ค.
Causes of Bias in RPLAs
ํธํฅ์ ์ฃผ์ ์์ธ์ ๋ถ๊ท ํํ ํ์ต ๋ฐ์ดํฐ, ๋ชจ๋ธ ์ค๊ณ ์์ ํ๊ณ, ๊ทธ๋ฆฌ๊ณ ์ฌํ ์ ๋ฐ์ ์กด์ฌํ๋ ์ ์ ๊ฒฌ ๋ฑ์ ๋๋ค. ํนํ, ๋๊ท๋ชจ ์น ํฌ๋กค๋ง ๋ฐ์ดํฐ๋ ๋ค์ํ ํธํฅ์ ํฌํจํ๊ณ ์์ด, ์ด๋ฅผ ๊ทธ๋๋ก ํ์ตํ๋ฉด RPLA๊ฐ ํธํฅ๋ ํ๋ฅด์๋๋ฅผ ์์ฑํ ์ ์์ต๋๋ค.
Strategies for Mitigating Bias
๋ฐ์ดํฐ ๋ค์ํ ๋ฐ ๋ฐํธํฅ ๋ฐ์ดํฐ์ ๊ตฌ์ถ, ์๊ณ ๋ฆฌ์ฆ์ ์์ , ํ๋กฌํํธ ์ค๊ณ ๊ฐ์ ๋ฑ ์ฌ๋ฌ ์ ๋ต์ ํตํด ํธํฅ ๋ฌธ์ ๋ฅผ ์ํํ๋ ๋ฐฉ์์ด ์ ์๋ฉ๋๋ค. ๋ํ, ํ๊ฐ ๊ณผ์ ์์ ํธํฅ์ ๊ฐ์งํ๊ณ ์์ ํ๋ ํ์ฒ๋ฆฌ ๋จ๊ณ๋ ์ค์ํ ์ญํ ์ ํ๋ฉฐ, ์ง์์ ์ธ ๋ชจ๋ํฐ๋ง๊ณผ ์ ๋ฐ์ดํธ๊ฐ ํ์ํฉ๋๋ค.
Persona Construction Bias
ํ๋ฅด์๋๋ฅผ ๊ตฌ์ฑํ๋ ๊ณผ์ ์์ฒด์์ ์ ํ๋๋ ํน์ฑ, ์์ ๋ฐฉ์, ํน์ ๋ฐ์ดํฐ์ ์ถ์ฒ๊ฐ ํธํฅ์ ๊ฐํํ ์ ์์ต๋๋ค. ๋ฐ๋ผ์, ํ๋ฅด์๋ ์ค๊ณ ์์๋ ๋ค์ํ ๊ด์ ๊ณผ ๊ท ํ ์กํ ์ ๋ณด๋ฅผ ๋ฐ์ํ์ฌ, ํน์ ์ง๋จ์ด๋ ์ธ๋ฌผ์ ๋ํ ์๊ณก๋ ํํ์ ์ต์ํํ๋ ๋ ธ๋ ฅ์ด ์๊ตฌ๋ฉ๋๋ค.
7.3 Hallucination
Hallucination in RPLAs
LLM์ ๋๋๋ก ํ์ต ๋ฐ์ดํฐ์ ๊ทผ๊ฑฐํ์ง ์์ ์ ๋ณด๋ฅผ ์์ฑํ๋ โํ ๋ฃจ์๋ค์ด์ โ ๋ฌธ์ ๋ฅผ ๋ณด์ ๋๋ค. ํนํ, ์ญํ ๋์ด ์ํฉ์์๋ ์บ๋ฆญํฐ์ ๋ฐฐ๊ฒฝ์ด๋ ํน์ฑ์ ๊ณผ๋ํ๊ฒ ์ผ๋ฐํํ๊ฑฐ๋ ๋ถ์ ํํ ์ธ๋ถ ์ ๋ณด๋ฅผ ์ถ๊ฐํ๋ ๊ฒฝ์ฐ๊ฐ ๋ฐ์ํฉ๋๋ค.
Mitigating Hallucinations in RPLAs
ํ ๋ฃจ์๋ค์ด์ ๋ฌธ์ ๋ฅผ ์ค์ด๊ธฐ ์ํด, ์ธ๋ถ ์ง์ ๊ฒ์(Retrieval-augmented Generation) ๊ธฐ๋ฒ, ๋ฐ์ดํฐ ๋ณด๊ฐ, ๊ทธ๋ฆฌ๊ณ ๋ฏธ์ธ ์กฐ์ (fine-tuning) ๊ธฐ๋ฒ์ด ์ ์ฉ๋ฉ๋๋ค. ๋ํ, ์์ฑ๋ ํ ์คํธ์ ์ฌ์ค์ฑ์ ๊ฒ์ฆํ๋ ์๋ ํ๊ฐ ๋ฐ ์ธ๊ฐ ํ๊ฐ ์ ์ฐจ๋ฅผ ํตํด, ํ ๋ฃจ์๋ค์ด์ ๋ฐ์ ๋น๋๋ฅผ ๋ฎ์ถ๊ณ ๋ณด๋ค ์ ๋ขฐ์ฑ ์๋ ์ถ๋ ฅ์ ๋์ถํ๋ ค๋ ๋ ธ๋ ฅ์ด ๊ฐ์กฐ๋ฉ๋๋ค.
7.4 Privacy Violations
Privacy Challenges in LLMs
LLM์ ๋๊ท๋ชจ ๋ฐ์ดํฐ ํ์ต ๊ณผ์ ์์ ๋ฏผ๊ฐํ ์ ๋ณด๋ ๊ฐ์ธ ์ ๋ณด๋ฅผ ๋ฌด์ฌ์ฝ ํ์ตํ ๊ฐ๋ฅ์ฑ์ด ์์ต๋๋ค. ์ด๋ก ์ธํด, ์์ฑ๋ ํ ์คํธ์ ์์น ์๋ ๊ฐ์ธ ์ ๋ณด๊ฐ ํฌํจ๋๊ฑฐ๋, ๋ฐ์ดํฐ ์ ์ถ๊ณผ ๊ด๋ จ๋ ์ํ์ด ๋ฐ์ํ ์ ์์ต๋๋ค.
Hidden Danger of Privacy Violations in RPLAs
RPLA๋ ๊ฐ๋ณ ์ฌ์ฉ์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํด ๊ฐ์ธํ๋ ์๋น์ค๋ฅผ ์ ๊ณตํ๊ธฐ ๋๋ฌธ์, ๋์ฑ ์๋ฐํ๊ฒ ๊ฐ์ธ์ ๋ณด๊ฐ ๋ ธ์ถ๋ ์ํ์ด ์์ต๋๋ค. ์ฌ์ฉ์์ ๋ํ ๊ธฐ๋ก์ด๋ ํ๋ ํจํด์ด ๋ถ์ ์ ํ๊ฒ ์ฒ๋ฆฌ๋๋ฉด, ํ๋ผ์ด๋ฒ์ ์นจํด ์ฌ๋ก๊ฐ ๋ฐ์ํ ์ ์์์ ๊ฒฝ๊ณ ํฉ๋๋ค.
Strategies for Enhancing Privacy
๊ฐ์ธ์ ๋ณด ๋ณดํธ๋ฅผ ์ํด ๋ฐ์ดํฐ ์ต๋ช ํ, ์์ ํ ์ ์ฅ ๋ฐ ์ ๊ทผ ์ ์ด, ๊ทธ๋ฆฌ๊ณ ์ฐจ๋ฑ ๊ฐ์ธ์ ๋ณด ๋ณดํธ(Differential Privacy) ๊ธฐ๋ฒ ๋ฑ์ด ์ ์๋ฉ๋๋ค. ๋ํ, ๋ชจ๋ธ์ด ๋ฏผ๊ฐ ์ ๋ณด๋ฅผ ํ์ตํ์ง ์๋๋ก ํ๋ ์ฌ์ ํํฐ๋ง ๋ฐ ํ์ฒ๋ฆฌ ๋จ๊ณ๋ ์ค์ํ๋ฉฐ, ์ค์๊ฐ ๋ชจ๋ํฐ๋ง ์ฒด๊ณ๋ฅผ ๋์ ํ๋ ๋ฐฉ์๋ ๊ณ ๋ ค๋ฉ๋๋ค.
7.5 Technical Challenges in Real-world Deployment
Lack of Social Intelligence and Theory of Mind
์ค์ ์ฌํ์ ์ํธ์์ฉ์์ LLM์ ์ธ๊ฐ๊ณผ ๊ฐ์ ์ฌํ์ ์ง๋ฅ์ด๋ ํ์ธ์ ์ฌ๋ฆฌ๋ฅผ ์์ธกํ๋ ๋ฅ๋ ฅ์ด ๋ถ์กฑํฉ๋๋ค. ์ด๋ก ์ธํด, ๋ณต์กํ ์ฌํ์ ๋งฅ๋ฝ์ด๋ ๋ฏธ๋ฌํ ๊ฐ์ ํํ, ์ํธ์์ฉ์ ๋์์ค๋ฅผ ์ ํํ๊ฒ ํ์ ํ๊ธฐ ์ด๋ ค์์ง๋๋ค.
Long-context Challenges
๊ธด ๋ํ๋ ๋ณต์กํ ์๋๋ฆฌ์ค์์ ์ปจํ ์คํธ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ ์งํ๋ ๋ฐ ํ๊ณ๊ฐ ์์ต๋๋ค. LLM์ ๊ณ ์ ๋ ์ปจํ ์คํธ ์๋์ฐ๋ก ์ธํด, ์ฅ์๊ฐ ์ํธ์์ฉ ์ ์ค์ํ ์ ๋ณด๊ฐ ๋๋ฝ๋๊ฑฐ๋ ์ผ๊ด์ฑ์ด ๋จ์ด์ง๋ ๋ฌธ์ ๊ฐ ๋ฐ์ํ ์ ์์ต๋๋ค.
Knowledge Gaps
LLM์ ์ต์ ์ ๋ณด๋ ํน์ ๋๋ฉ์ธ์ ๋ํ ์ ๋ฌธ ์ง์์์ ๊ฐ๊ทน์ด ์กด์ฌํ ์ ์์ผ๋ฉฐ, ์ด๋ก ์ธํด ์ญํ ๋์ด ๊ณผ์ ์์ ๋ถ์ ํํ๊ฑฐ๋ ๋ถ์์ ํ ์ ๋ณด๋ฅผ ์ ๊ณตํ ์ํ์ด ์์ต๋๋ค. ํนํ, ์์๊ฐ๊ฐ ๋ณํํ๋ ์ค์๊ฐ ์ ๋ณด๋ ์ต์ ํธ๋ ๋๋ฅผ ๋ฐ์ํ๋ ๋ฐ ์ด๋ ค์์ด ์์์ด ๊ฐ์กฐ๋ฉ๋๋ค.
7.6 Anthropomorphism
Social Isolation
์ธ๊ฐ๊ณผ ๋งค์ฐ ์ ์ฌํ ์์ด์ ํธ๊ฐ ์ค์ ์ธ๊ฐ๊ณผ์ ์ํธ์์ฉ์ ๋์ฒดํ๊ฒ ๋๋ฉด, ์ฌํ์ ๊ณ ๋ฆฝ ํ์์ด ์ด๋ฐ๋ ์ฐ๋ ค๊ฐ ์์ต๋๋ค. ํนํ, ๊ฐ์ธํ๋ RPLA๊ฐ ์ธ๊ฐ ๊ด๊ณ์ ๋์ฒด์ฌ๋ก ์ธ์๋๋ฉด, ์ธ๊ฐ ์ํธ์์ฉ์ ์ง์ด ์ ํ๋ ์ ์์ต๋๋ค.
Manipulation of Public Opinion
RPLA๊ฐ ์ธ๊ฐ์ฒ๋ผ ๋ณด์ด๊ณ ํ๋ํจ์ผ๋ก์จ, ๊ณต๊ณต ์ฌ๋ก ์ด๋ ์ฌํ์ ์ด์์ ์ํฅ์ ๋ฏธ์น ์ ์๋ ์ ์ฌ์ ์ํ์ด ์์ต๋๋ค. ํนํ, ์ ์น์ ๋๋ ์ฌํ์ ๋งฅ๋ฝ์์ ์ธ์์ ์ผ๋ก ์ค๊ณ๋ ํ๋ฅด์๋๋ฅผ ์ด์ฉํด ์๋ชป๋ ์ ๋ณด ํ์ฐ์ด๋ ์ฌ๋ก ์กฐ์์ด ์๋๋ ์ ์์์ ๊ฒฝ๊ณํฉ๋๋ค.
8. Closing Remarks
์ฐ๊ตฌ์ง์ RPLA๊ฐ ๋ค์ํ ํ๋ฅด์๋ ๊ตฌํ๊ณผ ๊ฐ์ธํ ๊ธฐ์ ์ ํตํด ์ฌ์ฉ์ ๋ง์ถคํ ์ํธ์์ฉ์ ์ ๊ณตํ ์ ์๋ ์ ์ ๊ฐ์กฐํ๋ฉด์๋, ์์ ์ฑ, ํธํฅ, ํ ๋ฃจ์๋ค์ด์ ๋ฑ ํด๊ฒฐํด์ผ ํ ๋ฌธ์ ๋ค์ด ์ฌ์ ํ ๋จ์ ์์์ ์ง์ ํฉ๋๋ค. ๋ํ, ์ด ์ฅ์ ํ์ ์ฐ๊ตฌ๋ฅผ ์ํ ๋ฐฉํฅ์ฑ์ ์ ์ํ๋ฉฐ, ์์ผ๋ก์ ๋ฐ์ ๊ฐ๋ฅ์ฑ๊ณผ ์์ฉ ๋ถ์ผ์ ๋ํด ๋ ผ์ํฉ๋๋ค.
Future Directions on RPLA Systems
RPLA ์์คํ ์ด ๋ฏธ๋์ ๋์๊ฐ์ผ ํ ์ฐ๊ตฌ ๋ฐฉํฅ๊ณผ ๋์ ๊ณผ์ ๋ค์ ์ ์ํฉ๋๋ค. ์ฐ๊ตฌ์ง์ ํ์ฌ์ ํ๊ณ๋ค์ ๊ทน๋ณตํ๊ณ , ๋ณด๋ค ์ ๊ตํ๊ณ ์ ์ฐํ ์ญํ ๋์ด ์์ด์ ํธ๋ฅผ ๊ฐ๋ฐํ๊ธฐ ์ํด ๋ค์ํ ์ธก๋ฉด์์ ๊ฐ์ ์ด ํ์ํ๋ค๊ณ ์ค๋ช ํฉ๋๋ค. ํนํ, ์์ฌ๊ฒฐ์ ์ง์, ๊ฐ์ธ ๋ง์ถคํ ์๋น์ค, ๊ทธ๋ฆฌ๊ณ ์์จ์ ์ธ ์ฌํ ์๋ฎฌ๋ ์ด์ ๊ณผ ๊ฐ์ ์์ญ์์ ์๋ก์ด ์ฐ๊ตฌ ๊ธฐํ๊ฐ ์ด๋ฆด ๊ฒ์์ ๊ฐ์กฐํ๋ฉฐ, ๊ฐ ๋ฐฉํฅ์ ๋ํ ๊ตฌ์ฒด์ ์ธ ์ฐ๊ตฌ ์์ด๋์ด๋ฅผ ์ ์ํฉ๋๋ค.
Causal Data Analysis for Decision-making:
RPLA๊ฐ ์ฌ์ฉ์์์ ์ํธ์์ฉ์์ ๋ฐ์ํ๋ ๋ฐ์ดํฐ์ ์ธ๊ณผ ๊ด๊ณ๋ฅผ ๋ถ์ํ๋ ๊ฒ์ ์ค์์ฑ์ ๋ค๋ฃน๋๋ค. ๋จ์ํ ์๊ด๊ด๊ณ์ ๋จธ๋ฌด๋ฅด์ง ์๊ณ , ์ด๋ค ์์ธ์ด ๊ฒฐ๊ณผ์ ์ง์ ์ ์ธ ์ํฅ์ ๋ฏธ์น๋์ง ํ์ ํจ์ผ๋ก์จ, ์์ด์ ํธ๊ฐ ๋ณด๋ค ์ ํํ๊ณ ์ ๋ขฐ์ฑ ์๋ ๊ฒฐ์ ์ ๋ด๋ฆด ์ ์๋๋ก ๋๋ ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค. ์ด๋ฌํ ์ธ๊ณผ ๋ถ์์ ๋ชจ๋ธ์ด ๋ถํ์ํ ๋ ธ์ด์ฆ๋ฅผ ์ ๊ฑฐํ๊ณ , ํต์ฌ ๋ณ์์ ์ง์คํ์ฌ ์์ฌ๊ฒฐ์ ๊ณผ์ ์ ๊ฐ์ ํ๋ ๋ฐ ์ค์ํ ์ญํ ์ ํ ๊ฒ์ผ๋ก ๊ธฐ๋๋ฉ๋๋ค.
Improved Decision-making:
RPLA์ ์์ฌ๊ฒฐ์ ๋ฅ๋ ฅ์ ํ์ธต ๋ ๊ฐํํ๊ธฐ ์ํ ์ ๋ต์ ์ค๋ช ํฉ๋๋ค. ์ฌ๊ธฐ์๋ ๊ณ ๊ธ ์ถ๋ก ์๊ณ ๋ฆฌ์ฆ๊ณผ ์ค์๊ฐ ํผ๋๋ฐฑ ๋ฉ์ปค๋์ฆ์ ๋์ ํ์ฌ, ๋ณต์กํ ์ํฉ์์๋ ๋ ผ๋ฆฌ์ ์ด๊ณ ์ผ๊ด๋ ๊ฒฐ์ ์ ๋ด๋ฆด ์ ์๋๋ก ํ๋ ๋ฐฉ์์ ๋ ผ์ํฉ๋๋ค. ์ฆ, ๋จ์ํ ์ธ๊ฐ์ ํ๋์ ๋ชจ๋ฐฉํ๋ ๊ฒ์ ๋์ด, ๋ค์ํ ๋ณ์์ ๋ถํ์ค์ฑ์ ๊ณ ๋ คํ ์ฒด๊ณ์ ์ธ ์์ฌ๊ฒฐ์ ํ๋ก์ธ์ค๋ฅผ ๊ตฌ์ถํ๋ ๊ฒ์ด ๋ชฉํ์ ๋๋ค.
RPLA as Personal Assistants for Personal Decision-making:
๊ฐ์ธํ๋ RPLA๊ฐ ์ฌ์ฉ์์ ์ผ์์ ์ธ ์์ฌ๊ฒฐ์ ์ ์ง์ํ๋ ๊ฐ์ธ ๋น์๋ก ๋ฐ์ ํ ๊ฐ๋ฅ์ฑ์ ์ ์ํฉ๋๋ค. ์์ด์ ํธ๊ฐ ์ฌ์ฉ์์ ํ๋กํ, ๋ํ ๊ธฐ๋ก, ๊ทธ๋ฆฌ๊ณ ์ ํธ ๋ฐ์ดํฐ๋ฅผ ์ค์๊ฐ์ผ๋ก ๋ฐ์ํจ์ผ๋ก์จ, ๊ฐ์ธ๋ณ๋ก ๋ง์ถคํ ์กฐ์ธ๊ณผ ๊ฒฐ์ ์ ์ ๊ณตํ ์ ์๋ ๋ฐฉํฅ์ ๋ชจ์ํฉ๋๋ค. ์ด๋ก ์ธํด, ์ฌ์ฉ์๋ ๋ณด๋ค ํจ์จ์ ์ด๊ณ , ๊ฐ์ธํ๋ ๋ฐฉ์์ผ๋ก ์ผ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์์ผ๋ฉฐ, RPLA๋ ๋จ์ํ ์ญํ ๋์ด๋ฅผ ๋์ด์ ์ค์ง์ ์ธ ๊ฐ์ธ ๋น์๋ก์์ ์ญํ ์ ์ํํ ์ ์๊ฒ ๋ฉ๋๋ค.
Social Simulation through Autonomous Role-Playing:
RPLA๊ฐ ์์จ์ ์ผ๋ก ๋ค์์ ์์ด์ ํธ์ ์ํธ์์ฉํ๋ฉฐ, ์ค์ ์ฌํ์ ์ํฉ์ ๋ชจ์ฌํ๋ ์ฌํ ์๋ฎฌ๋ ์ด์ ์์คํ ์ผ๋ก ๋ฐ์ ํ ์ ์๋ ๊ฐ๋ฅ์ฑ์ ๋ ผ์ํฉ๋๋ค. ์ด๋ฅผ ํตํด, ๋ณต์กํ ์ง๋จ ์์ฌ๊ฒฐ์ , ์ฌํ์ ๊ท๋ฒ ๋ฐ ์ญํ์ ์ฌํํ๋ ๋์์, ์ธ๊ฐ ์ฌํ์ ๋ค์ํ ํ๋ ํจํด์ ๋ํ ํต์ฐฐ์ ์ ๊ณตํ ์ ์๋ ์ฐ๊ตฌ ๋ถ์ผ๋ก ํ์ฅ๋ ์ ์์ต๋๋ค. ์ด๋ฌํ ์์จ์ ์ฌํ ์๋ฎฌ๋ ์ด์ ์ RPLA๊ฐ ๋จ์ํ ๊ฐ๋ณ ์ฌ์ฉ์์์ ์ํธ์์ฉ์ ๋์ด, ์ง๋จ ๋ด ํ์ ์ด๋ ๊ฒฝ์ ์ํฉ์์๋ ์ ์ฉํ๊ฒ ํ์ฉ๋ ์ ์์์ ์์ฌํฉ๋๋ค.