Jun 18, 2023

23.06.18 (Sun)

zoomg

모델을 바라보는 관점을 함수형 프로그래밍을 하듯, 하나의 모델은 하나의 역할을 맡게 만든 느낌이다. 예를 들면, 트랜스포머는 추론을 못한다는 논문은 말을 하는 모델에 수학적 추론까지 하라고 했고, OpenAI가 만든 모델 구조는 GPT는 말만 하도록하고 보상 모델을 둬서 추론 과정을 검토하도록 했다. / 사람의 피드백을 모델의 학습 데이터로 제공하는 측면에서 강화학습, 액티브러닝은 필수불가결하다. / 수학이 아닌 다른 분야의 과정 감독을하려면 어떻게 보상 모델을 구성해야될까?

생각 백색나무 LLM 유튜브

📢 검색 기능 추가 예정

23.06.18 (Sun)

Read next

📢 검색 기능 추가 예정

23.06.18 (Sun)

Read next

기록 이전

23.03.12 (Sun)

23.03.25 (Sat)