자료
사용할 한국어 모델 목록
- fine-tuning된 모델은 사용 X
- llama-2를 기반하는 모델 사용
- 하나만 콕 찝어서 사용하기 보단 가능한 모든 모델 찍먹 해보기
fine-tuning 방법
- 높은 확률로 LoRA 사용할듯
fine-tuning용 데이터
- 141. 한국어 멀티세션 대화: 최소 1일 최대 3일 동안의 두 사람 간 대화
인터페이스 참고용
목표
- gradio로 편하게 fine-tuning 할 수 있는 interface 제작
기능
- 튜닝할 LLM 선택할 수 있음
- 튜닝에 적용할 데이터 폴더 선택할 수 있음
- 하이퍼파라미터 수정할 수 있음
계획
- 일단 fine-tuning의 end-to-end를 어떻게든 성공해본다 (설연휴 끝나기 전까지)
- 파이프라인 코드를 구상해본다
- gradio로 포장한다