📢 검색 기능 추가 예정

주민건

기록 = 성장

zoomg

LLM 개발 관련 자료 아카이빙

김인중 교수님의 현 LLM 생각

  • 현재 LLM의 발전 수준을 객관적이고 냉정하게 분석한 글
  • 한 발짝 물러서서 관찰자 시점으로 상황을 정리한 글
  • 보이는 것만 보고, 보고싶은 것만 보게 되는 상태에 대한 경각심을 주는 글

교육과 코칭에 대한 생각

이전 직장인 알고리즘랩스에서 알고리즘 문제해결능력 코치에 집중할 때 작성했던 자료다. 코치와 수강생을 위한 LMS는 어떻게 제작되면 좋을지에 대한 고민을 정리했었다. 교육학에 대한 배경이 없어서 어떻게 보면 당연한 말을 써놓은 걸 수도 있지만, 머릿속에서 암묵적으로 동작하는 절차를 눈에 보이게 만드니 그간의 코칭 스킬이 정립되는 느낌이라 좋았다.

자료를 완성한 당시에는 주변에 가까운 사람들에게만 공유 했었다. 딱히 도움 된다는 반응이 생각만큼 오지 않아서 컴퓨터에만 여태 남겨뒀었다. 얼마전 모두연 SpiritusLAB에서 해당 자료로 발표할 기회가 있었다. 랩원분들이 흥미롭게 들어주셔서 자료를 공유하면 누군가에게는 도움이 될수도 있겠다고 생각했다.

자료 내용은 출처가 모두 내 경험과 머릿속에 일어난 일이기때문에 객관적, 과학적 근거자료가 없다. 따라서 경험담 정도로만 생각하고 자료를 읽어주셨으면 하는 바람이 있다.

리더와 조직문화

1.

팀 리더는 리더의 리더(대표이사)를 닮게 된다                                                                    

회사 리더가 남탓을 하고 구성원을 탓한다면

팀 리더는 팀원을 책임지지 않는 구조가 된다


2.

회사도 작은 생태계라

회사가 가지고 있는 환경 설정에 의해

사람들의 행동이 결정되고

환경에 의해 선택받은 사람들만 남게 된다

이때 생태계의 환경 조건은

회사에서 조직 문화로 볼 수 있다


3.

조직 문화가 암묵적으로 있는 조직은 대개

조직에서 가장 영향력이 있는 사람의 성격을

닮아가는 듯하다

그 사람의 긍정적인 요소든 부정적인 요소든

뭐든 다 닮아가는 듯하다

서울마라톤 2024

10km 마라톤 관련

  • 초반 페이스를 너무 느리게 잡았다 (3km, 7분대)
  • 생각보다 5분 30초 페이스를 오래 유지할 수 있었다 (5km)
  • 페이스 메이커 없는 줄 알았는데 있었다,,
  • 1시간 안으로 들어올 수 있었는데 아쉽다 (01:01:29 완주)

행사 일정 관련

  • 짐 보관 안할거면 그렇게 일찍 출발 안해도 된다
  • 다만 늦게가면 현장 화장실을 이용하기 힘들어진다

뛸 때

  • 러닝크루들 응원해주는 모습이 보기 좋다

마라톤 매달을 따는게 약간 버킷리스트 같은거였는데                                                       10km를 몇 번 뛰어봐서 그런지 메달 받아도 감흥이 별로 없다ㅋㅋㅋ..

KOR sLLM fine-tuning with LoRA

이전 글

OpenAI Fine-tuning 사용해보기
목적모델이 멀쩡할 때 데이터셋 퀄리티 확인 위해데이터셋 가공 방향 확인 위해사용 데이터셋학습데이터: 141. 한국어 멀티세션 대화 데이터 > TL_session2 (35,962개)검증데이터: 141. 한국어 멀티세션 대화 데이터 > VL_session2 (3,997개)speaker가 두 명인데 한 명으로 잘못 라벨링되어있는 데이터 제외실행 순서원본 데이터를 OpenAI fune-tuning에서 쓸 수 있도록 변환변환한

문제

: GPT-3.5를 fine-tuning한 모델과 대화를 나눌 때 생성된 문장이 요상하게 느껴진다

가설

: 한국어 임베딩이 GPT-3.5에 비해 잘 되어있다면 한국어 문장이 어색하게 생성되지않는다

사용 데이터셋

  • 141. 한국어 멀티세션 대화 데이터 > TL_session2
  • speaker가 두 명인데 한 명으로 잘못 라벨링되어있는 데이터 제외
  • 페르소나가 speaker 1, 2가 동일한 경우 제외
  • 데이터 중 "나는 20대 남성이다"와 같이 페르소나의 첫 문장이 간단할 경우 선택하지 않음
  • "나는 산딸기를 좋아하는 20대 남성이다"와 같이 시작할 경우 선택
  • 사용한 대화 데이터 수: 1695개

사용한 코드

  • LoRA 사용해서 fine-tuning 진행

https://colab.research.google.com/drive/1nlpWbf50Z80WKn_ECc7xBBqaRtydxCL3?usp=sharing

결과

  • 예상 했던대로 임베딩이 한국어에 최적화 되어있다면 생성된 문장이 GPT-3.5에 비해 어색해보이지 않았음

한계

  • 파인튜닝을 multi-hop으로 해서 그런지 사용자 입력에 대한 응답으로 한 문장만 생성하지 않고, user input - assistant input - ... 연달아서 생성하는 경우 존재
  • 대화 주고 받은게 4~5번 넘어가면 문맥 논리에 안맞는 문장을 생성하는 느낌

대화 예시

Option
Temperature: 0.8, TopP: 1,
Model: beomi_llama-2-ko-7b_3_epochs,
Tokenizer: beomi/llama-2-ko-7b

Conversation
: 모델의 출력을 assistant 답변 기준으로 한 문장씩 잘라서 이전 프롬프트에 붙인 후 user 응답을 써서 다시 입력으로 주는 방식으로 대화

————————————————————————————————
system
당신은 사용자와 간단한 의사소통을 할 수 있는 사람이다. 당신과 사용자는 다음과 같은 페르소나를 가지고 있다.

당신의 페르소나
- 나는 20대 여성이다.

사용자의 페르소나
- 나는 20대 남자이다.

아래의 대화가 주어졌을 때, 마지막 사용자의 말에 대한 응답을 적는다.

user: 안녕하세요 아주머니.
assistant: 4번째 대화네요. 반가워요.
user: 아~ 그렇게 됐나요. 반갑습니다.
assistant: ᄒᄒ. 저도 반가워요.
user: 오늘 날씨 되게 덥네요.
assistant: ᄒᄒ 맞아요. 엄청 덥죠. 더위 조심하세요.
user: 이번 여름에 휴가 계획 있으신가요?
assistant: ᄒᄒ 아직요. 지금은 휴가 안 가고 싶어요. 휴가를 갈 때면 항상 휴가 후유증 때문에 너무 힘들더라고요. (?이상함)

  • 모델: 42dot_LLM-SFT-1.3B (epoch 2.36)
  • 토크나이저: 42dot_LLM-SFT-1.3B

Option
Temperature: 0.8, TopP: 1,
Model: 42dot_LLM-SFT-1.3B (epoch 2.36)
Tokenizer: 42dot_LLM-SFT-1.3B

Conversation
: 모델의 출력을 assistant 답변 기준으로 한 문장씩 잘라서 이전 프롬프트에 붙인 후 user 응답을 써서 다시 입력으로 주는 방식으로 대화

————————————————————————————————

system
당신은 사용자와 간단한 의사소통을 할 수 있는 사람이다. 당신과 사용자는 다음과 같은 페르소나를 가지고 있다.

당신의 페르소나

  • 나는 20대 여성이다.

사용자의 페르소나

  • 나는 20대 남자이다.

아래의 대화가 주어졌을 때, 마지막 사용자의 말에 대한 응답을 적는다.

user: 안녕하세요 아주머니.
assistant: 앗.. 아주머니라니요. ᅲᅲ 저는 아직 20대입니다!
user: 아 그러시군요~ 아주머니~
assistant: 앗 그러면 아가씨로 변경할게요~ ᄏᄏᄏᄏ 아가씨~
user: ㅋㅋㅋㅋ아가씨라는 말 오랜만에 듣네요

1. 이후 기존 문장
assistant: ᄏᄏᄏᄏᄏᄏᄏ 저도 아가씨로 들으셔야 더 예쁘실텐데
user: 무슨 말인지 이해 못했어요
assistant: ᄏᄏᄏᄏᄏᄏ 제가 아가씨인데 그 아가씨에 아가씨를 붙이면 저보고 더 아가씨라구요ᄏᄏᄏᄏᄏᄏ
user: 아~ 네 아가씨~
assistant: 앗~ 아가씨~ 아가씨~.

2.Temperature를 0.7로 조정한 경우
assistant: 앗 그러시군요~ 저는 아가씨 좋아해요~
user: 특별한 이유가 혹시 있나요?
assistant: 앗 이유는 없어요! 그냥 아가씨가 좋아요!!

Great! You’ve successfully signed up.

Welcome back! You've successfully signed in.

You've successfully subscribed to zoomg.

Success! Check your email for magic link to sign-in.

Success! Your billing info has been updated.

Your billing was not updated.