📢 검색 기능 추가 예정

강화학습

2 articles

딥식 Feb 2, 2025

DeepSeek-R1

자료[ DeepSeek-R1 ] paper reviewDeepSeek-R1 Review.[논문리뷰] DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement LearningDeepSeek-R1 논문 리뷰전생했더니 인공지능이었던 건에 대하여JiYeop

zoomg

강화학습 Apr 5, 2023

23.04.05 (Wed)

[Kor/Eng by ChatGPT] What can RL do?editor, Seungeon Baek(백승언) Reinforcement learning Research Engineer [Kor] 안녕하세요, 오랜만에 블로그를

zoomg