[Kor/Eng by ChatGPT] What can RL do?
editor, Seungeon Baek(๋ฐฑ์น์ธ) Reinforcement learning Research Engineer [Kor] ์๋
ํ์ธ์, ์ค๋๋ง์ ๋ธ๋ก๊ทธ๋ฅผ ์ฐ๊ฒ ๋๋ค์! ์ด๋ฒ ๊ธ์ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๊ฐ ์๋, ๊ฐํํ์ต ๊ด๋ จํ ์ ์ ์ฒซ ํฌ์คํ
๊ธ์
๋๋ค. ์ด๋ฒ์ ์์ฑํ๋ ๊ธ์์ ๋ค๋ฃจ๊ณ ์ ํ๋ ๋ด์ฉ์ โ๊ฐํํ์ต์ ์ด๋ค ๋ฌธ์ ๋ฅผ ํ ์ ์๋๊ฐ?โ์
๋๋ค. ์ด์ ๊ด๋ จํ์ฌ, ๋น์ทํ ๊ธ์ด ์๋์ง ์ฌ๋ฌ ํค์๋๋ก ๊ฒ์์ ํด ๋ณด์๋๋ฐ ๊ฐํํ์ต์ด ์ด๋ค ๋ฌธ์ ๋ฅผ ํ ์ ์๋์ง์ ๋ํ ๋ด์ฉ๋ณด๋ค๋, ๊ฐํํ์ต์ด ํ์ฌ ์ ์ฉ๋๊ณ ์๋ ๋ถ์ผ์ ๊ด๋ จ๋ ๋ธ๋ก๊ทธ๋ค์ด ๋๋ถ๋ถ์์โฆ

ReAct: Synergizing Reasoning and Acting in Language Models
While large language models (LLMs) have demonstrated impressive capabilitiesacross tasks in language understanding and interactive decision making, theirabilities for reasoning (e.g. chain-of-thought prompting) and acting (e.g.action plan generation) have primarily been studied as separate topicsโฆ

Story does not exist
โณ์ฐ๋ฆฌ๋ ์ง๊ธ AI์ ๋ํ ์์ฒญ๋ ํฅ๋ถ๊ณผ ๊ณผ๋๊ด๊ณ ๊ฐ ๋๋ฌดํ๋ ์๋์ ์ด๊ณ ์๋คโ... ์คํ ํผ๋ๅคง, ์ธ๊ฐ์ค์ฌ์ธ๊ณต์ง๋ฅ์ฐ๊ตฌ์ โAI ์ธ๋ฑ์ค 2023โ ๋ฐํ
็พ ์คํ ํผ๋๋ํ๊ต(Stanford University Stanford)์ ์คํ ํผ๋ ์ธ๊ฐ ์ค์ฌ ์ธ๊ณต์ง๋ฅ์ฐ๊ตฌ์(Human-Centered Artificial Intelligence. HAI)๊ฐ ๋งค๋
๊ณต๊ฐํ๋ ์ฐ๋ก๋ณด๊ณ ์ โ์ธ๊ณต์ง๋ฅ ์ธ๋ฑ์ค 2023(AI Index 2023)โ๊ฐ 3์ผ(ํ์ง์๊ฐ) ๋ฐํ๋์๋ค.AI ์ธ๋ฑ์ค๋ ํ๊ณ์ ์
๊ณ์ ํ์ ๊ฐ ์ ๋ฌธ๊ฐ ๊ทธ๋ฃน์ธ AI ์ธ๋ฑ์ค ์ด์ ์์ํ(AI Index Steering Committee)๊ฐ ์ฃผ๋ํ๋ ์คํ ํฌ๋ ์ธ๊ฐ์ค์ฌ ์ธ๊ณต์ง๋ฅ์ฐ๊ตฌ์์ ๋
๋ฆฝ์ ์ธ ์ด๋์
ํฐ๋ธ๋ค.์ธ๊ณต์ง๋ฅ์ ์๋กญ๊ณ ์ธ์์ ์ธ ๊ธฐ์ ์ญ๋์ ๋๋ฌํ

BloombergGPT: A Large Language Model for Finance ๐ TL;DR This paper presents BloombergGPT, a 50 billion parameter...
Posted by Daily Arxiv on Monday, April 3, 2023
๋ฅ๋ฌ๋์์๋ ๊ธฐ์กด์ ์ด๋ก (์ ํต/์์)์ผ๋ก๋ ๋์ ํ ๋ฐ์๋ค์ด๊ธฐ ์ด๋ ค์ด ํ์๋ค์ด ๋ง์ด ๊ด์ฐฐ๋๋ค. ๊ทธ ํ์์ ์ฃผ๋ชฉํ๊ณ ๊ธ์ ์ ์ผ๋ก ๋ฐ์๋ค์ธ ์ฌ๋๋ค์ด ์ฑ๊ณผ๋ฅผ ๋ด์ด์๋ค. ์๋ฅด์ฟค๋ ๊ทธ๋ฌ๊ณ OpenAI๋ ๊ทธ๋ฌ๋ค. ๋ฅ๋ฌ๋์ ๊ฐ์ฅ...
Posted by Sedong Nam on Tuesday, April 4, 2023