ํ™ˆ
Seiok ๐ŸŒฑ Kim
์ทจ์†Œ

์ƒˆ๋กœ์šด ์‹œ์ž‘

๐ŸŒป ๋ธ”๋กœ๊ทธ ์ƒˆ ๋‹จ์žฅ ์™„๋ฃŒ! ์ด์ œ์„œ์•ผ ์ปคํ”ผ ํ•œ์ž”์˜ ์—ฌ์œ ๋ฅผ...โ˜• — ์†Œ๊ฐœ ์ด์ „ ๋ฒ„์ „์˜ ๋ธ”๋กœ๊ทธ๋Š” ์‹คํ—˜์ ์ด๊ณ  ์‹ฌ๋ฏธ์ ์ธ ์‹œ๊ฐ ํšจ๊ณผ์— ์ค‘์ ์„ ๋‘์—ˆ๋‹ค. 2017๋…„ 8์›” ์ฒ˜์Œ ๋ธ”๋กœ๊ทธ ํฌ์ŠคํŠธ๋ฅผ ์‹œ์ž‘์œผ๋กœ, ๊ธ€์„ ์“ฐ๋Š” ๊ณผ์ •์—์„œ ์ƒ๊ฐ๋„ ์ •๋ฆฌ๊ฐ€ ๋˜๊ณ , ์ปค๋ฆฌ์–ด์—๋„ ๋„์›€์ด ๋˜์—ˆ๋‹ค. ๊ทธ๋Ÿฐ ์˜๋ฏธ์—์„œ ์ด์ „ ๋ฒ„์ „์˜ ๋ธ”๋กœ๊ทธ์— ์ƒˆ์‚ผ ๊ฐ์‚ฌํ•˜๋‹ค โ€“ ๋ณต์žกํ•˜๊ณ  ์นด์˜ค์Šค ์ ์ธ ๋‚ด ์‚ถ...

์กฐ๊ฑด๋ถ€ ์ƒ์„ฑ ๋ชจ๋ธ๋ง๋งŒ์œผ๋กœ ์˜์‚ฌ๊ฒฐ์ •์ด ๊ฐ€๋Šฅํ• ๊นŒ?

2022๋…„์— ๊ผญ ๋ด์•ผ ํ•  ๋…ผ๋ฌธ ์ค‘ ํ•˜๋‚˜์ด๋‹ค. ์–ธ์  ๊ฐ€ ๋‚˜์˜ฌ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒ๋œ ๋ฐฉ๋ฒ•์ด๋ž„๊นŒ... ์—ฌ๊ธฐ์„œ๋Š” ์˜์‚ฌ๊ฒฐ์ •์„ ๊ฐ•ํ™” ํ•™์Šต(RL)์ด ์•„๋‹Œ ์กฐ๊ฑด๋ถ€ ์ƒ์„ฑ ๋ชจ๋ธ๋ง์œผ๋กœ ๊ตฌ์„ฑํ•˜์˜€๋‹ค. ๊ฐœ์ธ์ ์œผ๋กœ ๋กœ๋ด‡ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ์˜ ์‹คํ—˜๋„ ์ง„ํ–‰ํ•˜๋ฏ€๋กœ ๋‘ ๋ฐฐ๋กœ ๊ด€์‹ฌ์ด ์žˆ์—ˆ๋‹ค. ์ „ํ†ต์ ์ธ RL ๋ฐฉ๋ฒ•์˜ ๋ณต์žก์„ฑ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ๊ถ๊ธˆํ•˜๋‹ค. — [\renewcommand{\...

์ผ๋ฐ˜์ฃผ์˜ ์‹ ๊ฒฝ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ํ•™์Šต์ž

์ •๋ ฌ, ๊ฒ€์ƒ‰, ๋™์  ํ”„๋กœ๊ทธ๋ž˜๋ฐ, ๊ฒฝ๋กœ ์ฐพ๊ธฐ, ๊ธฐํ•˜ํ•™๊ณผ ๊ฐ™์€ ๋‹ค์–‘ํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‹คํ–‰ํ•˜๋„๋ก ํ•™์Šตํ•  ์ˆ˜ ์žˆ๋Š” ๋‹จ์ผ ๊ทธ๋ž˜ํ”„ ์‹ ๊ฒฝ๋ง ํ”„๋กœ์„ธ์„œ. — [\renewcommand{\V}[1]{\mathbf{#1}}] ์‹ ๊ฒฝ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋ถ„์•ผ์˜ ๋˜ ๋‹ค๋ฅธ ์ผ๋ฐ˜์ฃผ์˜ ํ•™์Šต์ž (Ibarz et al., 2022) ๊ฐ€ ๋‚˜์™”๋‹ค. Abstract ์‹ ๊ฒฝ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ถ”๋ก ์˜...

๊ฐ€ํ† (GATO) ๋…ผ๋ฌธ์„ ์ฝ์–ด๋ณด์ž!

๐Ÿง  ์•„ํฌ๊ฐ€ํ† ๊ฐ€ ์•„๋‹ˆ๋ผ ๊ฐ€ํ† ๋‹ค. ๋”ฅ๋งˆ์ธ๋“œ์—์„œ ๋‚˜์˜จ generalist agent ๋…ผ๋ฌธ. — ๊ฐ€ํ† . ๋”ฅ๋งˆ์ธ๋“œ์—์„œ ๋‚˜์˜จ generalist AI agent (Reed et al., 2022) ๋กœ, GATO์˜ ์•ฝ์ž๋Š” ์ •ํ™•ํžˆ ๋ชจ๋ฅด๊ฒ ๋‹ค. โ€œGeneralist Agent beyond the realm of Text Outputsโ€ ์ •๋„ ๋˜์ง€ ์•Š์„๊นŒ ์‹ถ...