-
컴퓨터 스스로 시행착오를 통해 사건를 해결해자신가는 강화학습, 그 실현성은 무궁무진하죠.카테고리 없음 2020. 3. 19. 06:20
>
안녕하세요 이경재 강사님 인터뷰로 이미 간단한 소개 부탁드립니다.반갑습니다.현재강화학습을연구하고있는이경재다. 제가관심하고있는연구주제는강화학습에사람의사전지식을추가해서학습과정을안전하고효율적으로하는것입니다. 사람의 사전지식을 추가하는 것은 로봇이 자신의 자율주행 등 안전성이 보장되어야 할 시스템에 강화학습을 적용하기 위해 꼭 필요한 기술 중 결함입니다. 강화학습이뭐죠? 왜 강화학습을 공부할 필요가 있는지 설명을 부탁드립니다.강화학습이란 컴퓨터가 주어진 사건을 해결하기 위해 어떤 행동을 순차적으로 해야 하는지를 스스로 시행착오를 통해 학습하는 방법을 스토리하는 것이다. 강화학습은최근에널리알려지기시작했지만사실은오래전부터연구되어온분야에요. 요즘들어 아타리 게임, 바둑 등에서 인간보다 더 높은 성능을 낼 수 있다는 것이 알려져 있으며, 주목을 받기 시작해, 현재는 로봇의 지능적 제어, 자율주행, 등 다양한 분야에 접목이 시도되고 있는 분야입니다. 시간에그렇게의사결정을해야하는사건을인공지능을이용해서해결하고싶다면꼭필요한기술입니다.강화학습은 배우기 어렵다고 들었는데 그 이유가 뭐죠? 많은 분들이 수학에 대해 어려움을 느끼는 것 같아요. 강화학습은 수학을 기반으로 하기 때문에 여러 변수가 복잡하게 얽혀있는 수식을 접하게 될 때가 많아요. 설상가상에서이수식을프로그래밍언어로구현시키고대부분처음강화학습을공부하다가뭔가를직접실현해보면오류가발생해서자기자신이제대로학습하지못하는경험을보셨을겁니다. 저도 마찬가지였습니다. 최근에 많이 들어본 Deep Reinforcement Learning의 경우 강화학습뿐만 아니라 딥러닝도 연결되어 있기 때문에 두 분야를 함께 공부해야 하고 당연히 구현도 함께 해야 할 것이다. 그런 부분에서 공부해야 할 양과 난이도가 모두 높은 분야라고 생각할 것이다.그런 어려움을 [Tensor Flow로 시작하는 강화학습 입문 CAMP]에서는 어떤 방법으로 해결해 주는 의도일까요?이론과 실습을 병행하여 강의가 진행됩니다. 강화학습 분야는 관련 서적이 많이 있지만 영어 강의가 대부분이고, 또 중간 유도 과정을 많이 생략할 것이다. 이렇게 유도 과정이 없이 독학으로 이해하기 어려운 부분의 이해를 돕는 것을 이론 영역 초점으로 하고 싶다. 강의에서는 기초지식부터 최근 논문의 실장에 필요한 이론까지를 다루려는 의도로 실습시간에는 이론시간에 배운 수식이 어떻게 프로그래밍 언어로 실현되는지를 알려드리는 것이 목표입니다. 강의에는 어떤 이야기가 중점적으로 다뤄질 것 같아요?본 강의에서는 이론에 익숙하지 않은 분들께 강화학습 이론과 친숙해질 수 있도록 구성되어 있고, 책에는 설명되지 않은 부분까지 함께 전달하여 강의가 끝난 후에 스스로 강화학습을 공부하여 자신감 있게 최근의 논문을 구현할 수 있도록 기초를 다지는 것을 목표로 하고 있습니다.강의 커리큘럼에 대한 전반적인 설명 부탁드립니다. 1~3주차에는 강화학습에서 가장 중요한 이론을 배웁니다. 달이의 4~8주차에 사용되는 이론을 중점적으로 배우는 시기입니다. 4~6주차에는 최근 강화학습 논문을 주제별로 정리해서 소개해 드리겠습니다. 주로 Open AIgym을 이용하여 실습이 이루어지고, Atari 게임을 학습시키는 방법도 다루려는 의도입니다. 7~8주차에는 강화학습을 실용적으로 활용하기 위해서 필요한 기법을 소개해 드리겠습니다.커리큘럼에 주마다 논문 리뷰가 있는데, 이건 어떻게 진행할 수 있을까요? 강의에서는 고전적인 강화학습부터 최근 강화학습까지 다룹니다. 고전강화학습은 주로 Sutton의 책을 따라 이루어지는데, 최근 강화학습을 소개하는 경우에는 매주 배정된 논문의 스토리를 정리해 제공합니다. 수업 이야기, 또 각 논문의 이론과 구현, 실습으로 이루어집니다. 그래서 수업 전에 그 논문을 한 번쯤 읽어보면 이해하는데 큰 도움이 될 것 같아요.수강대상은 어떤 분들이 좋으신가요? 딥강화학습은기계학습(Machine Learning)의전반적인지식을요구하기때문에지도학습과비지도학습을접해보시는분들에게권장합니다. 또이론을전개할때도확률론이많이사용되기때문에기계학습을한번정도공부하는것이편하게공부할수있을것같습니다.마지막으로 강의에 관심있는 분들에게 이야기 부탁드립니다. 강화학습은 앞으로 많은 분야에 활용할 수 있는 기술입니다. 수식이 어려우신 분, 구현이 어려우신 분들에게 도움이 되었으면 한다. 본 강의에서는 강화학습을 공부하고 원하는 에이전트를 하나하나 학습할 수 있도록 하고 싶습니다.
아래의 선달을 클릭해 주십시오! VVV
>