강화학습 공부의 방향이 뭔가 잘못된 것 같다.

ㅆㄺ

Eulel 2025. 8. 25. 19:13

강화 학습을 공부하면서, Velog에 내용 정리를 하고 있다.

강화 학습에 대해 하나도 모르니까, 거의 책 내용을 그대로 따라가면서, 중요하다 생각되는 내용만 적고 있는데...

내가 원한건 강화 학습에 대한 개념과 그걸 활용하는 방법이었는데 해당 책은 만들어진 환경을 사용하는 방법을 주로 알려준다는 느낌이 강했다.

다양한 강화 학습 환경을 알아갈 수 있는 건 좋은 점이지만, 무조건 구축된 환경을 토대로 진행해야된다는게 단점이 되는 것이다. 그래도 게임에 활용할 AI를 만든다거나 할 때는 UnityML을 활용하면 된다는 등 나쁜 점만 있지는 않다.

다만, 당장 나에게 필요한 내용이 아니라는 것이다. 내일부터는 조금 방향성을 바꿔서, 실습을 일일이 다 하고, 작성해둔 코드를 하나하나 살펴보기보다 한번 책을 우선 전부 읽는 걸 목표로 해야할 것 같다.

이후 교재 내용 중 유용했거나 당장 활용하기 좋은 내용을 별도로 작성하는게 좋을 것 같다.

교재에서 작성할만하다! 생각되는 내용들만 포스팅하고,

강화 학습 관련 알고리즘 별로 각각의 포스팅을 작성하는게 좋을 것 같다.

정리할 알고리즘 종류 : DQN, REINFORCE, A2C, PPO, DDQN, A3C

이 중 직접 실습할만하다 생각되는 코드들은 별도로 직접 작성하고 학습 진행하는 토이 프로젝트 형식으로 진행해보는게 좋을 것 같다.

Eulel 님의 블로그

신세이카맛테짱, 심규선, 타로, We Both Reached For The Gun, SoradukiTyra, 영원의 이튿날, 로큰롤은멈추지않아, 웨이트 타로, 僕のこと, 永遠のあくる日, 바람과 나의 이야기, 나만 슬픈 엔딩, 노래, 포춘텔러, 나의 계절 봄은 끝났다, ADO, 나라는 것, 올리비아 로드리고, VESPERBELL, 메이저 아르카나,

Eulel 님의 블로그