저보다 훨씬 많이 배우신 교수님,석박사님들이 이쪽 분야로 제어를 하시려고 하시니 믿음과 신빙성이 가다가도
확률론적으로 접근을 하는 것 및 제가 생각하는 강화학습의 한계(새로운 상황에 대한 안정성,데이터 처리량)의 관점에서 자꾸 의구심이 듭니다.
안정하지 않더라도 큰 문제가 없는 프로그렘(gpt)등에는 충분하다고 생각하지만
동적인 시스템에서 적용하기에는 너무나도 불안해보입니다.
제가 해당 분야를 제대로 몰라서 잘못 생각하는 것인지 아니면 실제로 그런지 궁금합니다.
카카오 계정과 연동하여 게시글에 달린 댓글 알람, 소식등을 빠르게 받아보세요
댓글 6개
2024.01.23
강화학습 자체가 제어의 한 분파에서 출발한겁니다만?
2024.01.24
해당 문제를 이미 많이 다루고 있을겁니다. 관련 논문이나 프로젝트를 살펴보고 직접 적용 하다보면 완전한 범용 솔루션은 아니라도 어느정도 제한적인 환경에서는 실제로 쓸만한 결과를 느낄 수 있을 것 같네요.
2024.01.24
겉핥기만 슥 해본 상태 같은데 관련 연구 분야 공부를 더 하셔야 할듯
IF : 2
2024.01.24
이삼년전만해도 기계학습을 잘 이해 못하고 제어 하시는 분들 많이들 그렇게 생각했죠. 모델기반 제어 이론과 기계학습기반 제어 두개로 양분화할 필요는 없습니다. 서로 상보관계로 같이 엮어서 사용하면 시너지가 많이나요. 실제로 그런 연구가 최근 폭발적으로 늘고 있구요...
잘 생각해보시면 어차피 이론적 모델들도 실제와 다르고... 센서 측정시 노이즈와 딜레이 등 오류가 많아서 기존 방법은 한계에 부딪혀 있는 상태에요 기존 잘 되는 제어 시스템들 얼마나 많은 gain과 threashold가 있고 이에 대한 fine tunning 작업으로 개발자들이 고통 받는지 모르실겁니다. 기존 방법이 벽에 막힌 상태에서 확률론적 접근이 이런 한계를 극복하는데 도움이 될걸로 보이네요...
2024.01.24
공부 좀 더 하셔야 될 듯
2024.01.28
로봇으로 강화학습을 연구하면서 비슷한 생각을 합니다 산업계에서 low level에서 강화학습을 쓰는 곳이 거의 없고요. 모델기반 제어가 아직은 RL보다 안정성이 좋죠
그래도 High level decision이나 vision쪽은 확률로적 접근은 항상 놀라운 결과를 보여주고 있는것 같아요
2024.01.23
2024.01.24
2024.01.24
2024.01.24
2024.01.24
2024.01.28