하드웨어가 주기적으로 특정 동작을 필요로하는데, 이를 강화학습을 통해 학습을 시키면 좋을거 같다는 생각이 들어서요....
그런데 제가 강화학습에 대해선 전혀 모릅니다.(메커니즘은 아는데, 어떻게 구현하는지는 전혀 모릅니다.)
특정 강화학습 알고리즘을 짜는건 금방 배워서 할 수 있는 수준인가요??
아니면, 인공지능쪽에 많은 공부를 해야 가능한가요?
카카오 계정과 연동하여 게시글에 달린 댓글 알람, 소식등을 빠르게 받아보세요
댓글 11개
2021.02.25
저는 개인적으로 딥러닝보다는 어려운 것 같아요. 개념 자체는 간단한 것 같은데 수식이 많고 notation이 헷갈려서...
대댓글 1개
2021.02.25
아 그렇군요. 새로운 영역 공부하기엔, 시간이 부족한지라.. 일단 다른방향을 고민해보아야 겠네요. 감사합니다.
온화한 한나 아렌트*
2021.02.25
gridworld reinforcement learning 예제 찾아보시고 한 번 해보시길 바랍니다. 간단한 Q learning 같은건 예제코드 보면서 재구현해보면, 일주일 안에 해볼 수 있어요.
대댓글 1개
2021.02.25
오. 찾아보겠습니다. 감사합니다.
기쁜 피타고라스*
2021.02.25
어떤 feature에 관심을 가지게 할지 feature engineering만 잘 해주면, 그외는 이미 개발된 강화학습 프레임워크를 써서 쉽게 도입가능할 겁니다. 한나 아렌트님 말씀처럼 예제를 통해서 감을 익혀보세요
대댓글 1개
2021.02.25
찾아보겠습니다. 감사합니다.
도도한 아이작 뉴턴*
2021.02.25
로봇하는 사람 입장에서, 강화학습은 그냥 논문용으로 해봤다 정도지, 웬만하면 동역학/kinematics 해석해서 모터컨트롤 하는게 훨씬 좋습니다.. 특히나 매니퓰레이터처럼 해석이 쉬운것은 더더욱 강화학습을 할 이유는 없습니다..
백번양보해서 이족보행로봇의 경우 동역학 해석이 어렵기때문에 강화학습으로 트레이닝시킨후 해봤다 이런식의 말은 있을수있어도요.
대댓글 3개
2021.02.25
아이디어가 잘 안나오다보니, 강화학습의 도움을 받아볼까라고 생각했는데, 다시 생각좀 해봐야겠네요. 감사합니다.
무서운 찰스 배비지*
2021.02.25
기계/항공 쪽에서 제어 하시는 것 같은데요, 저도 로봇하는데 로우레벨 제어는 역학적 해석이 백이면 백 유리하지만 전체 시스템 레벨에서는 딥러닝이 유용한 경우도 있다고 생각합니다. 말씀하신 이족보행 로봇처럼요. 다만 순수 제어로 보기 어려워 TRA RAL IROS ICRA등을 타겟으로 해야한다는 점.
도도한 아이작 뉴턴*
2021.02.25
TRA는 사실 뭔지모르지만 (TRO말하는건가요? TRO는 수학해석이 많이 들어가거나 정말 참신한것으로 해야할텐데요) 언급하신 모든 저널들은 로봇하는 사람들이면 다들 똑같이 타겟으로 하는곳 같은데요.. IROS ICRA야 RA-L로 같이 제출많이 하기도 하고요.. 그외에 해봤자 TRO/TMECH/IJRR정도일텐데 TRO는 사실상 로봇이든 다른분야든 탑저널이라고 생각되고요.
뭐 biomimetic 이나 soft robotics 섞어서 science robotics나 AM계열에 내는 사람들도 있긴하겠네요.
여튼, 말씀하신대로 기계베이스 연구실인데, 저희측에서는 많은 연구자분들이 센서제작이든 로봇제어든 NN이나 강화학습시켰다는건 '칼리브레이션해석/동역학 해석을 할줄 몰라서 썼다'라고 생각하긴 합니다. 예로, NN을 쓰는건 정말 랜덤한것에 기대서 (물론 내부에 layer설정 이나 activation function을 뭐로쓰냐에 따라 조금 달라지겠지만), 하는것이라서 비선호하는것 같습니다.
근데 이건 과마다 보는 관점이 조금 다른것같긴합니다. 저희는 원래부터 수학해석기반으로 설계/제어하는것을 연구하는 분야라서 이렇게 생각하는것같고, 신소재나 컴싸쪽 연구실들은 NN이나 학습을 선호하더라고요. 근데 이번에 오신 황보재민 교수님도 보니까, 러닝기반으로 제어 하시는분들도 뽑으려고하는것같긴해요.
도도한 아이작 뉴턴*
2021.02.25
TRA는 사실 뭔지모르지만 (TRO말하는건가요? TRO는 수학해석이 많이 들어가거나 정말 참신한것으로 해야할텐데요) 언급하신 모든 저널들은 로봇하는 사람들이면 다들 똑같이 타겟으로 하는곳 같은데요.. IROS ICRA야 RA-L로 같이 제출많이 하기도 하고요.. 그외에 해봤자 TRO/TMECH/IJRR정도일텐데 TRO는 사실상 로봇이든 다른분야든 탑저널이라고 생각되고요.
뭐 biomimetic 이나 soft robotics 섞어서 science robotics나 AM계열에 내는 사람들도 있긴하겠네요.
여튼, 말씀하신대로 기계베이스 연구실인데, 저희측에서는 많은 연구자분들이 센서제작이든 로봇제어든 NN이나 강화학습시켰다는건 '칼리브레이션해석/동역학 해석을 할줄 몰라서 썼다'라고 생각하긴 합니다. 예로, NN을 쓰는건 정말 랜덤한것에 기대서 (물론 내부에 layer설정 이나 activation function을 뭐로쓰냐에 따라 조금 달라지겠지만), 하는것이라서 비선호하는것 같습니다.
근데 이건 과마다 보는 관점이 조금 다른것같긴합니다. 저희는 원래부터 수학해석기반으로 설계/제어하는것을 연구하는 분야라서 이렇게 생각하는것같고, 신소재나 컴싸쪽 연구실들은 NN이나 학습을 선호하더라고요. 근데 이번에 오신 황보재민 교수님도 보니까, 러닝기반으로 제어 하시는분들도 뽑으려고하는것같긴해요.
2021.02.25
대댓글 1개
2021.02.25
2021.02.25
대댓글 1개
2021.02.25
2021.02.25
대댓글 1개
2021.02.25
2021.02.25
대댓글 3개
2021.02.25
2021.02.25
2021.02.25
2021.02.25