카카오 계정과 연동하여 게시글에 달린
댓글 알람, 소식등을 빠르게 받아보세요

가장 핫한 댓글은?

딥러닝 관련 학습 질문 입니다

2023.09.07

6

1018

안녕하세요 cv 계열 연구실을 지망하고있는 인서울 하위권 재학중인 학부생 입니다.

제가 원하는 분야의 연구실에 필요하기에 통계학 및 선형대수 등의 기초적인 수학적 배경이 되는 과목들은 이수를 하였으나
이러한 지식이 어떻게 적용이 되는지에 대해서는 무지합니다.

그래서 위 과목들을 복습함과 더불어 기본적인 딥러닝의 개념과 여러 알고리즘에 대해서도 학습해보려 하는데,

먼저 시작은 밑바닥부터 시작하는 딥러닝(1)(2)를 통해 시작해보려 하고, 이 이후에 어떠한 방식으로 학습을 진행해야 할지에 대한 조언을 구하고 싶습니다.

수학적인 배경은 많이 잊어버리긴 하였으나 통계와 선형대수가 기초가 된다고 하니, 여러 강의들을 재수강하면 되겠지만

기초가 되는 위 딥러닝 서적을 마친 이후에 어떤 서적을 이용해, 혹은 어떤 방식을 이용해 학습을 진행해야
대학원 생활에 있어서 탄탄한 기반이 될 수 있을지가 궁금합니다.

학부생 수준에서 수식을 딥러닝 개념과 연결해 이해하는 것은 상당히 어려울 것이라고 생각하긴 하지만,
조금이나마 상관관계를 이해할 수 있는 수준은 되고 싶습니다.

읽어주셔서 감사합니다.

카카오 계정과 연동하여 게시글에 달린
댓글 알람, 소식등을 빠르게 받아보세요

댓글 6개

못된 니콜라 테슬라

IF : 3

2023.09.07

저라면 그냥 프로젝트 주제하나 정해서 프로젝트하면서 필요한거 그때그때 공부할거 같아요. 이 방법이 훨씬 효율적일 겁니다.

대댓글 1개

해당 댓글을 보려면 로그인이 필요합니다. 로그인하기

2023.09.07

그냥 주제잡고 개발부터해보세요
MNIST 라도요

대댓글 1개

해당 댓글을 보려면 로그인이 필요합니다. 로그인하기

2023.09.08

딥러닝을 공부하려면 선형대수학, 확률통계, 벡터미적분학이 가장 기초적인 수학과목으로 꼽히고 딥러닝을 '연구'하려면 이제 거기서 더 들어가서 해석학, convex optimization, 심화적인 선형대수학, 수리통계 등을 이야기하죠. 그리고 여기서 이제 각자의 분야에 맞게 더 필요한 수학공부들을 해나가야 하고요.

그 이유는
선형대수학에서는 기본적인 벡터, 행렬들의 연산, 벡터공간, 중요한 행렬들과 그 성질, 행렬 분해 등에 대해서 배우죠. Neural Network도 결국 파라미터들을 하나의 거대한 행렬로 볼 수 있습니다. 그리고 데이터 sample은 기본적으로 벡터로 볼 수 있기 때문에 데이터가 들어가서 내부에서 이뤄지는 연산은 행렬과 벡터의 곱셈이 됩니다. (물론 엄밀하게 tensor로 보지만..일단 이건 나중 문제고).
그리고 전통적인 머신러닝은 결국 행렬 가지고 노는 문제들 (e.g. SVD -> PAC) 이 대다수이기 때문에 선형대수학은 깊게하면 깊게 공부할수록 무조건 유리합니다.

다음으로 우리가 NN을 학습시킨다고 할 때 이는 결국 파라미터의 값을 바꿔나가는 겁니다. 이 때 현재 가장 많이 쓰이는 방법이 손실함수의 1차 미분값 (Gradient)을 활용해서 파라미터를 업데이트하는 데 이는 결국 벡터미분입니다.

또한 딥러닝 모델의 목적은 데이터 분포와 근사되는 최적의 함수를 찾는 것이라고 할 수 있습니다. 하지만 우리는 데이터 분포를 정확하게 알 수 없기에 여기에는 다양한 근사 / 추정 테크닉이 들어가고 이 과정에서는 무수히 많은 Randomness들이 들어가게 됩니다.
또한 NN을 학습시킬 때도 randomness가 존재합니다. (stochastic gradient methods)
즉 확률통계는 딥러닝 메커니즘을 이해하는데 필수적입니다.

그리고 추가적으로 비전 분야를 연구하려면 알고리즘/코딩은 매우 잘해야합니다.

대댓글 1개

해당 댓글을 보려면 로그인이 필요합니다. 로그인하기

댓글쓰기

게시판 목록으로 돌아가기