본문 바로가기
○ Career | Contest | Job |/Curriculum

머신러닝, 딥러닝, 빅데이터가 도대체 뭐야? (ft. 스탠포드 박사)

by 0ver-grow 2021. 2. 7.
반응형

+ <홍정모교수님이 알려주는 딥러닝 학습 방향>

딥러닝을 구체적으로 어디에 쓸 것인지 디테일하게 잡을 것
수학실력 기를 것
나의 장단점, 현상황을 고려해서 전략을 세울 것

<데이터 엔지니어가 하는 일>

알고리즘을 코딩으로 구현. 큰 회사에서 더 필요(만들어진 알고리즘을 관리해야함.)
알고리즘을 짠 다음 효율적으로 돌아가는지.
몇 초만에 돌아가는지

 

높은 수익을 만드는 알고리즘은?


<업무 과정> 

1. 데이터 엔지니어 : 데이터 가져옴, 수집
2. 데이터 애널리스트 : 데이터 분석
3. 데이터 사이언티스트 : 데이터로 알고리즘 만듦


<각 회사의 데이터 사이언티스트가 하는일 파악하는 방법?>

링크드인을 통해 현 직원이 무슨 프로젝트를 하는지 파악
엔지니어링, 분석 등 무엇을 중시하는지 파악가능


<대학원 가는게 좋은가? 석사/박사>

석사는 필수
박사는 추천
이유 : 계속해서 새로운 논문이 나오는 분야이므로 논문에 익숙한 석박사가 필요함


<학사/석사 추천 전공>

통계,수학,산업공학
이유 : 코딩(파이썬,R,SQL)보다 통계가 더 중요하며, 코딩은 회사에서 배울 수 있음

대부분 관련 직종(엔지니어/PM 등) 사람들은 머신러닝을 할 줄 앎
업으로 삼기 위해선 머신러닝의 차이를 알아야 상황에 적합한 머신러닝을 적용할 수 있음.
그러나 머신러닝의 차이를 알려면 수학적인 백그라운드가 있어야만 가능
이를 알아야 각 상황에 무엇이 적합한지 추천할 수 있음

<공부해야 하는 것>

확률,통계 :

선형회귀, 랜덤포레스트와 같은 기본 머신러닝이 왜 어떻게 돌아가는지 파악. 수학 통계 논문 이해할 수 있어야함 
선형대수 : 알면 좋으나 깊게 알필요는 없음

 

코딩 :

파이썬, 씨퀄, R

<개발자도 유명한 머신러닝 모델을 학습해서 사용이 가능한 상황에서 데이터사이언티스트와의 협업이 필요한가?>

원하는 데이터를 수집,정제하는데까지 과정이 길다.
제한적인 데이터로 퍼포먼스를 최대치로 올리는 것이 중요한데
이를 위해선 가지고 있는 데이터의 특성을 제대로 알고, 적합한 모델을 선택해서 쓸 줄 알아야 함
결론 : 개발자가 머신러닝 모델을 알고있어도, 적합한 데이터를 찾을 줄 아는 수학적 역량을 가진 데이터사이언티스트가 필요하다.

 

 

 

반응형