daniel7481의 개발일지

20220930 2주차 금요일 회고 본문

AI Tech 4기/Level1

20220930 2주차 금요일 회고

daniel7481 2022. 9. 30. 18:52
반응형

피어세션

오늘은 내가 모더레이터를 맡은 시간이었다. 아침에 구간 합을 구하는 알고리즘 문제를 풀고 설명한 후, 데일리 스크럼 시간에 각자 오늘 할 일들을 정리하였다. 또한 논문에 대한 얘기가 나왔는데, NLP에서 기본이 되는 논문들(transformer, attention)등을 하나씩 읽어보자고 의견이 나왔다. 물론 할 의향도 있지만 아직은 하기로 한 일이 많아서 추후 상황을 지켜보기로 하였다.

스페셜 피어세션

새로운 캠퍼 분들을 만나는 것은 설레고 떨리기도 했다. 당연히 처음에는 어색했지만, 자기소개를 하면서 점점 친해져가기 시작했다. 나는 자기소개를 하면서 굉장히 많은 말들을 하였다. 개발 공부를 시작한 이유부터 부캠에서 얻어가고 싶은 것들 등등, 얘기를 하다보니 전부 다 털어놓듯이 얘기했다. 이렇게 말로 사람들에게 말하니까 내 목표나 길이 더 명확해진 기분이 들었다. 다른 분들의 얘기를 듣는 것도 굉장히 흥미로웠다. 다들 다른 환경에 상황도 달라서 시간이 가는 줄 모르고 떠들었다.

마스터 클라스

최성철 교수님의 마스터 클래스는 정말 정말 많이 도움이 됬다. 부캠의 장점이 이런데 있다고 생각하는데, 평소에 만나기 어려운 분들의 조언을 들을 수 있다는 것이다. 사실 이론 공부도 굉장히 중요하지만 이런 시간이 진정한 값어치가 있다고 생각한다. 누구나 달리지만 방향이 결과를 결정하는 경우도 많기 때문이다. 최성철 마스터님의 클라스를 통해 내가 앞으로 추구하는 방향을 더 구체화할 수 있었다. 앞으로 더 경험을 해봐야겠지만 나는 ML 리서처보다는 엔지니어가 되고 싶다. 알고리즘을 짜는 것보다 AI로 문제를 해결하는 과정을 더 즐기는 것 같다. 기획 능력이 중요하기도 하고, CS에 대한 전방위적인 지식도 필요하다는 것을 듣고 아직 갈 길이 멀다고 느꼈다. 하지만 나에게 남은 것이 시간이므로, 하나씩 천천히 하면 된다. 그냥 넘기기는 아까워서 최성철 마스터님이 하신 말씀을 정리해봤다. 내가 듣는 과정에서 많이 왜곡되었을 수도 있다. 그냥 단순히 참고 정도로만 생각하면 좋겠다.

데이터를 직접 만들어야 하는 경우가 많다
모델은 대부분 특이점이 왔다. 결국에는 pre-trained 모델을 가져와서 내 상황에 맞추는 것 뿐
데이터가 훨씬 중요하다.
데이터
user generated data
system generated data(logs, metadata, prediction)
data flywheel(데이터 선순환, 사용자들의 참여로 데이터를 개선)
Data augmentation : 데이터를 임의로 추가 확보
이 데이터를 어떻게 모을지, 실험하는 단계와 실제 어플리케이션 활용 단계와 같게 유지할지
데이터는 시간이 지나면서 바뀐다. 이를 data drift라고 한다 이를 해결할 문제를 모델 개발 단계부터 해야한다
대부분의 추천 시스템은 사람들이 가장 많이 보는 영화를 추천한다. 예전만큼의 벨류는 없다. 
테슬라 vs 웨이모 테슬라가 데이터가 더 많아져서 지금 더 좋다
유저가 데이터 만듦, 웨이모는 시뮬레이션으로 만듦
NERF- 2d to 3d
Data Feedback loop
ML Researcher는 점점 필요가 없다. 의미가 없어질 예정
사용자로부터 오는 데이터를 자동화하여 모델에 피딩해주는 체계가 필요
단순히 ML/DL이 아니라 네트워크, 하드웨어, 데이터 플렛폼까지 이해해야 한다.
앞으로 ML/DL 엔지니어가 가져야할 역량 중 하나
대용량 데이터를 다뤄본 경험이 중요
앞으로 알아야 할 것
- MLOPs 도구들
- 데이터 베이스 (당연)
- Cloud - AWS, GCP, Azure
- Spark (+ Hadoop)
- Linux + Docker +  쿠버네티스
- 스케줄링 도구들 (쿠브플로우, MLFlow, AirFlow)
도구들이 발전하면서 한 사람이 할 수 있는 일이 늘어남. 앞으로 AI 채용 시장이 지금보다는 안좋다, 엔지니어를 많이 뽑을건데 이제는 다재다능한 능력을 보유해야 한다.
모데은 중요하지 않고, 시스템이 중요하다. 
현장에서는 데이터는 존재하지 않는다, 직접 만들어야하는 경우가 훨씬 많다. 
ML/DL 기획
- ML/DL 시스템은 다양한 영역에서 확장 AI literacy 능력이 중요하다
- 데이터의 체계적 수립 (Feedback Loop 체계 수립)
- 디지털화 but 데이터화 되지 않은 데이터 변환
- MLOPs 엔지니어와 함께 AI 기반 시스템 설계 인력의 필요성 증대
- 모델은 AutoML을 써도 되지만 기획은 인간의 영역
데이터 자동화, 연계, 실험 결과를 기반으로 설득, 시스템화
아직 AI화 되지 않은 영역의 AI화
shell script 네트워크, 클라우드 등 기본적으로 알아야 할 것들이 많다
다섯 번 반복
대용량 데이터(테라급)를 어떻게 더 빨리 로딩하는지, 직접 다뤄보는 경험을 해봐야 한다.

반응형

'AI Tech 4기 > Level1' 카테고리의 다른 글

20221005 3주차 수요일 회고  (0) 2022.10.06
20221004 3주차 화요일 회고  (1) 2022.10.04
20220929 2주차 목요일 회고  (1) 2022.09.29
20220928 2주차 수요일 회고  (0) 2022.09.29
20220927 2주차 화요일 회고  (1) 2022.09.27