daniel7481의 개발일지

20220922 1주차 목요일 회고 본문

AI Tech 4기/Level1

20220922 1주차 목요일 회고

daniel7481 2022. 9. 22. 18:44
반응형

피어세션

오늘 아침 또한 알고리즘 문제로 시작을 하였다. 오늘 문제는 leetcode - 406.Queue Reconstruction by Height이였는데, 정렬과 그리디를 이용해 풀이할 수 있는 문제였다. 데일리 스크럼 시간에 각자 목표를 말하고, 서로 격려를 하며 공부를 시작하게 되었다. 오늘의 챌린지는 “하늘을 올려다보며!” - 밖에서 하늘 사진 찍고 톡방 인증이다. 아직 완수하지 못했지만 교육이 끝나면 찍으러 나갈 예정이다. 동료 캠퍼 분이 Network Architecture Search에 대한 얘기를 해주었다. 하이퍼 파라미터조정을 딥러닝을 통해 해결하는 연구라는데, 나중에 깊이 있게 읽어 봐야하겠다. 또한 medium이라는 최신 딥러닝 연구 주제가 올라오는 블로그를 추천해주었다. 틈틈이 식나 날때 봐야겠다. 같은 도메인을 공부하는 캠퍼 분들을 만나니 정말 공부할 자료를 끊임없이 받을 수 있다. 부스트캠프의 순기능인거 같고 참여하길 잘했다는 생각이 든다. 피어세션에서는 한 캠퍼 분이 쿨백-라이블러 발산 수식에 대해 질문을 했다. 팀원 중에 아는 분이 없어서 담주 멘토링 시간에 질문하기로 하였다.

마스터 클래스

임성빈 마스터님의 마스터 클래스 시간이 있었다. 현재 UNIST에서 조교수직을 맡고 계신지라 조언이 정말 와닿았다. 누구든 그렇겠지만 대학생으로써 어떻게 쌓아야 할지에 대한 고민은 끝이 없다. 어두운 터널을 걷는거처럼 느껴질 떄가 많다. 임성빈 마스터님께서 정성스럽게 모든 질문에 답해주셨고, 잊지 않기 위해 적어놓을려고 한다.

취업/대학원에 대한 Q&A가 가장 많았다. 부스트캠프 특성 상 졸업을 목전에 두거나 취업을 목적으로 하시는 분이 많아서 그런거 같았다. 무엇보다 대학원 진학에 대한 질문이 가장 많았는데, 임성빈 마스터님께서 말씀하신 부분 중 가장 중요한 부분은 취업을 위해서라면 회사에서 요구하는 스킬셋을 준비해야 한다는 점이다. 또한 대학원이 되었든 커리어적인 측면이든 모두가 택하는 커리어는 기피하는 것이 좋다는 것이었다. AI 시장 또한 레드오션인 도메인이 있다. 남들과 똑같은 커리어로 승부를 보려면 백전백패일수 밖에 없다. 남들과 차별화를 할 수 있는 나만의 커리어를 만들고, 스킬셋을 가춰야 하겠다는 생각이 들었다. 사실 개발 공부를 시작했을 때 든 생각이 단순히 개발만 하는 사람이 되지 말자였다. 내 개인적인 생각으로는 개발은 가치를 창출하기 위한 가장 효율적이고 파급력이 큰 방법이다. 그러나 SW는 도구일 뿐, ML/DL을 배워서 만든 데이터 프로덕트도 결국은 프로덕트다. 성능이 아무리 좋고 뛰어난 모델도 사용자가 없다면 처분될 뿐이다. 이런 면에서 마스터님은 비즈니스 모델이 앞으로 중요해질 것이다라는 말씀을 해주셨다. 실제로 AI가 개발이 된 후 제품화 되지 못하는 것이 8~90%라고 한다. 남들과 차별화를 둘 수 있는 것은 이러한 기획 능력이라고 생각한다. 동료 캠퍼 분꼐서 좋은 자료를 공유해주셔서, 나 또한 공유하기로 하였다.

https://playinpap.github.io/data-product-management/

 

데이터 프로덕트는 결국 프로덕트다 (번역)

이 글은 작성자 블로그 에서도 보실 수 있습니다. 이 글은 아래 미디엄 블로그의 글을 번역하였습니다. (…

playinpap.github.io

공부 회고

오늘은 심화 과제를 전부 끝내고, 캐글 베이스라인 모델을 한 번 흝어보았다. 먼저 심화 과제는 세 개가 있었고, gradient descent, backpropagation, MLE 직접 구현하는 문제였다. 머신러닝의 근간이 되는 원리들이지만 직접 하드코딩하는 과정이 생각보다 쉽지 않았다. 앞으로의 여정이 걱정되기도 했지만 직접 구현을 해보니 이해가 빨리 되는 장점이 있었다. 다음으로는 캐글 베이스라인 모델 코드를 흝어보았다. 아직 직접 캐글 참가할 능력은 되지 않으니 다른 분이 작성하고 공유해준 코드를 읽어보았다. Deberta-3을 사용한 모델이었는데, baseline이라는 말이 민망할 정도로 복잡했다.

https://www.kaggle.com/code/yasufuminakama/fb3-deberta-v3-base-baseline-train/notebook#CFG

 

FB3 / Deberta-v3-base baseline [train]

Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources

www.kaggle.com

직접 작성하지 않아도 많은 도움이 되었다. 책에서만 보던 구조들이 실제로 이용되는 모습을 보니 훨씬 이해가 잘됬다. word Embedding을 tokenizer로 해준 모습과, 옵티마이저로 AdamW를 사용한 것이 흥미로웠다. 새로운 책을 시작하였다. 금융 전략을 위한 머신러닝이라는 책이다. 직접 구현해보며 빨리 끝내보려고 한다. 오늘은 정말 많은 내용과 정보를 얻은 하루였다. 솔직히 말하면 압도되는 느낌 또한 들지만, 앞으로 정말 쉬지 않고 달려야 동료 캠퍼분들을 따라잡을 수 있겠구나 라는 생각이 든다. 어떻게 보면 스트레스고, 또 어떻게 보면 동기부여다. 마인드셋을 고쳐먹는 하루였다.

반응형

'AI Tech 4기 > Level1' 카테고리의 다른 글

20220926 2주차 월요일 회고  (0) 2022.09.27
20220923 1주차 금요일 회고  (2) 2022.09.23
20220921 1주차 수요일 회고  (1) 2022.09.21
20220920 1주차 화요일 회고  (4) 2022.09.20
20220919 1주차 월요일 회고  (0) 2022.09.19