Content

많은 사람들이 겨울 휴가기간을 맞아 데이터 사이언스에 관련한 새로운 주제에 대해 배우고 연습할 수 있는 기회가 생겼다.
일정을 명확하게 정리하고, 계획을 최소화해 누군가를 따라잡을 수 있는 완벽한 기회이다.
다음은 따라하기 쉬운 설명과 실습해볼 수 있는 코드를 제공하는 여러 튜토리얼이다. 그 중 골라 바로 시작해보자!
Let’s do it!

  • NLP 툴킷을 확장해보자 : 텍스트 데이터에서 인사이트를 추출할 수 있는 경험을 얻고 싶다면, Farzad Mahmoodinobar의 감성분석 예제를 공부해보자. 해당 예제에서는 NLTK, scikit-learn, TextBlob을 사용한 전반적인 구현 과정을 보여준다.
  • PyTorch에서 적절한 학습률을 선택하는 법 : Leonie Monigatti’s의 시각화 가이드에서는 training epoch 사이의 주기를 조정하고, 최적화할 수 있는 learning-rate 스케쥴러를 사용하는 방법을 제시한다.
  • device data와 프로그래밍 노하우를 활용하는 새로운 방법 : Rosie Young은 public dataset에 감흥이 없다면 자신의 데이터를 활용해볼 것을 추천한다. Python으로 자신의 Strava 데이터를 랭글링하고 탐색하는 방법과, 그 과정에서 내 습관과 활동량에 대한 흥미로운 인사이트를 도출하는 방법을 제시한다.
  • 확률분포에 대한 ulitimate 가이드 : Reza Bagheri’s은 통계와 프로그래밍을 결합하여 확률 분포의 수학적 기초를 다루고 Scipy 라이브러리를 사용하여 Python에서 확률 분포를 생성하는 법을 보여준다.
  • MySQL 기술을 연마하자 : Lynn Kwong’s의 최신 게시물은 고급 MySQL쿼리와 중앙값 계산에 대한 여러 접근 방식을 다루고 있다.
  • 이미지를 활용할 준비를 하자 : 시각적 데이터의 실사용 사례는 최근 몇 년간 폭발적으로 증가했으며, 특정 요구 사항을 충족하는 이미지를 필요로 한다. Conor O’Sullivan’s의 튜토리얼은 딥러닝 프로젝트를 위한 이미지 augmentation을 다루고, Python에서 이미지를 조작하는 기술을 다룬다.
  • 코드를 조금 더 빠르게 실행해보자 : Casey Cheng은 Python에서 가장 빠른 looping method는 어렵지만 가장 적합한 접근 방식은 상황에 따라 다를 수 있다고 말한다. 여러 옵션에 대한 코드 예제를 안내하고 있으니 공부해보자
  • TensorFlow 기술을 향상시켜보자 : Rashida Nasrin Sucky는 “배우는 가장 좋은 방법은 직접해보는 것”이라 말했다. ML 경험이 있고, 텐서플로우 레이어와 손실함수 및 활성화함수를 customize하는 법을 배우고 싶다면 Rashida의 아티클이 명확하고 간결하다.

다음 아티클은 Rosie YoungLynn Kwong’sCasey Cheng의 아티클을 공부해봐야겠다.

출처

Leave a comment