About

  • 나이스 지니데이타 머신러닝 엔지니어 (겸 데이터 엔지니어, 201808~)
    • 주요 업무
      • Spark, SQL 이용 데이터 ETL
      • 기계학습 결과 서비스 적용
      • 서비스 데이터 품질 개선
      • 요청 데이터 추출
    • 프로젝트
      • 데이터 파이프라인 구축
        • legacy 코드 활용 정기작업 자동화
        • 작업 상황, 결과 대시보드 생성 (Airflow, zeppelin 활용)
      • 상품 카테고리 자동 분류
        • 800여개 음식 상품명 대상
        • FastText, CNN, LSTM 활용
      • 업종 분류
        • 400여개 업종 대상
  • Technical skills
    • Machine Learning, python, spark, SQL
  • Interests
    • Learning, Engineering, Automating, Applying

패스트캠퍼스 데이터 사이언스 School를 수강하며 기계 학습의 이론과 이를 구현하는 프로그래밍 지식을 배웠습니다. python으로 처음 프로그래밍을 배웠으나 apache spark를 이용할 일이 많아지면서 자연스럽게 scala를 많이 쓰게 되었습니다. 좋아하는 딥러닝 라이브러리는 Keras이며 (Tensorflow 2.0부터 공식 API! 이제 tensorflow만 더 익숙해지면 된다…), 클라우드는 AWS, GCP를 이용해봤습니다.

데이터 분석, 모델링도 재미있지만 그걸 적용하고 서비스를 만들어내는 Engineering 도 흥미로워서 폭 넓게 공부하고 있습니다. 아래 과목들은 강의 조교로써 강의 노트를 작성하며 수강한 수업들 입니다.

  • 수강목록
    • DevOps로 활용하는 클라우드 플랫폼 구축
    • Apache Spark을 활용한 데이터 파이프라인 만들기 CAMP
    • 딥러닝을 위한 리눅스와 GPU CAMP
    • Object Detection 실전 Workshop
    • Elastic Stack을 활용한 Data DashBoard 만들기 CAMP