본문 바로가기
  • 데이터에 가치를 더하다, 서영석입니다.

가치를 창출하는 데이터 분석/개인 프로젝트4

#1. [Coursera] 2-2 / Machine Learning Data Lifecycle in Production (GDSC) https://www.coursera.org/learn/machine-learning-data-lifecycle-in-production/home/week/1 Coursera | Online Courses & Credentials From Top Educators. Join for Free | Coursera Learn online and earn valuable credentials from top universities like Yale, Michigan, Stanford, and leading companies like Google and IBM. Join Coursera for free and transform your career with degrees, certificates, Speciali.. 2022. 11. 30.
#1. [Coursera] 2-1 / Machine Learning Data Lifecycle in Production (GDSC) https://www.coursera.org/learn/machine-learning-data-lifecycle-in-production/home/welcome Coursera | Online Courses & Credentials From Top Educators. Join for Free | Coursera Learn online and earn valuable credentials from top universities like Yale, Michigan, Stanford, and leading companies like Google and IBM. Join Coursera for free and transform your career with degrees, certificates, Special.. 2022. 11. 30.
#공부일지 2_1. Introduction to Machine Learning in Production (Coursera) 프로덕션 배포에 적합한 기계 학습 모델을 구축하기 위한 몇 가지 모범 사례 Selecting and Training a Model Key challenges 기계 학습 시스템을 개발할 때 명심했으면 하는 한 가지 프레임워크는 기계 학습 시스템의 AI 시스템이 데이터뿐만 아니라 알고리즘 또는 모델을 의미하는 코드를 모두 포함한다는 것이다. 많은 연구는 데이터 세트를 다운로드하고 데이터 세트에서 잘 작동하는 전체 모델을 찾으려고 노력하는 연구원들에 의해 성장했다. 그러나 많은 애플리케이션의 경우 데이터가 마음에 들지 않으면 데이터를 변경할 수 있는 유연성이 있다. 따라서 알고리즘이나 모델이 기본적으로 해결된 문제인 프로젝트가 많이 있다. 모델 개발은 매우 반복적인 프로세스 일반적으로 일부 모델과 하이퍼파라미.. 2022. 11. 30.
#공부일지 1_2. Introduction to Machine Learning in Production (Coursera) Deployment Key challenges 머신러닝 모델을 배포하는데 두 가지 주요 범주의 문제가 있다. 첫 번째는 머신러닝 또는 통계적 문제이고, 두 번째는 소프트웨어 엔진 문제이다. 시스템을 성공적으로 배포하기 위해 수행해야 하는 작업을 이해할 수 있어야한다. 많은 배포의 과제 중 하나는 개념 드리프트와 데이터 드리프트이다. 음성 인식의 예를 들자면, 데이터 세트에서 음성 인식 시스템을 교육한 후 테스트 세트에서 평가할 수 있지만 시간이 지남에 따라 음성 데이터가 변경되기 때문에 음성 인식 시스템을 구축할 때 지난 몇 개월 동안의 데이터로 구성된 검증 세트와 테스트 세트를 유지해야한다. 시스템에 갑작스러운 충격이 가해지면 데이터가 갑자기 변경되는 경우가 있다. 예를 들어 코로나 19 팬데믹이 닥쳤.. 2022. 11. 16.