본문 바로가기
  • 데이터에 가치를 더하다, 서영석입니다.

가치를 창출하는 데이터 분석60

#공부일지 2_1. Introduction to Machine Learning in Production (Coursera) 프로덕션 배포에 적합한 기계 학습 모델을 구축하기 위한 몇 가지 모범 사례 Selecting and Training a Model Key challenges 기계 학습 시스템을 개발할 때 명심했으면 하는 한 가지 프레임워크는 기계 학습 시스템의 AI 시스템이 데이터뿐만 아니라 알고리즘 또는 모델을 의미하는 코드를 모두 포함한다는 것이다. 많은 연구는 데이터 세트를 다운로드하고 데이터 세트에서 잘 작동하는 전체 모델을 찾으려고 노력하는 연구원들에 의해 성장했다. 그러나 많은 애플리케이션의 경우 데이터가 마음에 들지 않으면 데이터를 변경할 수 있는 유연성이 있다. 따라서 알고리즘이나 모델이 기본적으로 해결된 문제인 프로젝트가 많이 있다. 모델 개발은 매우 반복적인 프로세스 일반적으로 일부 모델과 하이퍼파라미.. 2022. 11. 30.
#공부일지 1_2. Introduction to Machine Learning in Production (Coursera) Deployment Key challenges 머신러닝 모델을 배포하는데 두 가지 주요 범주의 문제가 있다. 첫 번째는 머신러닝 또는 통계적 문제이고, 두 번째는 소프트웨어 엔진 문제이다. 시스템을 성공적으로 배포하기 위해 수행해야 하는 작업을 이해할 수 있어야한다. 많은 배포의 과제 중 하나는 개념 드리프트와 데이터 드리프트이다. 음성 인식의 예를 들자면, 데이터 세트에서 음성 인식 시스템을 교육한 후 테스트 세트에서 평가할 수 있지만 시간이 지남에 따라 음성 데이터가 변경되기 때문에 음성 인식 시스템을 구축할 때 지난 몇 개월 동안의 데이터로 구성된 검증 세트와 테스트 세트를 유지해야한다. 시스템에 갑작스러운 충격이 가해지면 데이터가 갑자기 변경되는 경우가 있다. 예를 들어 코로나 19 팬데믹이 닥쳤.. 2022. 11. 16.
[삼성 SDS Brightics] # 브라이틱스 서포터즈 활동 후기 (+5개월간의 활동을 마치며 ) with 노코드AI오픈소스 안녕하세요! 브라이틱스 서포터즈 3기 서영석입니다. ​ 이번 포스팅의 주제는 '브라이틱스 마지막 인사'입니다. 지난 6월 25일 Brightics 관련 첫 포스팅을 시작으로 약 5개월의 브라이틱스 서포터즈 활동에 마지막 포스팅으로 돌아왔습니다! ​ 처음 brightics 서포터즈를 준비하는데 있어 Brightics Studio​도 깔아보고, 포트폴리오도 만들어본게 엊그제 같은데 벌써 끝이라는 생각에 아쉬움이 그득그득하네요..😥 ​ 처음 지원했을 당시 여러 서포터즈의 블로그를 많이 참조했었는데요. 브라이틱스 서포터즈에 지원하시는 분들께 도움이 되도록 열심히 작성해보려고 합니다 :) 마지막 포스팅에서는 지금까지 제가 해온 프로젝트와 저희 팀 그리고 멘토님께 도움을 받은 내용들 등 활동 후기를 보여드리려고 합.. 2022. 11. 15.
[삼성 SDS Brightics] # 개인 분석 프로젝트(6) 금융사기 분석의 총정리! (with 노코드 AI 오픈소스 ) 안녕하세요! 브라이틱스 서포터즈 3기 서영석입니다. ​ 벌써 개인 분석 프로젝트 막바지에 다달았는데요..! 마지막이라고 하니 마음이 싱숭생숭한 느낌입니다. ​ 마무리를 짓기 전, 오늘도 어김없이 저희 영상과 브라이틱스 홍보에 관해 말씀을 드리려고 합니다 ㅎㅎ https://youtu.be/SRII4fHDvTU 브스상사에 나타난 사람! 구경하러 오기~! ​ https://blog.naver.com/dudtjr4915/222916789267 [삼성 SDS Brightics] # 개인 분석 프로젝트(5) 모델을 구축해보자! (with 노코드 AI 오픈소스 대장 😎) 안녕하세요. 삼성 SDS 브라이틱스 서포터즈 3기 서영석입니다. 이번에는 개인 분석 프로젝트가 시작한 ... blog.naver.com 위 포스팅.. 2022. 11. 8.
[삼성 SDS Brightics] # 개인 분석 프로젝트(5) 모델을 구축해보자! (with 노코드 AI 오픈소스 대장 😎) 안녕하세요. 삼성 SDS 브라이틱스 서포터즈 3기 서영석입니다. ​ 이번에는 개인 분석 프로젝트가 시작한 지 벌써 5주차에 들어섰는데요. 지난번 프로젝트에 이어서 이번에는 모델링을 구축해보려고 합니다. 그 전에!! 브라이틱스 홍보를 위해 한가지 달라진 점을 말씀드리려고 합니다 :) ​ 브라이틱스는 총 세가지의 버전으로 '상용화 버전의 Brightics AI' , 일반적인 분석을 위해 사용하는 'Brightics Studio' 그리고 '중/고등 교육용 Brightics Education' 버전으로 나뉩니다. 이번에는 기존 Brightics Studio 와 Education을 통합된 통합 버전이 출시되었습니다! ​ 새롭게 출시된 통합 버전은 데이터 분석을 위한 200개 이상의 함수를 제공할 뿐만 아니라 함수.. 2022. 11. 1.
[삼성 SDS Brightics] # 개인 분석 프로젝트(4) 브라이틱스로 보는 EDA!!(with 노코드 AI 오픈소스의 선두자😄) 안녕하세요! 삼성 SDS 브라이틱스 서포터즈 3기 서영석입니다 😊 저번주의 데이터 전처리의 중요 요소 중 하나인 Label Encoder와 One Hot Encoder에 이어서 오늘은 탐색적 분석으로 데이터 변수들의 파악을 중심으로 포스팅을 진행하고자 합니다! 저번주에는.. 벨기에에서 작업을 진행했었는데요. 이번주는 룩셈부르크에서 진행하였습니다. (주제를 국가들의 분류로 할 걸 그랬나요? ㅎ_ㅎ) 아! 포스팅 하기 전 서포터즈의 중요 역할을 진행했는데요. 우연히 기차에서 만난 외국인이 제가 하는 것을 유심히 보더니, 어떤 프로그램인지 궁금해하여 제가 한 시간동안 브라이틱스 PR하다가 내렸다는.. ​ 글로벌로 향하는 브라이틱스에 한 숟가락 올렸다고 해도 될까요…? 뭐 그런 해프닝이 있었답니다! ​ ​ 아!.. 2022. 10. 25.