본문 바로가기
  • 데이터에 가치를 더하다, 서영석입니다.

삼성sds21

[삼성 SDS Brightics]# 03-2. 팀프로젝트(2) 의료비(보험비) 예측 안녕하세요! 이번에는 저번 주 포스팅에 이어서 팀 프로젝트의 두번째 진행에 대한 포스팅을 가져왔습니다!! 지난주의 포스팅을 아직 못보셨다구요?? 그렇다면 아래 링크로 클릭 🔻🔻 https://blog.naver.com/dudtjr4915/222849374071 [삼성 SDS Brightics]# 03-1. 팀프로젝트(1) 의료비(보험비) 예측 안녕하세요! 오늘은 브라이틱스 서포터즈 3기 5팀의 팀 프로젝트 첫번째 진행에 대한 포스팅을 가져왔습니... blog.naver.com 1. 팀 분석 프로젝트 역할 이번 주의 저의 역할을 소개해드리자면, 'log변환과 정규성 검정, Split Data' 을 맡았습니다! 팀 분석 프로젝트이기에 각자의 역할을 수행하며 저의 역할을 구체적으로 공부할 수 있어 좋은 것 같.. 2022. 8. 23.
[삼성 SDS Brightics]# 03-1. 팀프로젝트(1) 의료비(보험비) 예측 안녕하세요! 오늘은 브라이틱스 서포터즈 3기 5팀의 팀 프로젝트 첫번째 진행에 대한 포스팅을 가져왔습니다!! 이번에는 개인 분석이 아닌 팀 분석이기에 더 설레는 마음이 들더라구요! 뛰어나고 훌륭한 역량을 가진 팀원들과 함께하니 든든합니다 :) 그래서 저희는 팀 프로젝트를 진행하기 위해 대면으로 만나 회의를 진행하였습니다! (대면으로 팀원들 만난 후기 궁금하시죠? 이후에 포스팅으로 찾아뵙겠습니다! 😀) 그렇다면 이제 시작해볼까요~?? 이번 포스팅으로는 팀 소개, 데이터 선정, 데이터 설명 및 간단한 시각화까지의 내용을 가져왔습니다. 먼저 팀 소개입니다. 우리가 누군지 알아? 우리는 바로바로..!! HI:FIVE 🖐✋✋ 저희는 팀명을 HI:FIVE로 정했는데요! 높이 올라가자는 의미로 HI! , 5명의 팀원.. 2022. 8. 16.
[삼성 SDS Brightics]# 02-3. 개인프로젝트(3) Kaggle 평균 기온 예측하기 - 시계열 분석 (ARIMA / Hot-Winters) 안녕하세요! 삼성 SDS Brightics 서포터즈 3기 서영석입니다. 지난 포스팅에서 진행했던 '평균 기온에 대한' 예측에 이어 마.지.막. 포스팅을 하려고 합니다 :) 사실.. 만족스럽지 않은 부분은 추가적으로 포스팅할 계획을.. 이전 포스팅에서는 MA & EWMA 분석과 평가지표를 활용한 비교 까지 보여드렸습니다! https://blog.naver.com/dudtjr4915/222800287594 이번에는 다른 기법으로 진행하려고 합니다! 그래도 이어지는 내용이 있다보니 한번 읽어보시고 오신다면 도움이 될 것 같습니다 :) (댓글도 달아주세요 ㅎㅎ) ARIMA를 사용하기 전, 중요한 검정을 진행해야 한다는 사실! 알고 계셨나요? 바로 두 가지를 확인해야 하는데요, 단위근검정(Unit Root Tes.. 2022. 7. 13.
[삼성 SDS Brightics]# 02-2. 개인프로젝트(2) Kaggle 평균 기온 예측하기 - 시계열 분석 (MA / EWMA) 안녕하세요! 삼성 SDS Brightics 서포터즈 3기 서영석입니다. 지난 포스팅에서 진행했던 날씨 예측에 이어 두 번째 포스팅을 하려고 합니다 :) ​ 이전 포스팅에서는 데이터의 선정 기준, MA와 EWMA 기법 소개, Brightics Studio에서의 실습 까지 보여드렸는데요! ​ https://blog.naver.com/dudtjr4915/222791865572 [삼성 SDS Brightics]# 02-1. 개인프로젝트(1) Kaggle 날씨 데이터 예측하기 - 시계열 분석 (MA ) #02.kaggle 날씨 데이터 예측하기 - 시계열 분석 (MA / EWMA) 안녕하세요! 드디어 'Brightics ... blog.naver.com 아직 이전 포스팅을 못 보신 분들은 한번 보고 오시면 좋을 것.. 2022. 7. 5.
XGBoost vs Randomforest 데이터 사이언티스트(DS)로 성장하기 위해 모델의 분류와 모델에 관해 심도 깊은 이해가 필요하다. 그래서 이번에는 XGBoost와 Randomforest의 차이에 대해 알아보려고 한다. 또한 앞으로 모델을 세부적으로 공부하면서 간간히 모델에 대해 공부하고 포스팅을 하려고 한다. 왜 이 둘의 차이를 먼저 알아보는지 ? 이번 삼성 SDS Brightics 서포터즈 3기 면접에서 XGBoost와 Randomforest의 차이에 대해 여쭤봤지만.. 제대로 답하지를 못했다.. 동계 인턴십에서 '암예측'에서 사용했던 주요 모델 중 하나였지만, 모델을 제대로 숙지하지 않고 썼던 나를 반성하며 공부하려고 한다. XGBoost란? XGBoost는 현업에서 자주 사용하는 ML 모델이다. XGBoost는 Gradient B.. 2022. 6. 29.
[삼성 SDS Brightics]#02-1. Kaggle 평균 기온 예측하기 - 시계열 분석 (MA / EWMA) #02 .kaggle 날씨 데이터 예측하기 - 시계열 분석 (MA / EWMA) ​ 안녕하세요! 드디어 'Brightics 서포터즈 3기' 두번째 미션을 들고 왔습니다. 저에게는 이번 미션을 받고 설렘 반 걱정 반이였습니다 ​ 아무래도 처음 주어진 찐 미션이라고 생각하다보니 좋은 주제를 선정하고 싶었습니다. 그런데 데이터를 찾는 것부터가 쉽지 않더라구요..! ​ 어떤 활동이던 데이터를 확보하고 주제를 정하는 것이 난관인 것 같습니다 하하핳.. 그래서 저만의 데이터 선정 기준을 정하고 데이터를 고르다보니 더 수월하게 골랐습니다! 1. 데이터 선정 기준 첫째, 자신이 흥미로운 데이터를 선택할 것. ​ 처음 데이터 분석을 시작할 때, 어렵기도 하고 관련 지식이 부족한 경우 데이터 자체를 이해하기 어려웠던 것 .. 2022. 6. 28.