본문 바로가기
  • 데이터에 가치를 더하다, 서영석입니다.

전체 글166

[삼성 SDS Brightics]# 04-1. 팀 영상 프로젝트(1) 유한상사로 취업하다!? 안녕하세요~! 브라이틱스 서포터즈 3기 서영석입니다! 이번에는 가벼운 포스팅을 가져왔답니다 😁😁 저번 팀 분석 프로젝트 내용을 바탕으로 앞으로 3주간 영상 제작에 돌입하게 되었어요!! 그러다보니 팀원들과 만날 일도 많아지고 회의도 잦았던 것 같아요! 사실.. 이번주에도 2번 만난답니다~ ㅋㅋㅋㅋㅋ 아래는 팀원이 포스팅한 내용인데 흐어어어.. 제가 그 팀장이에요 ㅎ__ㅎ 회의 이후 다들 지쳐서 터덜터덜 집에 가는 모습만 기억나네요 🤣 다들 이제 저랑 밥 안먹어준다니 하아.... 슬프다😥 ㅋㅋㅋㅋㅋ 장난이고 항상 힘내주는 팀원들에게 감사할 따름입니다..! 영상 기획 영상 제작에 앞서 기획을 진행했는데요. 저희는 어떻게 하면 재밌고 즐겁게 영상을 만들까 고민을 많이 했습니다!! 여러 예능을 모티브로 삼아 진행.. 2022. 9. 15.
[삼성 SDS Brightics]# 03-4. 팀프로젝트(4) 의료비 예측 마무으리!! 안녕하세요! 브라이틱스 서포터즈 3기 서영석입니다! 저번주로 하여 팀 분석 프로젝트가 마무리가 되었는데요. 이번주에는 간단한 요약과 소감으로 찐!! 마무리를 하려고 합니다 😀 이전 포스팅을 못보신 분들을 아래 링크로 한번 읽고 오시면.. 복받으실거에요😁 1️⃣ 개인이 납부할 의료비 예측 (1) https://blog.naver.com/dudtjr4915/222849374071 2️⃣ 개인이 납부할 의료비 예측 (2) https://blog.naver.com/dudtjr4915/222855763188 ​3️⃣개인이 납부할 의료비 예측 (3) https://blog.naver.com/dudtjr4915/222862117611 의료비 예측 프로젝트 요약 https://www.kaggle.com/datasets.. 2022. 9. 6.
[삼성 SDS Brightics]# 03-3. 팀프로젝트(3) 의료비(보험비) 예측 안녕하세요! 브라이틱스 서포터즈 3기 서영석입니다! 이번에는 팀 프로젝트의 세번째 진행에 대한 포스팅을 가져왔습니다! 이번 포스팅의 경우, 모델의 구성과 평가지표 위주로 하여 최적의 모델 선정까지 진행하였습니다. 이전 포스팅을 못보신 분들을 아래 링크로 한번 읽고 오시면.. 복받으실거에요😁 1️⃣ 개인이 납부할 의료비 예측 (1) https://blog.naver.com/dudtjr4915/222849374071 2️⃣ 개인이 납부할 의료비 예측 (2) https://blog.naver.com/dudtjr4915/222855763188 본격적으로 시작하기 앞서 전체적인 플로우를 약간 수정하였습니다. 이전 포스팅에서 저는 '로그변환' 부분을 맡아 프로젝트를 진행했는데요. '로그변환은 선형회귀 알고리즘 적용.. 2022. 8. 30.
[삼성 SDS Brightics]# 03-2. 팀프로젝트(2) 의료비(보험비) 예측 안녕하세요! 이번에는 저번 주 포스팅에 이어서 팀 프로젝트의 두번째 진행에 대한 포스팅을 가져왔습니다!! 지난주의 포스팅을 아직 못보셨다구요?? 그렇다면 아래 링크로 클릭 🔻🔻 https://blog.naver.com/dudtjr4915/222849374071 [삼성 SDS Brightics]# 03-1. 팀프로젝트(1) 의료비(보험비) 예측 안녕하세요! 오늘은 브라이틱스 서포터즈 3기 5팀의 팀 프로젝트 첫번째 진행에 대한 포스팅을 가져왔습니... blog.naver.com 1. 팀 분석 프로젝트 역할 이번 주의 저의 역할을 소개해드리자면, 'log변환과 정규성 검정, Split Data' 을 맡았습니다! 팀 분석 프로젝트이기에 각자의 역할을 수행하며 저의 역할을 구체적으로 공부할 수 있어 좋은 것 같.. 2022. 8. 23.
[삼성 SDS Brightics]# 03-1. 팀프로젝트(1) 의료비(보험비) 예측 안녕하세요! 오늘은 브라이틱스 서포터즈 3기 5팀의 팀 프로젝트 첫번째 진행에 대한 포스팅을 가져왔습니다!! 이번에는 개인 분석이 아닌 팀 분석이기에 더 설레는 마음이 들더라구요! 뛰어나고 훌륭한 역량을 가진 팀원들과 함께하니 든든합니다 :) 그래서 저희는 팀 프로젝트를 진행하기 위해 대면으로 만나 회의를 진행하였습니다! (대면으로 팀원들 만난 후기 궁금하시죠? 이후에 포스팅으로 찾아뵙겠습니다! 😀) 그렇다면 이제 시작해볼까요~?? 이번 포스팅으로는 팀 소개, 데이터 선정, 데이터 설명 및 간단한 시각화까지의 내용을 가져왔습니다. 먼저 팀 소개입니다. 우리가 누군지 알아? 우리는 바로바로..!! HI:FIVE 🖐✋✋ 저희는 팀명을 HI:FIVE로 정했는데요! 높이 올라가자는 의미로 HI! , 5명의 팀원.. 2022. 8. 16.
[논문 리뷰]LRS3-TED: a large-scale dataset for visual speech recognition 이번 논문은 Oxford에서 발표했던 Lib- reading 관련 논문이다. 논문을 선정한 이유는 다음과 같다. 립 리딩을 구사하는데 있어 데이터셋을 구축하기 위함. 같은 저자가 발표한 '“Lip reading sentences in the wild'을 읽는데 있어 필요한 논문이라고 생각함. 립 리딩을 영어가 아닌 한국어로 표현할 수 있다면.. 어떻게 접근해야할지 궁금하다. Abstract 이 논문에서는 시각 및 음성 인식을 위한 새로운 다중 모드 데이터 세트를 소개한다. 여기에는 400시간이 넘는 TED 및 TEDx 비디오의 얼굴 트랙과 해당 자막 및 단어 정렬 경계가 포함된다. 새로운 데이터 세트는 일반 연구에 사용할 수 있는 다른 공개 데이터 세트에 비해 규모가 상당히 크다. 1. Introduct.. 2022. 7. 30.
[삼성 SDS Brightics]# 02-3. 개인프로젝트(3) Kaggle 평균 기온 예측하기 - 시계열 분석 (ARIMA / Hot-Winters) 안녕하세요! 삼성 SDS Brightics 서포터즈 3기 서영석입니다. 지난 포스팅에서 진행했던 '평균 기온에 대한' 예측에 이어 마.지.막. 포스팅을 하려고 합니다 :) 사실.. 만족스럽지 않은 부분은 추가적으로 포스팅할 계획을.. 이전 포스팅에서는 MA & EWMA 분석과 평가지표를 활용한 비교 까지 보여드렸습니다! https://blog.naver.com/dudtjr4915/222800287594 이번에는 다른 기법으로 진행하려고 합니다! 그래도 이어지는 내용이 있다보니 한번 읽어보시고 오신다면 도움이 될 것 같습니다 :) (댓글도 달아주세요 ㅎㅎ) ARIMA를 사용하기 전, 중요한 검정을 진행해야 한다는 사실! 알고 계셨나요? 바로 두 가지를 확인해야 하는데요, 단위근검정(Unit Root Tes.. 2022. 7. 13.
[삼성 SDS Brightics]# 02-2. 개인프로젝트(2) Kaggle 평균 기온 예측하기 - 시계열 분석 (MA / EWMA) 안녕하세요! 삼성 SDS Brightics 서포터즈 3기 서영석입니다. 지난 포스팅에서 진행했던 날씨 예측에 이어 두 번째 포스팅을 하려고 합니다 :) ​ 이전 포스팅에서는 데이터의 선정 기준, MA와 EWMA 기법 소개, Brightics Studio에서의 실습 까지 보여드렸는데요! ​ https://blog.naver.com/dudtjr4915/222791865572 [삼성 SDS Brightics]# 02-1. 개인프로젝트(1) Kaggle 날씨 데이터 예측하기 - 시계열 분석 (MA ) #02.kaggle 날씨 데이터 예측하기 - 시계열 분석 (MA / EWMA) 안녕하세요! 드디어 'Brightics ... blog.naver.com 아직 이전 포스팅을 못 보신 분들은 한번 보고 오시면 좋을 것.. 2022. 7. 5.
XGBoost vs Randomforest 데이터 사이언티스트(DS)로 성장하기 위해 모델의 분류와 모델에 관해 심도 깊은 이해가 필요하다. 그래서 이번에는 XGBoost와 Randomforest의 차이에 대해 알아보려고 한다. 또한 앞으로 모델을 세부적으로 공부하면서 간간히 모델에 대해 공부하고 포스팅을 하려고 한다. 왜 이 둘의 차이를 먼저 알아보는지 ? 이번 삼성 SDS Brightics 서포터즈 3기 면접에서 XGBoost와 Randomforest의 차이에 대해 여쭤봤지만.. 제대로 답하지를 못했다.. 동계 인턴십에서 '암예측'에서 사용했던 주요 모델 중 하나였지만, 모델을 제대로 숙지하지 않고 썼던 나를 반성하며 공부하려고 한다. XGBoost란? XGBoost는 현업에서 자주 사용하는 ML 모델이다. XGBoost는 Gradient B.. 2022. 6. 29.