본문 바로가기
  • 데이터에 가치를 더하다, 서영석입니다.

가치를 창출하는 데이터 분석60

[삼성 SDS Brightics]#02-1. Kaggle 평균 기온 예측하기 - 시계열 분석 (MA / EWMA) #02 .kaggle 날씨 데이터 예측하기 - 시계열 분석 (MA / EWMA) ​ 안녕하세요! 드디어 'Brightics 서포터즈 3기' 두번째 미션을 들고 왔습니다. 저에게는 이번 미션을 받고 설렘 반 걱정 반이였습니다 ​ 아무래도 처음 주어진 찐 미션이라고 생각하다보니 좋은 주제를 선정하고 싶었습니다. 그런데 데이터를 찾는 것부터가 쉽지 않더라구요..! ​ 어떤 활동이던 데이터를 확보하고 주제를 정하는 것이 난관인 것 같습니다 하하핳.. 그래서 저만의 데이터 선정 기준을 정하고 데이터를 고르다보니 더 수월하게 골랐습니다! 1. 데이터 선정 기준 첫째, 자신이 흥미로운 데이터를 선택할 것. ​ 처음 데이터 분석을 시작할 때, 어렵기도 하고 관련 지식이 부족한 경우 데이터 자체를 이해하기 어려웠던 것 .. 2022. 6. 28.
[삼성 SDS Brightics] #02. 서포터즈 3기 발대식 후기 안녕하세요 삼성 SDS Brightics 서포터즈 3기 서영석입니다. ​ 이번에는 22년 6월 24일에 진행한 후기를 말씀드리려고 합니다. 메일을 받고 발대식에 가는 설렘에.. 잠을 못잤어요. (소풍 가기 전 설레는 마음..) ​ 제가 오전에 다른 일을 하다 가다보니 지각할뻔... 그래서 버스에서 내려서 엄청 뛰었죠.. (지각했으면 눙물..) ​ 저희 멘토님께서 길 안내와 친절하게 프로그램 설명도 해주시다보니 발대식 전의 긴장감과 해프닝은 다 잊혀졌답니다 :) 삼성 SDS 마젤란 홀에서 진행되었고 지하 1층이며 사원증(?)을 찍지 않고 들어갈 수 있는 곳이였어요! 화살표를 따라가다.. 어느 문으로 들어갔더니 ​ ​ 두둥..탁! 일단 오른쪽 상단의 SAMSUNG SDS 로고의 영롱함에 기절.... 또 사무.. 2022. 6. 28.
[삼성 SDS Brightics] #00. 서포터즈 3기 지원부터 합격까지 안녕하세요 삼성 SDS Brightics 서포터즈 3기 서영석입니다. (삼성 SDS라니 ... LOL..) ​ 저는 데이터 분석(ML/DL)을 공부하고 있습니다. 이 분야를 접하고 공부한 지 1년 정도 되었네요 ㅎ_ㅎ ​ 제가 공부하는 분야와 관련된 활동을 찾아보던 도중.. 삼성 SDS Brightics에서 데이터 분석 관련 서포터즈 모집 공고를 보고 바로 준비했고 25명의 서포터 중 한명으로 활동하게 되었습니다! 그래서 이번 포스팅은 서류부터 면접까지! Brightics를 준비하는데 있어 준비하는데 있어 도움이 되실만한 내용을 말씀드리고자 합니다! - Brightics 주요 활동도 간단하게 소개해드릴게요 :) ​ https://www.samsungsds.com/kr/event/brightics-2022.. 2022. 6. 25.
[삼성 SDS Brightics] #01. Brightics AI 설치 및 체험 리뷰 안녕하세요! 삼성SDS Brightics 3기 서포터즈 서영석입니다 :) 앞으로 삼성 SDS Brightics의 소개와 방법 및 프로젝트 등의 활동을 보여드리고자 합니다! 기대해주세요~! 데이터 분석에 있어 효율적이고 편리하게 하기 적합한 Brightics AI에 대해 여러분께 소개하고자 합니다. 일단 왜 Brightics를 써야하는가. 그것에 대해 설명해드리겠습니다. Brightics AI는 첫 번째로 코딩을 하지 않아도 시작할 수 있어 접근성이 쉽습니다. 두 번째로 정확도가 높은 자동 추천 시스템 기능이 탑재되어있어 다양성과 작업 관리 기능이 뛰어납니다. 세 번째로 데이터 파이프라인을 쉽게 구성하여 속도성이 뛰어납니다. 네 번째로 비즈니스에 최적화된 Hadoop 환경을 편리하게 구성하여 안정적인 시스.. 2022. 6. 21.
[삼성 SDS Brightics] Brightics Studio 활용 https://honeyofdata.tistory.com/66 지난 포스팅에 이어 이상치 탐지의 시각적 분석을 해보려고 한다. Boxplot boxplot도 확인해주고 Histogram count된 histogram도 확인해주었다. 시간에 따른 plot도 확인해주었다. 이제 이상치 탐지(Outlier Detection)에 Turkey 방식으로 TVOC의 열만 이상치 제거를 해주었다. 이상치 전후 비교 Histogram -왼쪽 히스토그램 : 이상치 제거 전 , -오른쪽 히스토그램 : 이상치 제거 후 (Turkey방법) 아래 그림의 경우, 왼쪽 분포와 오른쪽 분포가 비슷한 양상을 보이는 것처럼 보여도, 두 그래프의 y축의 범위가 다르다. 뿐만 아니라, outlier로 보이는 긴 선도 제거되었음을 볼 수 있다.. 2022. 5. 14.
[삼성 SDS Brightics] Brightics Studio 소개 지인을 통해 삼성 SDS Brightics를 알게 되었고, 어떤 툴인지 궁금하여 직접 설치해 활용해보기로 하였다. 역시.. SDS 깔끔한 이미지로 Brightics AI를 사용해보고 싶었으나, 혹시 나중을 위해 Brightics Studio를 사용하기로 하였다. 뭔가 처음 게임을 설치하는 것처럼 처음 쓰는 툴에 매력을 느꼈다.. 또한 ML/DL로 나눠져있는 것으로 보아 DL은 노트북으로 돌리다가 터지겠다..는 생각이 들었다. 다음에 시도해봐야겠다.. 이제 진행과정을 보자. STEP1 . 로컬의 분석하고 싶은 데이터를 불러온다. STEP2. 데이터프레임의 컬럼명과 데이터의 예시를 확인한다. First Data = dataframe.head(1)인 것 같다.. STEP3. 변경하고 싶은 컬럼명, 타입의 경우.. 2022. 5. 13.