안녕하세요!
브라이틱스 서포터즈 3기 서영석입니다.
벌써 개인 분석 프로젝트 막바지에 다달았는데요..!
마지막이라고 하니 마음이 싱숭생숭한 느낌입니다.
마무리를 짓기 전,
오늘도 어김없이 저희 영상과 브라이틱스 홍보에 관해 말씀을 드리려고 합니다 ㅎㅎ
위 포스팅에서 "통합 버전 설치 시, 기존 Studio는 삭제 후 설치해야합니다." 라는 문구를 작성하였는데요.
<꿀 Tip>
새로운 버전을 설치하실 때, 같은 위치의 폴더가 아니라면
서로 다른 두 개의 버전을 사용할 수 있다고 합니다.
(멘토님의 꿀팁!!)
하나 더!! 브라이틱스에 대해 설명하고자 합니다.
위처럼 저희 영상도 있지만 유튜브의 브라이틱스 채널에는
수많은 유익한 영상들이 존재합니다.
그 중 제가 흥미롭게 봤던 영상을 공유해드리면,
신동민 그룹장님이 직접 설명해주시는
'물류 데이터 분석'을 '삼성 SDS에서 진행하는 프로젝트'로
유익한 정보들을 많이 얻을 수 있었습니다 :)
이처럼 유익하고 재밌는 영상들이 많이 있으니 참고하시면 좋을 것 같아요!
이전에 모델링 이후 피해자의 데이터로 금융 사기의 EDA를 보려고 하였습니다.
이제 개인 프로젝트를 시작해볼까요??
가보자악!!!!!!!
EDA로 인한 결과 도출
1. 지역
<금융사기의 건 수에 대한 파이 차트>
광역시
|
실제 인구 수
|
금융사기 건 수
|
10만명 당
금융사기 건 수
|
서울특별시
|
9,450,768
|
39,287
|
416
|
경기도
|
13,574,353
|
26,219
|
193
|
부산광역시
|
3,323,826
|
6,283
|
189
|
인천광역시
|
2,960,097
|
5,984
|
202
|
경상남도
|
3,286,470
|
5,203
|
158
|
대구광역시
|
2,367,735
|
5,197
|
219
|
충청남도
|
2,120,269
|
4,525
|
213
|
경상북도
|
2,605,066
|
4,258
|
163
|
대전광역시
|
1,446,602
|
3,275
|
226
|
충청북도
|
1,595,624
|
3,161
|
198
|
<전국 인구 수 통계 (22년 09월 기준)을 참고하여 작성한 표>
사실상, '실제 인구 수'와 '금융사기 건 수'를 비교하는 것과 같이
발생한 수 / 전체 수로 하여 지역을 비교하고 싶을 때,
'100명 중 1명 꼴' 혹은 10만명 중 4명 꼴'과 같이
한 눈에 들어올 수 있도록 파악하는 것이 중요합니다.
위 표와 같이 10만명 당 금융사기 건 수로 하였을 때,
서울특별시가 가장 많았고,
대전광역시, 대구광역시 순으로 많음을 알 수 있었습니다.
서울특별시가 대구광역시의 약 2배임을 볼 수 있는데요.
인구 수와는 상관없이 많은 금융사기를 당한다는 것을 알 수 있습니다.
그렇다면 서울특별시의 인구에서 더 자세히 들어가볼까요?
117,737개의 데이터 중 서울특별시에 해당하는 수는 39,287개인데요.
아래 트리맵을 보면,
중구 > 강남구 > 송파구 > 서초구 순으로
금융사기의 건수가 많음을 볼 수 있습니다.
다음 표를 보시겠습니다!
법정시군구명
|
전체 인구 수
|
금융사기 건 수
|
10만명 당
금융사기 건 수
|
중구
|
120,969
|
8,415
|
6,956
|
송파구
|
660,211
|
5,892
|
892
|
강남구
|
530,103
|
5,730
|
108
|
서초구
|
405,076
|
2,042
|
504
|
강서구
|
570,368
|
1,512
|
265
|
구로구
|
393,181
|
1,273
|
324
|
영등포구
|
376,216
|
1,215
|
323
|
마포구
|
365,266
|
1,135
|
311
|
노원구
|
505,503
|
987
|
195
|
관악구
|
486,787
|
972
|
200
|
<전국 인구 수 통계 (22년 09월 기준)을 참고하여 작성한 표>
'중구'의 경우 10만명 당 금융사기 건 수가 약 7000명으로
너무나도 많은 수치가 나옴을 알 수 있었습니다..!
다시 말하자면 100명 중 7명 꼴로 금융사기를 당한다는 말인데,
왜이렇게 많은지에 대해 의문점이 있습니다.
이에 대한 주의가 필요한 시점인 것 같습니다.
생각보다 심각한 수준으로 금융사기에 노출되어있다는 뜻으로 보입니다.
2. 시간
시간에 따른 금융사기 건수의 차트입니다.
가장 많았던 달 순으로는
8월 > 9월 > 7월 > 3월 순입니다.
날짜
|
금융사기 건수
|
날짜
|
금융사기 건수
|
1월
|
11,741
|
6월
|
13,037
|
2월
|
12,646
|
7월
|
14,360
|
3월
|
13,301
|
8월
|
15,173
|
4월
|
10,948
|
9월
|
14,504
|
5월
|
12,027
|
|
|
데이터의 불균형이 없다고 볼 정도로
균형있게 분포되어있음을 알 수 있습니다.
이로써 금융사기는 월과는 크게 상관이 없다는 것도 알 수 있습니다.
3. 성별
남자와 여자의 비율은 65.1 과 34.9로 보입니다.
<법정시군구명와 성별에 따른 비교>
아까 보셨던 서울특별시에서의 법정시군구명입니다.
네모칸이 바로 중구인데요.
다른 구는 약 2배거나 이보다 적은 구들도 있는데,
중구는 약 3배에 가까운 값을 가집니다.
정확히 말하자면 전체 남녀의 비율이 1.86에 비해
중구의 남녀 비율이 3.6입니다.
약 2배에 가까운 차이가 나는 것을 알 수 있죠.
중구에서의 문제에서
남자의 금융사기의 비율이 많음을 알 수 있습니다.
4. 나이
나이
|
전체 인구 수
|
금융사기 건 수
|
10만명 당
금융사기 건 수
|
0-9세
|
3,566,622
|
12,275
|
344
|
10-19세
|
4,703,349
|
47,547
|
1011
|
20 - 29세
|
6,463,741
|
32,469
|
502
|
30 - 39세
|
6,625,319
|
16,786
|
253
|
40 - 49세
|
8,088,855
|
6,188
|
77
|
50 - 59세
|
8,614,576
|
1,778
|
21
|
60 - 69세
|
7,346,707
|
457
|
6
|
70 - 79세
|
3,814,012
|
148
|
4
|
80 - 89세
|
1,954,228
|
34
|
2
|
90 - 99세
|
274,412
|
29
|
11
|
(https://jumin.mois.go.kr/ageStatMonth.do 를 참고하여 작성하였습니다.)
10대의 금융사기 건 수 비율은
그 다음 높은 20대의 금융사기 건 수 비율의 약 2배를 차지하며
꽤나 많은 수의 금융사기가 일어남을 알 수 있습니다.
제 생각에는.
10대의 경우, 막 시작하는 금융거래가 많아짐에 따라
미성년자로서 완전히 성숙해지지 못해 일어나기 때문의 영향이 있을거라고 생각합니다.
이에 10대와 20대에 대한 교육이 각별히 필요함을 느낍니다.
앞으로의 금융 사기 예방에 있어
자료를 참고하여 도움이 되었으면 좋겠습니다 :)
5. 은행
카카오뱅크 > 농협 > 국민은행 순으로 금융사기 건수가 많음을 알 수 있습니다.
물론 은행과 금융의 이용자수가 많음도 있을 수 있겠지만,
실제 이용자 수를 알 수 있다면
취약한 금융권이 어느 곳인지도 알 수 있겠죠?
6. 자원인터넷서비스
KT > SK > LG 순으로 금융사기가 많이 이루어졌음을 알 수 있습니다.
이로써 각 컬럼별로 시각화 및 EDA를 진행하였는데요.
눈에 가장 띠고 새로운 발견을 했던 부분은
서울특별시. 그 중 '중구'에 해당하는 금융사기 건수가 많았음을 알 수 있었습니다.
그리하여 중구에 대한 EDA를 조금 더 진행해보고자 합니다.
7. 서울특별시_중구
|
실제 인구 수
|
금융사기 건수
|
1만명 당 금융사기 건수
|
남자
|
58,812
|
7,085
|
1205
|
여자
|
62,157
|
2,839
|
457
|
남자의 경우, 10명 당 1.2명 꼴로 금융사기를,
여자의 경우, 100명 당 4.6명 꼴로 금융사기를 당하는 것을 알 수 있습니다.
그렇다는 것은...!!
남자의 경우가 압도적으로 많은 수의 금융사기를 걸리는 것을 알 수 있습니다.
또한 하나의 특이한 점을 발견하였는데요.
중구의 '자원인터넷서비스'에서 80%는 SKT임을 알 수 있습니다.
전체의 16%에 해당하는 SKT가 중구에서는 대부분을 차지하는데요.
이러한 근거가 중구의 금융사기 비율을 높이는지는 더 찾아봐야할 것 같습니다.
은행의 경우, 대체적으로 잘 분포되어 있습니다.
8. 결론
서울특별시의 중구에서 보다 많은 금융사기 건수를 발견했고,
연령대에서는 10대의 금융사기 건수의 비율이 높음을 발견하였습니다.
또한 남성의 경우 여성보다 많은 금융사기 건수가 많습니다.
이처럼 데이터에 대한 분석을 자세히 하다보면
많은 정보들을 얻는 것 같습니다.
물론 여기서 더 나아가
왜 중구에서 금융사기가 더 많은지,
10대의 금융사기 비율이 더 높다면 그 이유는 무엇인지
등 여러 원인들을 파악해야합니다.
현재 데이터로 알 수 있는 정도는 여기까지인 것 같습니다.
추가적인 데이터가 생기고 더 많아진다면
자세하고 좋은 분석을 할 수 있을 것 같습니다.
EDA와 한국 통계청을 이용하여 비교분석을 하였는데요.
이로써 개인 프로젝트를 마무리로 인사드려야할 것 같습니다.
다음주에는 개인프로젝트를 포함하여 서포터즈 활동에 대한 후기로 인사드리고자 합니다.
개인 프로젝트를 포함해서 저의 포스팅을 챙겨보신 분들,
지나가다가 들리셔서 도움이 되신 분들
하나씩 보시고 도움을 주신 분들
모두에게 감사의 말씀 드립니다.
그러면 다음주에 프로젝트 후기로 돌아오겠습니다.
감사합니다.
본 포스팅은 삼성SDS Brightics 서포터즈 3기 활동의 일환으로 작성하였습니다.