본문 바로가기
  • 데이터에 가치를 더하다, 서영석입니다.

인공지능11

[KOTRA] 업무 역량 향상을 위한 ChatGPT 및 기타 IT 기술 활용 챗지피티 소개와 업무 혁신 챗지피티는 대화형 인공지능으로, GPT(Generative Pre-trained Transformer)을 기반으로 자연스러운 대화를 이어나가며 정보를 제공한다. 이 기술은 AI의 한 분야로, 업무에서 실제로 활용되며 시간을 절약하고 효율성을 극대화한다. 챗지피티의 역사와 발전 챗지피티는 지난 몇 년 동안 AI 산업에서 큰 관심을 받아왔다. 특히, 2020년에 OpenAI에서 공개한 GPT-3는 많은 주목을 받았는데, 이후 전세계의 기업들이 이러한 생성형 AI 기술을 활용하여 다양한 서비스를 제공하고 있다. 기술 발전과 활용 사례 2017년 구글의 'attention is all you need' 논문을 통해 소개된 트랜스포머 모델이 인공지능 분야를 이끌며, 이후 OpenAI의 .. 2023. 12. 27.
[삼성 SDS Brightics] #00. 서포터즈 3기 지원부터 합격까지 안녕하세요 삼성 SDS Brightics 서포터즈 3기 서영석입니다. (삼성 SDS라니 ... LOL..) ​ 저는 데이터 분석(ML/DL)을 공부하고 있습니다. 이 분야를 접하고 공부한 지 1년 정도 되었네요 ㅎ_ㅎ ​ 제가 공부하는 분야와 관련된 활동을 찾아보던 도중.. 삼성 SDS Brightics에서 데이터 분석 관련 서포터즈 모집 공고를 보고 바로 준비했고 25명의 서포터 중 한명으로 활동하게 되었습니다! 그래서 이번 포스팅은 서류부터 면접까지! Brightics를 준비하는데 있어 준비하는데 있어 도움이 되실만한 내용을 말씀드리고자 합니다! - Brightics 주요 활동도 간단하게 소개해드릴게요 :) ​ https://www.samsungsds.com/kr/event/brightics-2022.. 2022. 6. 25.
[2022 통계청 공모전] 4. CNN-LSTM 사용 CNN-LSTM 사용하기에 앞서 PCA를 진행해주었다. PCA 함수 생성 compute_pca 함수를 만들어, covariance 행렬을 계산 covariance matrix에서 eignvector와 eigenvalue를 계산 eigenvalue를 오름차순으로 sort highest 에서 lowest로 종렬 eigen vector를 내림차순으로 sort n개의 eigenvector를 선택 후 배열 eigenvector의 transpose를 곱하여 데이터를 변환 def compute_pca(X: np.ndarray, n_components: int=2) -> np.ndarray: X_demeaned = X - X.mean(axis=0) covariance_matrix = np.cov(X_demeaned, .. 2022. 5. 15.
[2022 통계청 공모전] 4. modeling with CNN-LSTM 임베딩까지 마친 set을 CNN-LSTM의 모델을 적용시키는 분류 분석을 진행하였다. CNN Algorithm : 차원 축소 단계를 거쳐 이미지를 분류하는 신경망 알고리즘이다. convolution layer , pooling layer , fully connected layer을 통해 feature 추출. LSTM(Long Short Term Memory) RNN에서 발전된 구조로 3개의 gate와 2개의 state가 존재한다. Forget Gate : 잊고자 하는 정도. 활성화함수 : sigmoid 함수 (출력값 : 0~1 사이) Input Gate : 새로운 입력을 받고자 하는 정도. 활성화함수 : sigmoid 함수 (출력값 : 0~1 사이) Output Gate : Cell State 중 어떤 .. 2022. 5. 11.
[2022 통계청 공모전] 3. embedding_model Embedding_model 만들기 Word2Vec 함수 사용 from gensim.models import Word2Vec embedding_okt = Word2Vec(tokenized_okt1, size=100, window = 2, min_count=50, workers=4, iter=100, sg=1) embedding 모델을 구축한다는 것은 Word2Vec의 함수를 써서 단어벡터를 만들어준다는 뜻이다. 이후 아래 코드처럼 저장해주면 임베딩된 모델이 완성되게 된다. embedding_okt.save('/emb__okt.model') 자연어처리에서 사용하는 gensim 라이브러리는 아래를 참고하면 된다. https://radimrehurek.com/gensim/ Gensim: topic modell.. 2022. 5. 9.
[2022 통계청 공모전] 2. remove stopwords (불용어 처리) check bigword split 큰 단어들을 일일이 쪼개준 뒤, 잘 쪼개져있는지 확인 후 불용어 처리를 하였다. bigword = {key: value for key, value in count.items() if len(key)>=5 and value 2022. 5. 8.