본문 바로가기
  • 데이터에 가치를 더하다, 서영석입니다.

전체 글180

[논문 리뷰] Who Said Neural Networks Aren’t Linear? 신경망을 ‘비선형 블랙박스’로만 봐도 될까?Neural networks are nonlinear function approximators.이 문장은 너무 자주 반복되며 거의 진리처럼 받아들여진다.〈Who Said Neural Networks Aren’t Linear?〉 이 논문은 신경망의 출력이 아니라, 신경망이 학습 과정에서 만들어내는 함수 공간의 구조를 다시 바라보며 “신경망은 생각보다 훨씬 선형적(linear)일 수 있다”는 도발적인 주장을 던진다. 특히 Linear 인지 UnLinear인지에 따라 달라질 수 있는 수학적 사고가 있기에 재밌어보여 리뷰하고자 한다.1. 우리는 ‘출력의 비선형성’만 보고 있다.일반적으로 신경망의 비선형성은 다음 근거로 설명된다.ReLU, Sigmoid 같은 비선형 활성.. 2025. 12. 19.
[논문 시사점] PyGim: An Efficient Graph Neural Network Library for RealProcessing-In-Memory Architectures 정확도보다 중요한 것들: 현실 세계에서의 신경망 설계 최근 몇 년간 딥러닝 모델은 눈부신 성능 향상을 보여주었다.ImageNet, GLUE, MMLU 같은 벤치마크에서 인간 수준을 넘는 성과를 달성하는 모델들도 이제는 흔하다.하지만 실제 서비스 환경(real-world application)으로 들어오면 이야기는 달라진다.“이 모델, 정확도는 좋은데 실제로 쓸 수 있을까?”이 질문에 답하기 위해 등장한 개념이 바로 Efficient Neural Architectures다.이 글에서는왜 신경망 효율성이 중요해졌는지기존 아키텍처들이 어떤 trade-off를 갖는지현실적인 신경망 설계 원칙은 무엇인지를 중심으로 정리해보려고 한다.1. LLM/VLM 시대 "Efficient Neural" (효율적 신경망) 필요.. 2025. 12. 14.
[논문 리뷰] L-VAE – Learnable β를 가진 Variational Autoencoder 1. 배경: 왜 아직도 VAE & β-VAE인가1-1. 기본 VAE 복습VAE(Variational Autoencoder)는 입력 \(x\)를 잠재변수 \(z\)로 인코딩했다가 다시 복원된 \(\hat{x}\)로 디코딩하는 구조의 오토인코더다. 단순 Autoencoder와 다른 점은, 잠재공간(latent space)에 확률 분포를 얹는다는 것이다.학습 목표는 ELBO(Evidence Lower Bound)를 최대화하는 것이고 보통 “reconstruction + KL” 구조의 loss로 쓴다.첫 번째 항: 재구성 오차(reconstruction loss)두 번째 항: 잠재 분포를 prior (p(z)) (보통 (N(0, I))에 가깝게 만드는 KL divergence1-2. β-VAE: KL에 가중치를.. 2025. 11. 30.
AI Agent 시대의 기업 전략: 왜 모든 서비스는 Agent화되는가 “모든 소프트웨어는 결국 Agent가 된다.”2025년 AI 전략의 핵심은 ‘모델 성능’이 아니라 ‘Agent화 전략’이다.1. 서론: LLM에서 Agent로, 패러다임이 이동하고 있다2023~2024년은 LLM(ChatGPT, Claude, Gemini 등)이 AI 혁신을 만들었던 시기였다.하지만 2025년을 기점으로, LLM은 여전히 핵심 기술일 뿐 실제 비즈니스 가치는 Agent화 과정에서 나오기 시작했다.LLM → LLM 기능LLM 기능 → 하나의 태스크 자동화태스크 자동화 → 워크플로우 자동화워크플로우 자동화 → “업무 담당자” 역할을 수행하는 Agent결국 기업은 LLM을 도입하는 것이 아니라, 업무를 수행하는 AI 직원을 만드는 방향으로 가고 있다.이 글은 왜 모든 서비스가 Agent화되고,.. 2025. 11. 23.
Knowledge Worker 시대의 Enterprise LLM 활용 전략 들어가며요즘 기업 내부에서도 자연스럽게 LLM 기반 도구를 도입하려는 움직임이 늘어나고 있다.“사내 검색을 빠르게”, “문서 자동화”, “보고서 작성” 같은 장점이 자주 언급되지만, 실제로 LLM이 지식 노동 방식(knowledge work) 자체를 어떻게 바꾸는지에 대해선 상대적으로 덜 이야기된다.이번 글에서는 여러 LLM 실험을 진행하며 발견한, Enterprise LLM이 업무 방식을 바꾸는 5가지 지점을 정리해본다.개발자, 기획자, 운영자, 분석가 모두에게 참고가 되길 바라며 기록한다.1. 검색(Search)의 재정의"문서를 찾는 검색"에서 "답을 찾는 검색"으로키워드 기반 검색은 문서를 찾아주지만,원하는 답을 얻는 데는 여전히 사람의 해석 비용이 필요하다.LLM 기반 검색은 방향이 다르다.❝이 .. 2025. 11. 16.
Multi Instance Learning 기반 추천시스템 (OutfitNet 논문) 최근에 추천 시스템에서 복합 아이템 추천에 대한 고민이 많아졌다. 예를 들어 패션 코디처럼 상의, 하의, 신발 등을 세트로 추천해야 할 때, 단순히 각 아이템의 점수를 더하는 방식은 한계가 명확하다. 그러다 발견한 흥미로운 논문이 바로 OutfitNet: Fashion Outfit Compatibility Learning using Attention-based Multi-Instance Learning (WWW 2020)이다. 이 논문은 Multi-Instance Learning(MIL)을 패션 추천에 적용한 구조인데, 읽으면서 꽤 많은 걸 배웠다. 왜 Multi-Instance Learning?Multi-Instance Learning은 “여러 인스턴스로 구성된 하나의 묶음(bag)”에 대해 레이블이.. 2025. 11. 9.
"Segment Anything": 범용 이미지 분할 모델의 등장 Intro: 이미지 분할도 이제 프롬프트 하나로자연어처리에서는 GPT 같은 기반 모델이 제로샷 성능을 보여주며 대세가 되었지만, 컴퓨터 비전 분야는 아직 특정 작업에 맞춘 모델 위주였습니다. 특히 이미지 분할은 데이터를 직접 수집하고, 객체마다 마스크를 그려야 하는 고비용 작업이었습니다. 새로운 객체가 등장하면 그에 맞게 모델을 다시 학습시켜야 했고, 실무에 적용하기도 쉽지 않았습니다. Meta AI는 2023년 "Segment Anything"이라는 획기적인 논문을 발표합니다. "무엇이든 분할할 수 있는" 범용 모델을 제안하며, 이미지 분할 작업의 접근 방식을 완전히 바꾸려는 시도라고 생각합니다.Segment Anything의 핵심 아이디어이 논문의 핵심은 ‘프롬프트 기반 이미지 분할’입니다. 사용자가.. 2025. 11. 2.
Autonomous AI - 2026년 AI 전망 및 시사점 1. Embodied AI 이후의 방향AI는 오랜 시간 텍스트를 이해하는 데 집중해왔다. GPT류 모델들은 방대한 정보를 요약하고 조합하는 데 뛰어났지만, 현실 세계에 직접 영향을 주지는 못했다. Embodied AI는 여기에 행동을 더했다. 물리 환경에서 움직이고, 촉각·시각 같은 감각을 받아들이며 학습하는 형태다.하지만 여기서 또 한 걸음 더 나아간 흐름이 등장하고 있다. 스스로 목표를 세우고 판단을 내리는 AI, 바로 Autonomous AI다. 단순히 환경에 반응하는 것을 넘어, 환경 속에서 무엇을 할지 결정하는 능력으로 확장되고 있다.2. 자율 에이전트의 구조Autonomous AI는 에이전트(Agent)라는 단위로 작동한다. 이들은 하나의 목표가 주어졌을 때, 세부 계획을 세우고, 실행하고, .. 2025. 10. 26.
Embodied AI_LLM에서 행동형 AI로 1. 개요최근 인공지능(AI)은 텍스트 중심의 모델을 넘어, 실제 세계와 상호작용하는 **‘행동형 AI(Embodied AI)’**로 진화하고 있다.이는 단순히 언어를 이해하는 수준을 넘어, 세상을 보고, 듣고, 느끼며, 물리적 행동을 수행할 수 있는 지능을 의미한다.즉, Embodied AI는 멀티모달 강화학습(MMRL) 이후의 자연스러운 확장선으로, AI가 “이해하는 존재”에서 “행동하는 존재”로 발전하는 전환점이다.“LLM이 문맥을 읽는 두뇌라면, Embodied AI는 그 두뇌에 몸을 부여하는 기술이다.”2. Embodied AI란 무엇인가Embodied AI는 멀티모달 학습(Multi-modal Learning), 강화학습(Reinforcement Learning), **로보틱스(Robotics.. 2025. 10. 19.