ᐧ༚̮ᐧ Data Science | AI/머신러닝 및 딥러닝

미 증시를 흔든 중국 AI 딥시크 DeepSeek란?

데이터과학자B 2025. 1. 28. 15:00
728x90
반응형

 

 

 

📉  엔비디아 주가 폭락

27일 엔비디아 주가가 17% 하락하며 약 5900억 달러의 시장 가치를 잃었다. 이는 미국 증시 역사상 최대 규모의 하루 손실 기록이라고 한다. 이 하락은 중국 AI 스타트업 딥시크(DeepSeek)가 낮은 비용으로 경쟁력 있는 AI 모델을 제공한다는 우려에서 비롯되었다고 한다.

 

2025년 1월28일 기준 엔비디아 주가

 

 

 

 

🐳 딥시크 DeepSeek란?

 

 

출처: https://www.wired.com/story/deepseek-china-model-ai/

 

 

 

딥시크(DeepSeek)는 2023년, 중국 퀀트 헤지펀드 하이플라이어(High-Flyer)의 CEO 리앙 원펑(Liang Wenfeng)에 의해 설립된 AI 스타트업이다. 딥시크는 오픈 소스 AI 모델을 개발하는 회사로, 소프트웨어의 소스 코드를 공개하여 누구나 검토하고 수정할 수 있는 환경을 제공한다.

딥시크의 모바일 앱은 2023년 초 출시 직후 미국을 포함한 여러 국가의 애플 앱 스토어에서 다운로드 1위를 기록하며 주목을 받았다

ChatGPT가 질문에 즉각적인 답변을 제공하는 데 초점을 맞춘 반면, 딥시크는 답변을 제시하기 전에 논리적 추론 과정을 상세히 설명한다는 점에서 차별화된다.

 

 

 

 

🤖 새로운 모델 출시 DeepSeek-R1

 

지난주 공개된 DeepSeek R1 모델은 OpenAI나 Meta의 모델에 비해 개발 및 훈련 비용이 훨씬 저렴한 것으로 알려졌다. 수학적 작업(AIME 2024), 일반 지식(MMLU), 질의응답(AlpacaEval 2.0) 등 주요 벤치마크에서 경쟁 모델과 동등하거나 더 우수한 성능을 보여주고 있다.

 

 

 

R1 모델의 성능이 높은 이유:

  • 강화 학습 (Reinforcement Learning): R1 모델은 기존의 감독 학습에 의존하지 않고, 강화 학습을 통해 스스로 추론 능력을 발전시켰다.
  • Chain-of-Thought (CoT) 데이터: 초기 학습 단계에서 소량의 고품질 CoT 데이터를 활용해 모델이 추론 과정에서 안정적으로 시작할 수 있도록 도왔다.
    • CoT 데이터는 단순히 정답을 제공하는게 아니래, 문제를 해결하는 단계별 논리적 사고 과정을 포함한다. 단순한 답변 생성이 아닌 추론 과정 자체를 학습한다.
  • MoE (Mixture of Experts) 아키텍처: 여러 소규모 전문가 모델이 데이터에 따라 각기 다른 역할을 수행하며 효율적으로 작동한다. 이를 통해 계산 자원과 메모리를 절약하면서도 성능을 극대화했다.
  • 오픈 소스: 오픈 소스로 공개되어 여러 연구 커뮤니티와 협업하며 지속적으로 개선되고 있다.

 

 

 

성능 면에서는 아직 R1 모델이 ChatGPT와 같은 모델을 훨씬 능가한다고 보기 어렵지만, 상대적으로 작은 예산으로 개발되었다는 점에서 주목할 만한 것은 확실하다. 게다가 오픈 소스로 공개됨에 따라 미국 중심의 AI 기업들이 예상했던 만큼의 수익을 얻지 못할 가능성을 시사하며, 이로 인해 더욱 화제가 되고 있는 것 같다.

 

오픈 소스 형식에 대한 평가는 꽤나 긍정적이지만 사용자 데이터가 사용자 데이터가 모델 훈련에 사용될 수 있다는 점에서 개인정보 보호에 대한 우려가 있으며 중국 정부의 정책에 따라 자체 검열하는 걸로 알려져 있다.

 

 

 

 

 

 

 

아직 DeepSeek 논문과 코드를 꼼꼼히 살펴보진 않았지만, 이번 모델 출시를 보며 AI 분야가 얼마나 예측 불가능한지 다시 한번 느꼈다. DeepSeek R1의 오픈 소스화와 낮은 개발 비용은 AI 산업에 큰 변화를 가져올 것이 분명하다. NVIDIA 주가 하락이 화제가 되었지만, GPU가 AI 발전에서 완전히 밀려났다고 보긴 어려운 거 같기도 하다. 오히려 큰 회사들은 더더욱 파워풀한 AI모델을 만들기 위해 더 많은 GPU를 쓰게 되지도 않을까?  앞으로 AI 기술이 어떤 방향으로 나아갈지 더 기대가 된다.


 

출처:

728x90
반응형