딥러닝 훈련소

  • 홈
  • 태그
  • 방명록

2025/02 1

[논문 리뷰] DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

최근 엔비디아(NVIDIA)의 시가총액이 무려 846조 원이나 증발하는 사건이 있었는데요, 그 이유는 다름 아닌 DeepSeek라는 모델의 등장 때문입니다. 중국의 연구팀이 개발한 이 모델은 기존의 AI 모델들이 필요로 했던 고가의 H100 GPU 대신, 저사양 H800 GPU로도 GPT-4에 필적하는 성능을 구현해내는데 성공하였고, 개발팀은 DeepSeek 모델을 오픈소스로 공개하였습니다. 이 발표로 고성능 AI 칩에 대한 수요 감소가 예상되며 엔비디아의 주가 하락까지 이어지게 되었습니다. 이번 포스팅에서는 DeepSeek-R1 논문을 리뷰하며 논문의 메인 컨트리뷰션과 기술적 특징, 그리고 논문에 제시된 성능지표들을 살펴보도록 하겠습니다. https://arxiv.org/abs/2501.12948 De..

논문 리뷰 2025.02.01
이전
1
다음
더보기
프로필사진

딥러닝 훈련소

대학원생의 딥러닝 공부방입니다~

  • 분류 전체보기 (27)
    • On-Device AI (1)
    • 딥러닝 CV&LLM (7)
    • 딥러닝 기초이론 (10)
    • 논문 리뷰 (7)

Tag

경사하강법, repeat factor, long-tail, Object Detection, learning rate, re-sampling, vanishing gradient, 딥러닝, cnn, irfs, Computer Vision, 시그모이드, CV, gradient descent, 인공지능, Classifier, 손실함수, Ai, 선형회귀, 컴퓨터비전,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/02   »
일 월 화 수 목 금 토
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바