DeepSeek V3
⭐ 표준 쿼리: 무료 사용자는 로그인 시 매일 사용 횟수를 받으며, 친구 초대를 통해 무제한 사용을 잠금 해제할 수 있습니다
DeepSeek V3는 6710억 매개변수의 전문가 혼합 아키텍처를 특징으로 하는 획기적인 AI 모델입니다. DeepSeek-AI가 2023년 12월에 출시했으며, 수학, 코딩 및 추론 작업에서 뛰어난 능력을 보여줍니다. 토큰당 370억 활성 매개변수를 가지고 있으며, 128K 컨텍스트 길이를 지원하여 AI 성능과 다재다능성의 새로운 기준을 세웁니다.
✨ 핵심 기능
- 6710억 총 매개변수를 가진 고급 MoE 아키텍처
- 128K 토큰의 확장된 컨텍스트 길이
- 보조 손실 없이 혁신적인 부하 분산 전략
- 다중 토큰 예측 훈련 목표
- 뛰어난 벤치마크 성능:
- MMLU: 87.1%
- C-Eval: 90.1%
- GSM8K: 89.3%
- HumanEval: 65.2%