Kidari's Blog: 중국 AI 연구소 DeepSeek, 가격 책정에서 OpenAI를 대폭 깎아 기술 주식을 불안하게 함

중국 AI 연구 연구소인 DeepSeek은 OpenAI와 같은 글로벌 거대 기업의 선도적 AI 시스템과 경쟁할 수 있는 것으로 알려진 고급 AI 모델인 DeepSeek-R1을 출시했습니다. 이 회사는 자사 모델이 수학적 추론, 코드 생성, 비용 효율성을 포함한 분야에서 경쟁사보다 성능이 우수하다고 주장합니다. Wired에 따르면 이 모델의 출시는 DeepSeek이 심각한 경쟁자로 부상하고 있는 글로벌 AI 환경에서 잠재적인 변화를 예고합니다.

DeepSeek은 2015년에 설립된 중국 양적 헤지펀드인 High-Flyer의 딥러닝 연구 부문인 Fire-Flyer에서 시작되었습니다. High-Flyer는 고급 컴퓨팅을 사용하여 재무 데이터를 분석함으로써 인정을 받았습니다. 2023년 이 펀드의 설립자인 양원펑은 AI 연구에 초점을 맞춰 선구적인 AI 모델을 개발하기 위해 DeepSeek을 설립했습니다. 많은 중국 AI 기업과 달리 DeepSeek은 Baidu와 Alibaba와 같은 주요 기업과 독립적으로 운영됩니다.

양(Liang’s)이 DeepSeek을 만든 동기는 즉각적인 재정적 이익보다는 과학적 호기심이었습니다. 그는 "기초과학 연구는 투자에 대한 높은 수익을 거의 제공하지 못한다"고 말했다.

DeepSeek-R1: 기술적 도약

DeepSeek-R1은 강화 학습(RL) 기술과 다단계 학습을 사용하여 기능을 향상시킵니다. 이 회사는 또한 MIT 라이선스에 따라 15억에서 700억 개의 매개변수에 이르는 6개의 더 작은 변형과 함께 주력 모델을 오픈 소스화했습니다. 이를 통해 개발자는 모델을 자유롭게 개선하고 상용화할 수 있습니다.

감독된 미세 조정에 의존하는 기존 모델과 달리 DeepSeek-R1-Zero는 RL 훈련만으로 강력한 추론 능력을 개발했습니다. 언어적 불일치를 해결하고 사용성을 향상시키기 위해 DeepSeek은 나중에 DeepSeek-R1을 도입했는데, 이는 추론 성능에서 OpenAI의 o1 모델과 일치한다고 합니다.

효율적인 전략과 기술 혁신

DeepSeek은 여러 가지 비용 효율적인 전략을 구현하여 모델을 매우 리소스 효율적으로 만들었습니다. 다중 헤드 잠재 주의(MLA) 및 전문가 혼합과 같은 혁신을 통합하여 상당한 계산 효율성을 달성했습니다. Epoch AI에 따르면 DeepSeek의 모델은 Meta의 Llama 3.1 모델에서 사용하는 컴퓨팅 파워의 1/10만 필요했습니다.

"DeepSeek은 단기적 이익보다 장기적 혁신에 집중하는 중국 기업의 새로운 물결을 나타냅니다."라고 한 기술 분석가가 Wired에 말했습니다.

혁신을 주도하는 젊은 인재

DeepSeek의 인력은 주로 베이징 대학과 칭화 대학과 같은 중국의 명문 대학을 졸업한 젊은 졸업생으로 구성되어 있습니다. Liang은 36Kr과의 인터뷰에서 신입 졸업생을 고용하면 복잡한 과제를 해결하는 데 이상적인 협력 문화가 조성된다고 언급했습니다.

"우리의 핵심 기술 직책은 대부분 올해 졸업하거나 지난 1~2년 사이에 졸업한 사람들이 채웁니다."라고 Liang은 말했습니다. 그는 이러한 젊은 연구자들이 AI 혁신에서 중국의 위상을 높이는 사명에 의해 주도된다고 강조했습니다.

미국 칩 제한으로 인한 과제

DeepSeek의 진전은 2022년 10월에 부과된 미국 수출 통제에도 불구하고 이루어졌으며, 이로 인해 중국이 Nvidia의 H100 칩을 포함한 고급 컴퓨팅 하드웨어에 접근할 수 없었습니다. 처음에 DeepSeek은 H100을 10,000대 비축했지만 곧 추가 리소스를 확보하는 데 어려움을 겪었습니다.

량(Liang)은 "우리가 직면한 문제는 자금 조달이 아니라 첨단 칩에 대한 수출 통제입니다."라고 말했습니다.

이러한 과제를 극복하기 위해 DeepSeek은 소프트웨어 중심 리소스 최적화와 대체 엔지니어링 접근 방식에 집중했습니다. 이러한 전략적 적응을 통해 회사는 하이엔드 칩에 크게 의존하지 않고도 발전할 수 있었습니다.

오픈소스 AI를 통한 글로벌 영향

DeepSeek이 AI 모델을 오픈소스로 공개하기로 한 결정은 AI 연구 커뮤니티에서 상당한 인정을 받았습니다. 이 회사는 모델 가중치와 출력에 대한 액세스를 제공함으로써 전 세계 개발자에게 권한을 부여하고 AI 분야에서 서구의 우세에 도전하고자 합니다.

시드니 공과대학의 준교수인 마리나 장은 "DeepSeek은 오픈소스 방식을 채택하고 집단적 전문 지식을 모으고 협력적 혁신을 촉진했습니다."라고 말했습니다.

미래 전망과 업계 대응

DeepSeek의 발전은 서구 AI 기업이 경쟁력을 유지하도록 압력을 가했습니다. 업계 분석가들은 이 회사가 리소스 효율성과 혁신에 집중하면 전통적으로 광범위한 연산 능력에 의존하는 현재의 AI 환경을 파괴할 수 있다고 제안합니다.

Whatsapp 배너(Banner)

AI 개발 경쟁이 치열해짐에 따라 DeepSeek의 성공은 기술적 제약에 직면한 대안적 접근 방식의 잠재력을 강조합니다. 과학적 호기심과 비용 효율적인 AI 솔루션을 결합하는 이 회사의 독특한 전략은 글로벌 AI 개발 트렌드를 재정의할 수 있습니다.

DeepSeek의 가격 책정이 AI 경제를 뒤집다

Bernstein 분석가들은 일요일에 DeepSeek의 모델이 가격 책정에서 OpenAI보다 20~40배 낮다고 밝혔습니다. 이 중국 기업은 Reasoner 모델에 대해 100만 토큰당 0.55달러를 청구하는 반면 OpenAI는 o1 모델에 대해 동일한 사용에 대해 15달러를 청구합니다. AI가 텍스트를 처리하는 데 사용하는 기본 단위인 토큰은 단어의 약 4분의 3에 해당하며 생성 AI 운영에서 핵심 비용 지표가 되었습니다.

오픈소스 대 독점 모델 논쟁(Open-source vs proprietary model debate)

DeepSeek의 오픈소스 접근 방식은 OpenAI의 폐쇄형 시스템과 극명하게 대조되며, Bernstein은 이 개발이 "독점 대 오픈소스 노력의 실행 가능성에 대한 매우 흥미로운 질문을 제기한다"고 언급했습니다. 가격 차이는 DeepSeek이 최근까지 비교적 알려지지 않은 중국 스타트업이었음에도 불구하고 ChatGPT보다 앞서 미국 앱 스토어 다운로드에서 1위를 차지한 것과 일치합니다.

Barclays의 Mitul Kotecha는 중국의 기술 발전에 대한 시장의 놀라움을 강조했습니다. "그들이 하이엔드( high-end )기술을 달성할 수 있다는 사실은 많은 사람들을 놀라게 했습니다... 이것이 오늘날 감정의 변화를 주도하는 것 같습니다." 이러한 논평은 수출 통제를 통해 중국의 첨단 반도체 기술 접근을 제한하려는 미국의 노력에 따른 것입니다.

Kidari's Blog

2025년 1월 27일 월요일

중국 AI 연구소 DeepSeek, 가격 책정에서 OpenAI를 대폭 깎아 기술 주식을 불안하게 함

댓글 없음:

댓글 쓰기