중국에 인공지능 딥시크 출시는 저비용으로 고성능을 나타내는 놀라운 개발로 전 세계를 놀라게 했다.
1. 중국 인공지능 스타트업인 딥시크 출시
중국 인공지능 스타트업인 딥시크가 지난주 딥시크를 출시하자 엔비디아 등 미 기술주 주가가 폭락했다. 딥시크의 놀라운 진전으로 미국 기술 산업을 둘러싼 무적의 이미지가 위협됐기 때문이다. 그간 뉴욕증시에는 AI 산업을 둘러싼 미국 예외주의가 있었다. 전 세계에서 현재 수준의 AI를 구현할 수 있는 기업은 미국에만 있기 때문에 주가에 AI 프리미엄을 더 얹어야 한다는 논리였다. 딥시크의 부상은 이를 무너뜨린 것이다. 딥시크는 미국 빅테크 기업의 ‘거품설’도 제기됐다. 도이체방크의 외환 전략 책임자 조지 사라벨로스는 “모든 것을 종합해 보면 중국에서 AI 혁신에 대한 뉴스 흐름은 궁극적으로 달러에 부정적으로 작용할 것”이라며 “가장 명확한 비유는 2000년대 닷컴 버블로, 외부 충격으로 미국 기술평가와 자본 지출이 대규모로 붕괴해 광범위한 영향을 미쳤다”라고 말했다. 캘리포니아 대학교 버클리 캠퍼스 이온 스토이카 교수는 오픈소스 커뮤니티의 중심이 중국으로 옮겨가고 있다며 이것은 미국에 큰 위험이 될 수 있다고 말했다. 미 CNN에 따르면, 스타트업 딥시크가 지난주 출시한 R1은 챗GPT와 유사한 모델을 선보였다. 문제는 비용이다. 사우스차이나모닝포스트에 따르면, 딥시크에는 6710억 개의 매개변수가 있으며, 약 2개월 만에 558만 달러의 비용으로 학습이 완료됐다. 이는 수억 또는 수십억 달러 투자 비용으로 예상되는 오픈 AI가 개발한 모델보다 훨씬 적게든 것이다. 도널드 트럼프 대통령의 지지자이자 세계적인 기술 투자자 중 한 명인 마크 앤드레슨은 X에 올린 게시물에서 딥시크는 제가 본 것 중 가장 놀랍고 인상적인 혁신 중 하나라고 말했다.
2. 창업자 랑원펑
이렇게 저비용으로 챗GPT급 성능을 확보해 전 세계 인공지능(AI) 업계에 충격을 던진 중국 스타트업 딥시크는 2023년 5월 중국 저장성 항저우에 설립됐다. 대학 졸업 후 그는 청두의 저렴한 아파트로 이사해 금융에 AI를 적용할 수 있는지를 연구했고, 2016년 대학동기 두 명과 AI와 수학에 의존해 투자를 진행하는 헤지펀드 회사 하이 플라이어를 설립했다. 훗날 딥시크의 투자자이자 모회사가 되는 하이플라이어의 운용 자산은 한때 100억 위안이 넘었다고 한다. 회사가 순항하던 무렵 2021년부터 그는 갑자기 수천 개의 엔비디아 GPU를 구매하기 시작했다. 그때까지만 해도 친구들은 새로운 취미를 찾는 억만장자의 기이한 행동으로 여겼다. 그는 멋을 부리는 것과는 거리가 멀었고, 늘 머리를 잘 안 감아서 부스스한 머리를 하고 다니는 너드의 이미지였다고 한다. 경제매체 포브스는 딥시크 연구팀에 중국 최고 대학 출신의 젊은 인재들이 모여 있으며, 업무 경험보다 기술적 능력을 우선으로 채용해 AI 개발에 대한 신선한 시각을 가진 고도로 숙련된 팀을 구성했다고 전했다. 그 이유에 대해 량은 “장기간에 걸쳐 목표를 이뤄야 하기 때문에 경력보다는 열정과 능력을 보고 뽑았다”라고 말했다.
3. 딥시크, 중국 AI 발전 보여줘
뉴욕타임스(NYT)는 딥시크 개발에 투입한 비용은 558만 달러에 그쳤다고 보도했다. 이는 메타가 최신 AI 모델인 라마 3 모델에 H100으로 훈련한 비용의 10분의 1 수준이다. 특히, 딥시크가 사용한 H800은 미국의 고성능 반도체 수출 규제로 엔비디아가 H100의 사양을 낮춰 출시한 제품이다. 한마디로 딥시크는 저성능 저예산으로 챗GPT와 맞먹는 성능을 냈다는 것이다. 딥시크가 미 대기업들이 지출하는 비용보다 적은 비용으로 강력한 LLM을 개발한 것은 중국 AI가 얼마나 발전했는지를 보여준다. 딥시크는 비용 효율적인 학습을 달성하도록 설계된 새로운 아키텍처를 활용해 그래픽 처리 장치가 LLM을 학습하는데 278만 GPU시간만 필요로 했다. 이는 페이스북의 메타가 자체 모델을 훈련하는데 필요한 3080만 GPU보다 훨씬 적은 시간이다. 이는 미국이 칩 수출을 통제하는 것의 한계를 보여주기도 한다. 블룸버그는 딥시크 엔지니어들은 2000개의 엔비디아 칩만 필요하다고 밝혔는데, 주요 미국 기업들은 최대 1만 6000개의 칩이 필요하다고 한다고 보도했다. 딥시크는 이번 달 초 딥티 크을 출시한 이후, 회사는 수학, 코딩, 자연어 추론과 같은 작업에 사용될 때 오픈 AI의 최신 모델 중 하나와 동등한 성능을 가진다고 밝혔다. 실리콘 밸리 벤처 캐피털리스트이자 트럼프 자문가인 마크 앤드레슨은 딥티 크을 AI의 스푸트니크 순간이라고 묘사했는데, 이는 1957년 소련이 발사한 인공위성을 지칭하는 말이다. 골드만삭스는 지금까지 시장은 구글이나 오픈 AI, 마이크로소프트 등 AI에 투자하는 회사와 AI 관련 도구나 인프라를 제공하는 회사에 막대한 보상(프리미엄)을 줬다”며 딥시크 모델이 기존 AI 기업들의 지출에 의구심을 자극하면서 이 시나리오는 더 광범위하게 투자자들의 신뢰를 흔들고 있다고 말했다. 량은 딥시크의 저렴한 비용에 놀라는 업계 분위기에 더 놀라고 있다고 밝혔다. 그는 가격이 이렇게 민감한 문제가 될 줄은 예상하지 못했다며 우리는 단순히 우리의 속도에 맞춰 비용을 계산하고 그에 따라 가격을 책정했다고 밝혔다.
결론
미래는 AI로 인하여 더 많은 발전을 가져다줄 것으로 딥시크는 쳇지피티 보다 저비용으로 비슷한 성능을 만들어 특히 미국을 놀라게 했다.