AI 전문가들이 말하는 DeepSeek 열풍의 진짜 이유

AI 전문가들이 말하는 DeepSeek 열풍의 진짜 이유

카테고리 없음 2025. 3. 4. 13:44

728x90

반응형

인공지능 전문가들에 따르면, DeepSeek은 지난달 기술계의 판도를 뒤집어 놓았습니다. 그 이유는 분명합니다. 중국 기술 스타트업 DeepSeek이 AI 분야에 미치는 영향력은 이제 시작에 불과할 가능성이 큽니다.
DeepSeek은 1월 말에 R1 AI 모델로 헤드라인을 장식했는데, 이 회사는 이 모델이 Open AI의 o1 모델과 거의 비슷한 성능을 훨씬 적은 비용으로 낼 수 있다고 말합니다. DeepSeek이 ChatGPT를 잠시 제치고 Apple 앱 스토어에서 1위 앱이 되면서 기술 주가가 폭락했습니다 .
이 성과는 미국의 거대 기술 기업들이 중국과의 AI 경쟁에서 미국의 입지와 이러한 노력에 투자된 수십억 달러에 의문을 제기하게 만들었습니다. JD Vance 부사장은 화요일 파리에서 열린 인공지능 액션 서밋에서 DeepSeek이나 중국을 직접 언급하지는 미국이 이 분야를 선도하는 것이 얼마나 큰 우선순위인지 분명히 강조했습니다.
그는 "미국은 AI 분야의 선두 주자이며, 우리 행정부는 이를 그대로 유지할 계획"이라고 말했지만, "미국은 다른 국가들과 협력하고 싶어 한다"고 덧붙였다.
하지만 DeepSeek의 효율성과 파워만이 전부는 아닙니다. DeepSeek R1이 추론하고 "생각"하여 양질의 결과를 제공하는 방식과 회사의 핵심 기술을 공개적으로 제공하기로 한 결정도 이 분야를 발전시킬 것이라고 전문가들은 말합니다.
AI는 오랫동안 기술 제품에 사용되어 왔지만, 지난 2년 동안 ChatGPT와 사람들이 일하고, 소통하고, 정보를 찾는 방식을 바꿔놓은 다른 생성형 AI 서비스의 등장으로 인해 화약고에 도달했습니다. 칩 제조업체 NVIDIA와 같은 회사가 월가의 사랑을 받게 되었고 실리콘 밸리 거대 기업의 궤적을 뒤집었습니다. 따라서 더 유능하고 효율적인 모델을 구축하는 데 도움이 되는 모든 개발은 반드시 주의 깊게 지켜봐야 할 것입니다.
"이건 분명히 과장된 광고가 아닙니다." Allen Institute for Artificial Intelligence의 전 CEO인 Oren Etzioni가 말했다. "하지만, 이 세상은 매우 빠르게 움직입니다."
기술 리더들은 DeepSeek의 부상에 빠르게 대응했습니다. Google DeepMind CEO인 데미스 하사비스는 DeepSeek에 대한 과장된 홍보를 "과장된"이라고 했지만 CNBC에 따르면 그 모델을 "아마도 제가 중국에서 본 것 중 가장 뛰어난 작품"이라고 말했습니다 .
Microsoft CEO Satya Nadella는 1월에 회사의 분기 실적 전화 회의에서 DeepSeek에 "진정한 혁신"이 있다고 말했고, Apple CEO Tim Cook은 iPhone 제조업체의 실적 전화 회의에서 "효율성을 높이는 혁신은 좋은 것"이라고 말했습니다.
하지만 모든 관심이 긍정적이었던 것은 아닙니다. 반도체 연구원 SemiAnalysis는 DeepSeek이 훈련에 560만 달러만 들었다는 주장에 의문을 제기했습니다. OpenAI는 The Financial Times에 DeepSeek이 미국 회사의 모델을 사용하여 자체 경쟁자를 훈련했다는 증거를 찾았다고 말했습니다.
OpenAI 대변인은 CNN에 보낸 코멘트에서 "DeepSeek이 부적절하게 우리 모델을 추출했을 수 있다는 징후를 알고 검토 중이며, 더 많은 정보를 알게 되면 정보를 공유할 것입니다."라고 말했습니다. DeepSeek에 즉시 연락하여 코멘트를 받을 수 없었습니다.
그리고 보안 연구원들이 중국 정부와의 잠재적 연관성을 강조한 후, 미국 의원 2명이 이미 정부 기기에서 이 앱을 금지할 것을 요구했다고 AP 와 ABC 뉴스가 보도했습니다. 인기 있는 소셜 미디어 앱인 TikTok 에 대해서도 비슷한 우려가 이 앱은 미국인 소유자에게 판매해야 하며 그렇지 않으면 미국에서 금지될 위험이 있습니다.
에치오니는 "DeepSeek은 (대규모 언어 모델의) TikTok입니다."라고 말했습니다.
기술 거대 기업들은 DeepSeek의 기술이 자사 제품과 서비스에 어떤 영향을 미칠 수 있는지 이미 고려하고 있습니다.
개발자를 위한 도구를 제공하는 AI 플랫폼인 Hugging Face의 수석 연구 과학자인 루이스 턴스톨은 "DeepSeek이 우리에게 제공한 것은 기본적으로 기술 보고서 형태의 레시피였지만, 그들은 우리에게 추가로 누락된 부분을 제공하지 않았습니다."라고 말했습니다.
턴스톨은 Hugging Face에서 DeepSeek의 R1 모델을 완전히 오픈 소스로 공개하기 위한 노력을 주도하고 있습니다. DeepSeek에서는 연구 논문과 모델의 매개변수를 제공했지만 코드나 학습 데이터는 공개하지 않았습니다.
나델라는 Microsoft의 수익 발표에서 Windows Copilot+ PC, 즉 AI 모델을 지원하기 위해 특정 사양에 맞춰 제작된 PC가 DeepSeek R1에서 추출한 AI 모델을 로컬에서 실행할 수 있을 것이라고 말했습니다. 모바일 칩 제조업체인 Qualcomm은 화요일에 DeepSeek R1에서 추출한 모델이 일주일 이내에 자사 칩으로 구동되는 스마트폰과 PC에서 실행되고 있다고 말했습니다.
AI 연구자, 학자, 개발자들은 DeepSeek이 AI 발전에 어떤 의미를 갖는지 여전히 탐구하고 있습니다.
DeepSeek의 모델은 유일한 오픈소스 모델은 아니며, 응답하기 전에 답변을 추론할 수 있는 최초의 모델도 아닙니다. 작년에 출시된 OpenAI의 o1 모델도 이런 기능을 제공합니다.
DeepSeek을 중요하게 만드는 것은 다른 모델에서 추론하고 학습할 수 있는 방식과 AI 커뮤니티가 장면 뒤에서 무슨 일이 일어나고 있는지 볼 수 있다는 사실입니다. DeepSeek 앱에서 R1 모델을 사용하는 사람들은 질문에 답할 때 "생각" 과정도 볼 수 있습니다.
Qualcomm의 기술 계획 및 엣지 해법 부문 수석 부사장 겸 총괄 관리자인 Durga Malladi는 CNN에 "기계 내부에서 바퀴가 돌아가는 것을 볼 수 있습니다."라고 말했습니다.
턴스톨은 그리 머지않은 미래에 DeepSeek처럼 추론할 수 있는 새로운 모델의 물결이 나타날 수 있다고 생각합니다. 이는 실리콘 밸리가 일반적으로 챗봇의 다음 진화이며 소비자가 기기와 상호 작용하는 방식이라고 믿는 AI 에이전트를 구축하기 위해 기술 거대 기업이 경쟁하는 상황에서 중요할 수 있습니다. 하지만 그러한 변화는 아직 일어나지 않았습니다.
소셜 미디어 플랫폼 X의 챗봇의 차기 버전인 Grok 3은 "매우 강력한 추론 기능"을 갖게 될 것이라고 소유자인 일론 머스크가 목요일 세계 정부 정상회담 중 비디오 출연을 통해 밝혔습니다.
지금으로서는 AI 커뮤니티는 DeepSeek이 제공하는 것을 계속 손볼 것입니다. 즉, 다음 획기적인 발견이 나올 때까지 말입니다.
"저는 확실히 다음 12개월 안에 다른 것으로 대체될 것이라고 예측합니다." 에치오니가 말했다. "하지만 매우 현실적인 발전입니다."

반응형

저작자표시 비영리 변경금지 (새창열림)

ABOUT ME

취미 헬린이 취미 헬린이

티스토리툴바