딥시크가 체험버전 V3.2를 정식 발표한 가운데 화웨이 등 대표 업체들이 이미 적용을 완료한 것으로 알려졌다.
29일 딥시크는 차세대 대형언어모델 딥시크-V3.2-Exp를 정식 발표했고, 허깅페이스 플랫폼에 소스를 동시 공개했다.
이번 모델은 희소한 어텐션(Attention) 아키텍처를 도입했는데, 이 아키텍처는 컴퓨팅 자원의 소모를 낮추고 모델 추론 효율을 높일 수 있다.
이후 곧바로 화웨이 Ascend, 캠브리콘, 하이광정보 등이 이 모델의 적용을 완료했다고 밝혔다.
이중 Ascend는 0day 지원과 오픈소스 추론 코드를 실현했다.
한편 최근 AI 업계에서는 기존의 풀 어텐션 아키텍처의 일부 문제를 인지하고 일부 토큰을 선택해 계산하는 희소 어텐션 아키텍처 연구가 활발하게 진행되고 있다.
딥시크의 이번 V3.2 체험판 역시 이와 같은 업계 흐름에 부합하는 것으로 볼 수 있다.
searchmchina@searchmchina.com



