스퀴즈비츠는 AI 모델 성능을 유지하면서 32비트 데이터를 4비트 이하로 양자화한다. 더 빠르고 가벼운 AI 모델을 만드는 핵심 기술이다. 양자화된 모델을 기존 하드웨어에서도 효율적으로 연산할 수 있는 소프트웨어 엔진도 보유했다. 이로써 AI 대중화의 가장 큰 걸림돌인 운영 비용을 절감할 것이라는 평가다.
스퀴즈비츠의 AI 경량화 기술은 모바일 스마트폰, 노트북을 비롯한 엣지 디바이스, GPU 클라우드 등 다양한 환경에 적용할 수 있다. 이미지, 비디오, 음성, 자연어 등 다양한 모델을 지원해 응용 분야도 넓다. 이미 네이버, SK텔레콤 등 20여 곳 기업과 기술 검증(PoC) 및 프로젝트를 완료하고 초거대 AI 모델 등 다양한 분야 AI 서비스에 경량화 기술을 선보이고 있다.
또 경량화에 대해 익숙하지 않은 비전문가들도 손쉽게 AI 모델을 경량화하고 비교 및 분석할 수 있는 아울라이트(OwLite) 툴킷을 출시하기도 했다. 현재 엔비디아 GPU를 지원하고 있으며 향후 인텔, AMD, ARM 등의 하드웨어, AI 반도체 스타트업들이 내놓는 NPU까지 다양한 하드웨어를 지원하도록 적용 범위를 확장할 예정이다. 특히 이번 투자 유치를 기점으로 경량화 기술 경쟁력을 확보하고 해외 시장 진출에 본격적으로 나설 계획이다.
스퀴즈비츠는 포스텍 대학원 딥러닝 가속기 하드웨어(Neural Processing Unit, NPU) 연구팀을 주축으로 구성됐다. 공동창업진은 지난 7년간 CVPR, NeurIPS, ICLR 등 머신러닝 분야 세계 최고 학회에서 경량화 관련 논문을 꾸준히 발표해 왔다. 현재까지 딥러닝 가속을 주제로 한 국제 논문만 70편 이상이다. AI 전용 하드웨어를 직접 설계한 경험도 있다.
김형준 스퀴즈비츠 대표는 “AI 기반 서비스가 고객 확보에서 수익 창출 단계로 넘어가기 위해서는 AI 운영 비용을 대폭 절감해야 하는 문제를 안고 있다”며 “스퀴즈비츠만의 AI 경량화 기술로 많은 기업이 안고 있는 비용과 효율 문제를 해결하고 AI 기술 잠재력을 극대화하는 데 기여하는 기업이 되겠다”고 말했다.
앞서 스퀴즈비츠는 2022년 3월 설립 이후 포스텍홀딩스와 네이버D2SF로부터 시드 투자를 유치했다. 기술력이 우수한 스타트업을 선정해 기술개발 자금을 지원하는 딥테크 팁스 프로그램에도 선정돼 15억원 규모 기술 개발 자금을 확보했다.