요약:
최근 생성형 AI 플랫폼 다중화로 인하여 이용자 서비스 수요비용 절감에 대한 자원효율화와 관련된 연구의 필요성이 증대되고 있다. ChatGPT, Claude, Cemini 등 사용빈도가 높은 모델과 지속적으로 출시하는 LLM(Large Language Model) 서비스의 등장으로, 기업들은 각자의 비즈니스 목적에 맞는 최적의 LLM을 선택하여 이용을 원하는 요구가 급증하고 있다. 그러나 현실적으로 다수의 LLM을 동시에 활용할 때, 각 서비스별로 상이한 API(Application Programmable Interface)규격, 과금 체계, 운영 정책으로 인해 통합적 관리와 운영이 매우 어려운 실정이다. 본 연구에서는 다중 LLM 서비스의 통합 운영을 위한 MSP(Managed Service Provider) 시스템을 개발함으로써, 기업들의 서비스 활용 효율성을 50% 이상 향상시키고, 운영 비용을 절감할 수 있도록 제안하였다. 특히, 현재 주요 LLM 서비스들의 월 구독 비용이 $20~25 수준에서 형성되어 있는 실정이다. LLM의 개발 및 운영 비용 증가에 따른 구독 가격 상승이 예상되는 상황에서, MSP 통합 구독 관리는 규모의 경제를 통한 구매력 확보로 이어져 비용 절감 효과를 극대화할 수 있다. 더 나아가, 이러한 비용 절감은 기존의 확보된 자원을 자체 SLM(Small Language Model) 개발에 투자할 수 있도록 하여 중장기적으로는 기업 고유의 AI 모델 경쟁력 확보로 이어질 수 있다.
