Alibaba Cloud의 연구팀이 제안한 **Aegaeon**은 수백~수천 개의 다양한 LLM을 동시에 서빙해야 하는 모델 마켓 환경에서 **GPU 자원 낭비를 극복**하기 위한 시스템이다.