가트너(Gartner)의 최근 보고서는 생성형 AI(GenAI) 기술의 미래에 대해 흥미로운 전망을 제시하고 있다. 특히 주목할 만한 점은 멀티모달 생성형 AI 솔루션의 급격한 성장 예측이다. 현재 생성형 AI 솔루션 중 멀티모달 기능을 갖춘 것은 1%에 불과하지만, 2027년까지 이 비율이 40%로 크게 증가할 것으로 예상하고 있다. 이는 AI 기술이 단일 형식의 데이터 처리에서 벗어나 더욱 복잡하고 다양한 입력을 다룰 수 있게 될것으로 보고 있다.

멀티모달 AI의 핵심은 텍스트, 이미지, 오디오, 비디오 등 다양한 형태의 데이터를 동시에 처리할 수 있는 능력이다. 이는 인간과 AI 사이의 상호작용을 한층 더 자연스럽고 효과적으로 만들 것으로 기대된다. 예를 들어, 음성 명령과 함께 이미지를 제시하면 AI가 이를 종합적으로 이해하고 더 정확한 응답을 제공할 수 있게 될 것이다.