칼럼/에세이
음악 생성 AI의 새로운 지평을 열다
“수노의 1700억 투자 유치와 그 잠재력”
메타ai뉴스 논설위원
이현우 교수
2024년 5월 22일, 인공지능(AI) 기반 음악 생성 스타트업 수노가 1억 250만 달러(약 1700억 원) 규모의 투자 유치를 성공적으로 마무리했다. 이는 음악 생성 AI 시장의 잠재력을 대변하는 사건으로, 수노가 개발한 텍스트 음악 생성 AI ‘V3’에 대한 신뢰와 기대를 반영한다.
수노는 하버드대학교 박사 출신 믹키 슐만이 설립한 기업으로, 음악적 지식이 없는 사용자도 텍스트 입력만으로 몇 초 만에 연주와 보컬을 포함한 완전한 노래를 생성할 수 있는 AI ‘V3’를 개발했다. 이 기술은 사용자가 단순히 텍스트를 입력하는 것만으로도 싱글 차트 40위 안에 들어갈 만한 수준의 곡을 생성할 수 있는 놀라운 성능을 자랑한다.
수노는 대형언어모델(LLM)과 유사하게 수백만 곡의 스타일과 구조를 학습해 다음 토큰을 예측하는 방식을 사용한다. 하지만 음악 생성은 단어처럼 분리된 것이 아닌 연속 신호를 다루기 때문에 더 복잡하다. 이를 해결하기 위해 V3는 샘플링 속도를 합리적인 수준으로 낮추고, 다음 오디오 토큰을 예측하는 모델을 기반으로 한다. 이로 인해 사용자는 단순한 텍스트 입력만으로도 고품질의 음악을 생성할 수 있다.
수노의 V3는 다양한 기능을 제공한다. 사용자는 텍스트 입력만으로 음악을 들을 수 있으며, 선택한 언어로 노래를 부를 수도 있다. 또한, 텍스트를 통해 노래에 필요한 세부 사항을 지정하고, 마음에 들지 않는 부분은 변경을 요청할 수 있다. ‘사용자 정의 모드’를 통해 자신만의 가사를 쓰고, 제목을 선택하고, 음악 스타일을 지정할 수 있으며, 생성된 곡을 오디오 또는 비디오 형식으로 공유하거나 다운로드할 수 있다. 이 외에도, 생성된 데이터를 기반으로 요소를 수정하여 노래를 리믹스할 수 있다.
이번 투자에는 라이트스피드 벤처 파트너스, 냇 피리드먼, 다니엘 크로스, 매트릭스 파운더 콜렉티브가 참여했다. 벤처비트는 이번 투자에 대해 “수노의 기술에 대한 단순한 신뢰의 결과가 아니라, 음악 영역에서 AI의 변혁적 힘에 대한 믿음의 선언”이라고 평가했다. 이는 음악 생성 AI가 대세라는 것을 보여주는 중요한 지표다.
라이트스피드 벤처 파트너스는 수노가 지난해 출시된 이후로 이미 1000만 명 이상의 사람들이 플랫폼에서 음악을 만드는 등 인상적인 성과를 기록했다고 밝혔다. 또한, 수노는 마이크로소프트와 파트너십을 맺고 MS 코파일럿에 V3를 직접 통합했다. 이를 통해 수노는 AI 기술 개발을 가속화하고 전 세계 10억 명의 사람들이 음악을 통해 자신을 표현할 수 있도록 지원할 계획이다.
수노의 AI 공동 창립자 믹키 슐만은 “우리의 사명은 누구나 음악 창작을 가능하게 하고 모든 사람의 음악적 창의성을 발휘하도록 하는 것”이라며, “이번 새로운 투자를 통해 우리는 AI 기술 개발을 가속화하고 전 세계 10억 명의 사람들이 음악을 통해 자신을 표현할 수 있도록 할 것”이라고 말했다.
수노의 성공은 음악 생성 AI 시장의 무한한 가능성을 보여준다. 앞으로 수노가 어떤 혁신을 이끌어 낼지 기대된다.
수노의 AI ‘V3’는 몇 가지 주요 기술적 특징으로 다른 AI와 차별화됩니다. 첫째, V3는 텍스트 입력만으로 사용자에게 고품질의 음악을 생성해줍니다. 이는 사용자가 음악적 지식이 없어도 쉽게 음악을 만들 수 있게 해주는 강력한 도구입니다. 둘째, V3는 대형언어모델(LLM)과 유사한 방식으로 수백만 곡의 스타일과 구조를 학습해 다음 토큰을 예측합니다. 그러나 음악 생성의 복잡성을 해결하기 위해 샘플링 속도를 낮추고 연속 신호를 다루는 방식을 채택했습니다. 마지막으로, V3는 사용자 정의 모드를 통해 사용자가 가사, 제목, 음악 스타일을 지정할 수 있으며, 생성된 곡을 오디오 또는 비디오 형식으로 공유하거나 리믹스할 수 있는 다양한 기능을 제공합니다.
수노와 마이크로소프트의 파트너십은 음악 생성 AI 시장에 상당한 영향을 미칠 것입니다. 첫째, 마이크로소프트의 광범위한 플랫폼과 수노의 V3 기술이 결합됨으로써 더 많은 사용자에게 접근할 수 있게 됩니다. 이는 음악 생성 AI 기술의 대중화를 촉진할 수 있습니다. 둘째, MS 코파일럿에 V3를 통합함으로써 개발자와 크리에이터들이 음악 생성 AI를 손쉽게 사용할 수 있는 환경이 조성됩니다. 이는 새로운 음악 창작 방식과 툴의 확산을 가속화할 것입니다. 마지막으로, 마이크로소프트의 기술적 지원과 글로벌 네트워크는 수노의 기술 개발과 시장 확대에 큰 도움을 줄 것입니다.
수노의 성공은 AI 기반 창작 산업 전반에 여러 가지 변화를 가져올 수 있습니다. 첫째, AI를 활용한 창작 활동의 문턱이 낮아지면서 더 많은 사람들이 창작에 참여하게 될 것입니다. 이는 다양한 배경과 아이디어를 가진 창작물의 폭발적 증가로 이어질 수 있습니다. 둘째, AI 기술이 창작 과정에서의 반복적이고 소모적인 작업을 대신해줌으로써 창작자의 창의성과 효율성이 크게 향상될 것입니다. 셋째, AI 기반 창작물이 주류 문화와 산업에 더욱 깊이 자리 잡으면서, AI와 인간이 협업하는 새로운 형태의 창작 생태계가 형성될 것입니다. 이는 음악뿐만 아니라 예술, 문학, 영상 등 다양한 분야에서 혁신을 촉진할 것입니다.
세계메타버스AI연맹
이사장 이현우 교수