상세 컨텐츠

본문 제목

오픈AI 사람의 목소리를 재현하는 생성AI '보이스엔진(Voice Engine)' 개발

전략_경영/AI트랜스포메이션

by Marketcast 2024. 3. 30. 22:33

본문

오픈AI가 개발한 최신 생성 AI 'Voice Engine'은 사용자의 목소리를 놀랍도록 정확하게 재현할 수 있다. 단 15초의 목소리 샘플과 텍스트 입력만으로, 해당 화자의 목소리로 음성을 합성할 수 있으며, 다양한 외국어로의 변환도 지원한다.

이 기술은 2022년 후반부터 개발되어 왔으며, 이미 채팅 GPT에 음성 입출력 기능을 통합하는 등, 합성 음성 기술의 발전을 통해 실제 인간의 목소리를 더욱 리얼하게 재현하는 데 성공했다.

Voice Engine은 아동에게 독서를 들려주기, 기업 제품 소개, 의료 상담, 언어 장애 지원 등 다양한 분야에 활용가능하다. 또한, 사용자의 목소리 톤과 감정까지 재현하며 다언어 지원도 가능하여 폭넓은 적용 범위를 가지고 있다.

음성 엔진은 교육, 의료, 비즈니스 등 다양한 분야에서 폭넓은 가능성을 열어가고 있으며, 이를 통해 사람들의 삶의 질을 향상시키고 있다.

그러나, 합성 음성 기술이 범죄에 악용될 수 있다는 우려도 있다. 예를 들어, 미국에서는 조 바이든 대통령의 목소리를 모방한 가짜 전화가 선거에 사용된 사례가 있다. 이에 대응하여, 오픈AI는 기술의 일반 공개를 유보하고, 시험 운용과 함께 철저한 검증 과정을 진행할 예정이다.

오픈AI는 "사람의 목소리를 모방하는 기술은 큰 위험을 수반할 수 있으며, 특히 선거 기간에는 더욱 신중해야 한다"고 언급하며, 정부 및 외부 기업과의 협력을 통해 안전 대책과 사용 상황 모니터링에 적극적으로 나서고 있음을 밝혔다.

 

오픈AI 사람의 목소리를 재현하는 생성AI '보이스엔진(Voice Engine)' 개발

오픈AI가 개발한 최신 생성 AI 'Voice Engine'은 사용자의 목소리를 놀랍도록 정확하게 재현할 수 있다. 단 15초의 목소리 샘플과 텍스트 입력만으로, 해당 화자의 목소리로 음성을 합성할 수 있으며,

contents.premium.naver.com

 

관련글 더보기

댓글 영역