음성 파일을 텍스트로 자동으로 바꿔 주는 프로그램이 있다면?! 미팅 속기록과 인터뷰 녹취록, 동영상 자막 생성까지 여러 상황에서 편리하게 활용할 수 있을 겁니다. 최신 AI 기술을 적용한 음성 텍스트 변환 (STT: Speech-to-text) 기능은 최근에 많은 프로그램에서 활용되고 있습니다.
그래서 오늘은 음성 파일 텍스트 변환을 지원하는 인기 프로그램 정보를 정리하였습니다. 각 프로그램의 주요 특징과 장단점을 아래에서 확인해 보시기 바랍니다!
5분 안에 이런 내용을 알려 드려요!
Part 1 인기 Top 5 음성 텍스트 변환 프로그램
1. 유니컨버터
유니컨버터는 1순위로 추천해 드리는 올인원 프로그램입니다. 원더쉐어에서 개발한 동영상 솔루션으로 강력한 영상 편집 및 파일 변환 기능, 그리고 최신 AI 기술이 적용된 다양한 부가 기능과 동영상 플레이어를 지원합니다.
그리고 최신 버전에서 음성 - 텍스트 변환(음성 인식) 기능이 추가되었습니다. 다양한 영상이나 오디오 파일을 불러와서 텍스트로 변환할 수 있으며, 영어/한국어를 포함한 수십 가지 언어를 지원합니다. 음성 인식 기능을 실행하면 프로그램이 자동으로 텍스트를 완성하여 내보내기를 할 수 있습니다.
유니컨버터는 윈도와 맥OS용 설치 파일을 제공하며, 모든 기능을 체험판에서 확인해 볼 수 있으므로 한 번 사용해 보시기 바랍니다.
주요 기능:
- 전문 동영상 편집 기능 및 1,000+ 이상의 파일 변환 지원
- 개별 재생 플레이어 지원 (스크린 캡쳐 등 부가 기능 포함)
- 최신 AI 기술을 적용한 다양한 부가 기능 지원
2. 구글 클라우드 STT
구글 클라우드 STT 기능은 많은 유저가 사용하는 음성 텍스트 변환 서비스입니다. 구글 클라우드는 구글에서 제공하는 기업/비즈니스 유저용 워크스테이션 플랫폼이며 STT를 포함한 수십 가지 기능을 유/무료로 지원하고 있습니다.
클라우드 STT 변환 서비스는 음성 파일을 업로드하거나 마이크 입력으로 음성을 추가할 수 있습니다. 수십 가지 이상의 언어를 지원하며, 음성 파일의 화자(speaker) 수를 최대 5명까지 지정하여 목소리에 따라 텍스트를 자동 구분하는 것도 가능합니다.
3. 아마존 트랜스크라이브
아마존 트랜스크라이브는 구글 클라우드 같은 기업용 서비스 AWS(아마존 웹 서비스)에서 제공하는 음성 텍스트 변환 기능입니다. 구글처럼 거대 IT 기업인 아마존에서 제공하는 기능으로 믿을 수 있는 변환 품질이 장점입니다.
AWS는 유료 구매가 필요하지만 트랜스크라이브는 1년 무료 체험(1개월 최대 60분 한도)이 가능합니다. 그리고 강력한 보안 기능으로 서버에 올리는 파일을 보호해 주는 것도 장점입니다. 다만 아직 한국어 서비스를 지원하지 않으며, 구글 클라우드보다 지원하는 변환 언어 수도 적습니다.
4. 애플 받아쓰기 (맥OS/iOS)
애플 기기 사용자라면 별도의 음성 텍스트 변환 프로그램을 설치하는 대신 기본 제공 애플 받아쓰기 기능을 활용할 수 있습니다. 애플 기기의 설정 메뉴 -> 키보드 -> 받아쓰기 기능을 활성화한 후, 언어 및 단축키를 지정하면 됩니다.
그럼 애플 메모장이나 페이지, 웹 사이트 등 다양한 텍스트 입력 상황에서 단축키로 받아쓰기 기능을 켠 후 음성을 바로 텍스트로 바꿀 수 있습니다. 다만 음성 파일을 변환하는 것은 불가능하며, 화자(speaker) 구분 등의 기능이 없는 것은 단점입니다.
5. 레브
레브는 동영상 및 음성 파일 텍스트 변환을 지원하는 서비스입니다. 앞서 추천해 드린 프로그램들과 달리 전문 인력이 직접 텍스트 변환 및 번역, 문서 생성을 제공하며 그만큼 정확한 자막 생성 및 번역 품질을 제공합니다.
레브에 가입한 후, 텍스트 생성을 원하는 파일(비디오, 오디오 모두 가능)을 올리면 이후 텍스트 변환 문서를 받을 수 있습니다. 어색한 부분에 대한 피드백 및 수정 작업도 가능합니다. 다만 분 단위로 가격이 책정되어 조금 비싼 것은 단점입니다.
Part 2 AI로 영상 배경 수정 및 보컬 분리
지금까지 음성을 텍스트로 바꿀 수 있는 다양한 프로그램 및 서비스를 알려드렸습니다. 처음에 추천해 드린 유니컨버터는 최신 AI 기술을 적용한 다양한 부가 기능을 지원하는데, 그중 몇 가지 유용한 기능을 알아보겠습니다.
유니컨버터 보컬 리무버 기능은 오디오나 동영상 파일에서 백그라운드 음원 및 보컬을 분리해 주는 기능입니다. 이 기능을 활용하면 공연용 MR 음원 생성 같은 전문 작업을 마우스 클릭만으로 끝낼 수 있어서 편리합니다.
그리고 AI 초상화 기능은 동영상에서 인물과 배경을 분리하고, 배경을 바꿀 수 있도록 하는 최신 편집 기능입니다. 기존 프로그램들이 이미지에서 인물을 분리하는 것에서 한발 더 나아가 비디오 편집이 가능하도록 만들면서 다양한 상황으로 콘텐츠를 꾸밀 수 있게 되었습니다.
마치며
오늘은 자동으로 자막을 생성하고, 녹취록을 생성할 수 있는 음성 텍스트 변환 프로그램을 추천해 드렸습니다. 그리고 원더쉐어 유니컨버터의 최신 AI 기술 부가 기능도 살펴보았습니다. 그럼 오늘 정보가 도움이 되셨길 바라며, 다음에도 유익한 내용으로 찾아오겠습니다!