Whisper Auto Captions

Whisper Auto Captions 1.8.1 안내

BrewCoder 2026. 4. 16. 15:49

Whisper Auto Captions 1.8.1 배포 안내와 주요 기능에 대한 상세 기록입니다.

동영상 자막 작업의 번거로움을 줄이기 위해 시작된 Whisper Auto Captions가 1.8.1 버전으로 업데이트되었습니다. 이번 버전은 지난 1.8.0에서 도입된 파이널 컷 프로 지원과 캡션 컨트롤 시스템을 한층 더 정교하게 다듬는 데 집중했습니다. 프로그램을 개발하며 중점적으로 고려했던 기능들과 이번 업데이트의 상세 내용을 정리해 드립니다.

 

가장 먼저 언급하고 싶은 변화는 사용자 경험의 개선입니다.

1.8.1 버전부터는 소스 파일을 지정할 때 드롭다운 방식을 사용할 수 있습니다. 기존에 파인더를 매번 열어 파일을 찾아야 했던 불편함을 줄이고, 자주 사용하는 경로에 빠르게 접근할 수 있도록 설계했습니다. 물론 해당 영역을 클릭하면 이전처럼 파인더를 통해 직접 파일을 선택하는 유연함도 그대로 유지했습니다.


프로그램의 핵심 기능인 캡션 컨트롤 시스템은 이번 업데이트에서 대대적인 리팩토링을 거쳤습니다. Whisper AI가 추출한 자막 데이터는 단순히 텍스트를 나열하는 수준이라, 실제 영상에 적용했을 때 가독성이 떨어지는 경우가 많습니다. 이를 해결하기 위해 애플의 자연어 처리 프레임워크를 기반으로 후처리 알고리즘을 구축했습니다.

자막 모드는 총 세 가지를 지원합니다.
첫째, 스탠다드 모드는 Whisper AI가 생성한 원본 데이터를 유지합니다.
둘째, 워드 모드는 자막을 단어 단위로 쪼개어 생성합니다. 의미 단위로 짧게 자막을 구성해야 하는 작업에 적합합니다.
셋째, 이번 버전에서 전면 재설계된 스마트 모드입니다. 단순히 글자 수를 맞추는 것이 아니라 문맥을 분석하여 자연스러운 지점에서 자막이 끊기도록 점수를 매겨 계산합니다.

 

스마트 모드에서는 상세 설정이 가능합니다. 한 블록에 담을 최대 글자 수와 화면에 머무르는 최대 시간을 조절할 수 있습니다. 또한 분할 유연성 옵션을 통해 조사나 마침표 등 문맥상 적절한 위치에서 분절되도록 유도할 수 있으며, 의미 없는 짧은 단어가 혼자 남는 현상을 방지하는 기능도 포함되어 있습니다.

파이널 컷 프로와의 워크플로우를 강화한 점도 이번 업데이트의 중요한 포인트입니다. 파이널 컷 프로에서 내보낸 FCPXMLD 파일을 읽어 자동으로 SRT 파일 및 TXT, FCPXML 파일을 생성해 줍니다. 특히 여러 자막 트랙이 겹쳐 있는 상황에서도 최하단의 첫 번째 트랙을 감지하여 변환하며, 파일 로드 시 프레임 레이트를 자동으로 분석하여 사용자에게 안내합니다. 이는 자막 프로젝트를 공유하거나 기존 자막을 일괄 변환할 때 작업 시간을 획기적으로 단축해 줍니다.

성능 면에서는 최신 위스퍼 에이아이 1.8.4 엔진을 탑재하여 정확도를 높였습니다. 또한 초기 화면의 복잡한 입력 설정을 간소화하고, 한국어와 영어 등 주요 사용 언어를 최상단에 배치하여 접근성을 높였습니다. 기존에 노출되어 있던 영어 번역 옵션은 설정 메뉴로 통합하여 UI를 정돈했습니다.

주의할 점은 이번 버전부터 내부 구조가 변경됨에 따라 기존 모델 저장소 설정이 초기화될 수 있다는 점입니다. small 모델부터 Large V2, Large V3까지 본인의 시스템 환경에 맞는 모델을 다시 내려받아 위치를 지정해 주시기 바랍니다. Large 모델의 경우 양자화 모델들을 함께 포함하여 사용자의 사양에 맞춰 선택할 수 있도록 준비했습니다.

 

https://www.youtube.com/@SangHyoukJin/posts 방문하시면 최신버전의 프로그램과 모델 링크를 확인하실 수 있습니다.

본 프로그램은 사용자의 데이터를 외부 서버로 전송하지 않는 로컬 처리 방식을 고수하며 무료로 배포됩니다. 

 

개발 과정에서 최대한 검증을 거쳤으나 예기치 못한 버그가 발생할 수 있습니다.
사용 중 불편한 점이나 오류를 발견하시면 이메일로 제보해 주세요. 

 

감사합니다.