Whisper Auto Captions

Whisper Auto Captions v1.6 안내

BrewCoder 2025. 4. 13. 21:59

안녕하세요. Whisper Auto Captions v1.6 버전이 출시되어 안내를 드립니다.

 

1. 아이콘 변경
- 프로그램 아이콘이 ChatGPT 제시안을 받아들여 변경되었습니다.

- ChatGPT에게 프로그램 기능 및 특징을 설명하고 부탁했더니 만들어줬어요.(저는 무료사용자)


2. Whisper AI 1.7.5 버전 탑재 (2가지 버전 선택가능)

- 2025년 4월에 Whisper AI가 업데이트되었어요.

- 이전버전에 비하면 음성인식 파일이 WAV 만 되었는데 몇가지 파일을 지원하면서 ffmpeg 모듈을 탑재했네요.

- 여러 다양한 플랫폼을 지원하면서 프로그램 자체가 많이 무거워졌어요.

- 기본으로 CPU만 사용하던 모델을 맥 환경에서는 METAL 라이브러리 및 CoreML 등을 지원하는데요.

- 근데 버전업이 되면서 METAL 호환성 특히 INTEL 맥에서 많이 떨어져요

* 인텔 맥에서 METAL3 라이브러리를 사용하시는 분들은
   설정에서 Use CPU 옵션을 켜야 Whisper AI 1.7.5를 사용할 수 있어요.

- 여러가지 이유가 있어 기존의 안정화 버전인  v1.7.2 와 최신 버전인 v1.7.5 를 동시에 제공해요.

- 취향에 따라 선택하여 사용하시면 됩니다.

 

3.Split Length 내부 옵션값 조정 및 옵션 다양화

- Whisper AI가 음성 인식하고 자동으로 자막을 생성할 때 문장이 길게 출력되는 경우가 많습니다.

- 스몰 < 미디엄 < 라지  순으로 문장이 길게 출력이 되요

- 이 옵션들을 조절하여 조금 더 작업이 수월해지도록 방법을 제공하는데요

- Whisper AI가 다국어환경이라 토큰 및 콘텍스트 라는 방법을 가지고 자막을 조절해요.
이러한 이유로 한국어 문맥에 맞게 딱딱 잘 잘라서 출력해 주지는 못해요.  이용에 참고하여 주세요

- 여기 옵션값을 설명드리면 아래와 같습니다.

0 Whisper AI가 생성하는 자동 자막 그대로 보여줍니다. (보통은 길게 출력됩니다.)
한 단어별로 구분하여 자막을 만들어줍니다.
이 옵션은 음성 용량이 크면 나중에 파이널 컷에서 많이 부담스러워 해요.
10-20 짧은 문장 유지, 자막 또는 대화체 분할에 적합
22-30 간단한 뉴스, 팟캐스트에서 적절
32-40 일반적인 뉴스 기사, 인터뷰, 강연
42-50  문맥이 더 길게 이어지는 경우 추천
52-60  연속된 대화, 긴 강연 또는 문서 형태의 내용

 

4. 후처리 모듈 업그레이드

- Whisper AI가 음성인식을 잘 인식하지 못할때 몇가지 특징들이 있어요.

- 이를 좀 기억해 두었다가 자동자막이 끝나면 전체 자막 내용을 가지고 한번 쭈~욱 파악하고 보정을 좀 해요.

- 이번엔 Whisper AI 1.7.2 버전도 탑재되면서 중간에 잘못된 인코딩 문자를 출력하는 경우도 발견해서 이를 수정도 했답니다.

 

5. 외부 플러그인 정보를 최대한 활용하여 자동 자막 생성에 반영

- 최근 버전에서는 외부 자막 특히 반응형 자막을 선택하면 이 자막에 맞추어 자동자막을 만들었는데요...

- 초기에 몇가지 자막 정보만 가져와서 자막을 만들었는데요...
- 이번에는 서체 윤곽 드롭그림자 정보도 가져와서 자동자막 만드는데 정보를 표기해요.

* 애플 모션과 파이널 컷 사이에 XML로 정보를 표현하는 방식이 다르고 변환 규칙이 공개되지 않아서 하나하나씩 유추하는 상황이라 각 항목에서 크기(scale), 흐림(Blur) 정보를 아직은 가져오지 못합니다.
* 동일한 이유로 자막 효과 중에 발광(Glow) 효과도 마찬가지로 자막 생성에 반영하지 않습니다.

- 개인적으로 반응형 자막을 쓰시는 분들에게 좋은 선택이기를 바랍니다.

 

6.Whisper AI 생성 자막 내 특정 기호 및 문자 자동 제거 기능 추가

- 각 모델마다 자동자막에 포함하는 기호들이 있을 수 있거나 없을 수 있는데요.

- 특히 미디엄 모델은 끝에 마침표를 꼭 붙여서 만들어내구요. 대화형인 경우에는 줄표(-)로 문장을 만들어내는 경우가 많아요.

- 자동자막 SRT 파일이 만들어지면 파이널 컷 프로 자막 파일로 변경하는데요. 이러한 기호들은 파컷 안에서 작업하기가 참 귀찮아요. 

- 이걸 미리 사전에 삭제해 버리는 기능이예요.

- 설정에서 Remove Symbols 선택하고 쉼표(,) 마침표(.) 줄표(-) 따옴표(") 가 기본값으로 되어 있어요.

- 여기에 추가할 경우에는 기호나 단어를 넣어 빈칸으로 구분하여 주세요. 그러면 자막 내용 중에 해당 내용이 있으면 싸~악 없애버려요.

 

Whisper Auto Captions 최신 버전 다운로드는 아래 경로를 이용하여 주세요.

 

https://www.youtube.com/@SangHyoukJin/community

 

감사합니다.