Releases · m-bain/whisperX · GitHub

13 May 11:19

m-bain

3.1.1 Latest

Latest

translate functionality added
fix word timestamp bug (words no longer have consecutive timestamps)

Assets 2

07 May 19:34

m-bain

v3.1.0

70x real time transcription, <8GB gpu memory requirement ⚡️⚡️
each transcript segment is a sentence (using nltk.sent_tokenize)
diarization now assigned per sentence (and outputted to srt)
clean up on alignment logic

Assets 2

04 May 19:53

m-bain

v3.0.2 Pre-release

Pre-release

torch2.0, python3.10

Assets 2

01 May 10:52

m-bain

v3.0.1 Pre-release

Pre-release

fix pickling error (set num_workers=0) to perform dataloading iwth main process
add basic diarization
pad language detection if less than 30s

Assets 2

28 Apr 15:48

m-bain

v3.0.0 Pre-release

Pre-release

batched inference with faster-whisper backend

Assets 2

28 Apr 15:47

m-bain

v2.0.1

allow custom model_dir for torchaudio models

Assets 2

26 Feb 21:05

m-bain

alpha

Merge pull request #96 from smly/fix-batch-processing

FIX: Assertion error in batch processing

Assets 2