Skip to content

gweltou/vosk-br

Repository files navigation

pypi version License: MIT

Anaouder mouezh e brezhoneg gant Vosk

Version française

Diorroet eo ar raktres-se a youl vat. Gallout a rit souten ar raktres gant ur roadenn : Liberapay

Gallout a reer ivez implij ar meziant dre ur c'hetal Web, savet gant Philippe Argouarch.

Petra eo ?

Un anaouder mouezh emgefre, diazezet war Vosk.
Gantañ e c'heller adskrivañ komzoù e brezhoneg (Son -> Skrid) dre ur mikro e amzer real pe diouzh restroù son.

Un nebeut perzhioù dedennus :

  • Skañv. Pouezh ar model a zo dindan 100 Mo ha treiñ a ra war ur bern mekanikoù : urzhiataerioù hep GPU, RaspberryPi, hezoug Android...
  • Prim. Gallout a reer adskrivañ ar son e amzer real, memes gant un urzhiataer kozh, pe primoc'h c'hoazh gant dafar nevesoc'h.
  • Lec'hel. Ezhomm ebet eus an Internet. Ho mouezh hag ho data a chomo war ho penveg, ha tretet e vint gant ho penveg nemetken. Kudenn surentez ebet liammet d'an treuzkas dre rouedad ha gwelloc'h a-fed ekologel.
  • Digoust ha dieub. Gellout a reoc'h azasaat ar meziant d'hoc'h ezhommoù pe enframmañ anezhañ e meziantoù all.

Gwellaet e vo efedusted an anaouder tamm-ha-tamm, gant ma vo kavet roadennoù mouezh adskrivet.
Ul lisañs dieub (doare Creative Commons) a aotrefe eskemm ar roadennoù-se en un doare aes.

Deuit e darempred ganin m'ho peus c'hoant kemer perzh !

Staliañ

Goude bezañ bet staliet Python3 e c'heller staliañ an anaouder dre an terminal :

pip install anaouder

Ur wech staliet ha pa vo kinniget modeloù efedusoc'h, e c'hellit nevesaat ar meziant gant :

pip install --upgrade anaouder

Adskrivañ ur restr son

Gant an urzh adskrivan en un terminal, e vo adskrivet ar pezh e vez komprenet gant an anaouder diouzh ur restr son. Ar wech kentañ ma vo peurgaset an urzh-se e vo ret deoc'h gortoz ur pennadig ma vefe pellkarget ha staliet ar modul static_ffmpeg (evit amdreiñ restroù son ha video).

adskrivan RESTR_SON_PE_VIDEO

Dre ziouer, adskrivet e vo pep tra e diabarzh an terminal. Gallout a rit ivez implij an opsion -o evit resisaat anv ur restr, e lec'h ma vo skrivet an titouroù. Tu zo implij an option-se gant an holl urzhioù eus ar meziant.

adskrivan RESTR_SON_PE_VIDEO -o DISOC'H.txt

Evit kaout listennad an opsionoù, implijit an opsioñ -h.

Adskrivañ istitloù evit ur video

Gallout a rit adskrivañ istitloù diouzh teuliadoù son pe video, e stumm srt (Subrip).

istitlan RESTR_SON_PE_VIDEO -o istitloù.srt

Implijout gant ur mikro

Dre an an urzh mikro e c'heller implij an anaouder gant ho vouezh e amzer real.

Ma n'ez eus skrid ebet o tont, klaskit niverenn an etrefas son gant :

mikro -l

Ha gant an niverenn-se :

mikro -d NIVERENN_ETREFAS

Linennañ ur teul skrid gant un teul son

M'ho peus un teul skrid adskrivet dre dorn (e stumm .txt) e c'heller linennañ ar skrid gant ar son, evit krouiñ ur restr istitloù (e stumm srt).

linennan RESTR_SON_PE_VIDEO RESTR_SKRID

Implijout gant meziantoù all

N'eo ket aliet, dre ma vez kollet un nebeut perzhioù e-keñver ar pezh vez graet gant ar modul anaouder : adlakaat ar varennigoù-stag hag amdreiñ an niverennoù da skouer.

Ar model noazh a c'hellit kavout en dosser anaouder/models pe dre al liamm releases.

Audapolis

M'ho peus c'hoant implijout ar model gant ur etrefas grafikel e c'hellit mont da sellet ar raktres Audapolis.

Kdenlive

Gant ar meziant frammañ videoioù Kdenlive e c'heller adskrivañ istitloù en un doare emgefre ivez.
Ar mod-implij a c'heller kavout amañ.

Trugarez

Ar meziant-se zo bet diorroet o kemer harp war meziantoù dieub all : Kaldi, Vosk ha difazier Hunspell an Drouizig (evit naetaat an testennoù a-raok ar pleustr).
Lakaat da bleustriñ ar model a zo bet posubl a-drugarez d'an danvez prizius, krouet ha rannet gant ur bern tud all : ar raktres Mozilla Common Voice, enrolladennoù Dizale, Brezhoweb, RKB, Kaouen.net, Ya!, Becedia, abadennoù France3 ha Dastum.
Trugarez da Elen Cariou, Jean-Mari Ollivier, Karen Treguier, Mélanie Jouitteau ha Pêr Morvan evit o sikour hag o souten.

nozvezh_digousk_st.mp4