Autore Topic: Common voice nel 2020  (Letto 262 volte)

0 Utenti e 1 Visitatore stanno visualizzando questo topic.

Offline Mte90

  • Moderator
  • *****
  • Post: 1140
    • Mte90.Net
Common voice nel 2020
« il: 13 Gennaio 2020 11:04:00 »
Per chi vuole un po' di contesto c'è il thread dedicato al 2019 con un mucchio di link: https://forum.mozillaitalia.org/index.php?topic=73218.0

Sono passate oltre 3 settimane ma tra Natale e poche novità ho preferito aspettare.

* Abbiamo aperto un thread con l'elenco dei progetti in cui si cercano sviluppatori che vogliono contribuire, tra progetti Mozilla e Mozilla Italia https://forum.mozillaitalia.org/index.php?topic=73589.0
* 125 ore totali con 90 ore revisionate
* Pubblicato un articolo in inglese sulla evoluzione della comunità dal rilascio del modello per DS https://discourse.mozilla.org/t/how-the-italian-deepspeech-model-helped-our-mozilla-italia-community/50985
* Stiamo ancora lavorando per gli script per fare il nostro corpus (spiegato nel thread del 2019) ma ci serve aiuto perché c'è ancora molto da fare https://github.com/MozillaItalia/DeepSpeech-Italian-Model/issues/36
* Per fine gennaio è previsto il rilascio del nuovo dataset in CV per tutte le lingue
* Lo strumento per fare la blacklist per lo scraper di Wikipedia ha ricevuto due mie patch per correggere alcuni problemi che abbiamo riscontrato https://github.com/dabinat/cvtools/
* Avviata discussione sul forum internazionale senza successo per raccogliere informazioni su come gestire dataset universitari con le licenze open https://discourse.mozilla.org/t/how-to-deal-with-academic-and-public-domain-license-for-model-usage/49847
* Il nostro Saverio da tempo lavora ad un app Android per common voice https://github.com/Sav22999/common-voice-android
* Abbiamo aperto alcuni ticketp per lo scraper https://github.com/Common-Voice/common-voice-wiki-scraper/issues?q=is%3Aissue+sort%3Aupdated-desc+author%3AMte90+is%3Aclosed ma il progetto ha bisogno di sviluppatori
* Dobbiamo rivedere il nostro piano https://docs.google.com/document/d/1mSm0ZOzAGkWtRqV8fAkFtKhag0J1swa1ZdmVo5kDci8/edit# , I problemi più sentiti sono
  * Mancanza di poter contattare con chi contribuisce per lingua
  * Lista delle frasi riportate, al momento sono solo raccolte

Ricordo che ci trovate su Telegram con il nostro bot @mozitabot
« Ultima modifica: 13 Gennaio 2020 14:00:26 da miki64 »

0 Utenti e 1 Visitatore stanno visualizzando questo topic.