Notizie: Prova Thimble, l'editor HTML di nuova generazione di Mozilla.

Autore Topic: Common Voice per Linux Day 2019  (Letto 384 volte)

0 Utenti e 1 Visitatore stanno visualizzando questo topic.

Offline Mte90

  • Moderator
  • *****
  • Post: 1129
    • Mte90.Net
Common Voice per Linux Day 2019
« il: 02 Ottobre 2019 11:48:30 »
Quest'anno avremo 5 città che parleranno di Common Voice: Brescia, Benevento, Roma, Torino (forse anche Catania).
Con 6 città con tematiche mozilla in totale :-D

Ho voluto scrivere questo thread giusto per aggiornare riguardo common voice e cosa faremo al Linux Day.
Sotto poi spiego i vari punti.


Stato Common Voice

Qualche settimana fa ho fatto una riunione con quello che fa da community manager in Mozilla per il progetto. In poche parole nei prossimi mesi ci saranno delle campagne sul progetto e volevano sapere se avevamo idee per aumentare il numero di partecipanti e come far evolvere il progetto per avere più ore.
Mi hanno detto che possono aggiungere degli snippet nella about:home in italiano ad hoc ma per me non sono sufficienti.
Siamo rimasti che facevo un documento in inglese di dee e cose che possiamo provare come comunità nelle prossime settimane https://docs.google.com/document/d/1mSm0ZOzAGkWtRqV8fAkFtKhag0J1swa1ZdmVo5kDci8/edit# Siete tutti invitati a dare una letta e dare i vostri commenti, se avete problemi con l'inglese fatemi sapere.
Qualche settimana fa sono andato a KDE Akademy a Milano e ho conosciuto il capo redattore della rivista GNU/Linux (che trovate in edicola). Mi ha fatto una video intervista caricata su Facebook https://www.facebook.com/GNULinuxMagazineItalia/videos/1472998396158222/ Il prossimo numero (non quello attualmente in edicola) includerà nel DVD la intervista. Io ho notato che dopo il caricamento abbiamo avuto una impennata di registrazioni, ma anche pubblicare su reddit.com/r/italyinformatica lo stato del progetto ha portato più traffico.

Wikipedia scraper

Nasce da una necessità per tutte le altre lingue, noi siamo tra le 30 disponibili ma in coda ce ne sono altre 75!
Non tutti hanno una comunità che possa raccogliere le frasi e al tempo stesso sufficienti per le necessità del software di apprendimento (deepspeech) quindi è stato realizzato uno strumento che prenda frasi a caso da Wikipedia con tutta una serie di regole e noi abbiamo aggiunto il supporto all'italiano.

Il modello

Deepspeech rilascia solamente quello di lingua inglese ed ogni comunità deve realizzare il suo, con l'aiuto di quello francese (ed uno dei dev di deepspeech) abbiamo i nostri script per generarlo (già testato) ma siamo alla ricerca di persone che possano mettere il loro computer con scheda Nvidia e conoscenze docker a disposizione per questa generazione.
Il modello serve al software per poter riconoscere l'italiano e sfrutta i dati di common voice, più dati ovvero registrazioni abbiamo più sarà bravo ad indovinare.
Spero di averlo prima del Linux Day così potremo fare la demo altrimenti si userà webspeech (punto più giù).

Slide

Sono le slide aggiornate e chiunque può utilizzarle, sono in italiano e spiegano common voice, quello che facciamo e deepspeech.

Firefox 71 in beta

Al momento questa api non é ancora disponibile in nightly (il dev ci sta lavorando). Di cosa si tratta? in poche parole usa un server esterno (al momento di google) che è sotto proxy così le richieste vengono anonimizzate (si non sanno chi siete, quale pagina state visitando ecc se non solo l'audio inviato) che converte il vostro parlare in testo.
Un esempio lo potete provare su Google Translate tramite Chrome che aggiunge un pulsante microfono che converte quello che dite in testo che poi traduce. In Firefox come questa api sarà aggiunta il pulsante sarà disponibile, se volete una cosa similare in Firefox potete installare https://addons.mozilla.org/it/firefox/addon/voice-fill/ che aggira il problema dell'api ma aggiunge il microfono di ricerca in Google.
Quando deepspeech sarà funzionante con dei dati sufficienti per le varie lingue verrà sostituito a quello di Google. Se volete provare webspeech, cercate su internet "webspeech demo" e troverete diversi esempi.

Riunione ottobre

Avremo la riunione venerdì dove potrò dare altri aggiornamenti e rispondere a qualunque domanda (anche qui sul forum). Venite su Telegram per maggiori informazioni, cercate @mozitabot.
Se avete domande sul perché del progetto vi consiglio di vedere le slide :-)

Siamo anche sul forum Mozilla internazionale dove abbiamo la sezione in italiano per common voice https://discourse.mozilla.org/t/common-voice-per-linux-day-2019-e-stato/46062

Grazie a Saverio, Damiano, Simone, Giovanni e Alessandro per l'aiuto in tutte queste cose!
« Ultima modifica: 14 Ottobre 2019 12:53:26 da miki64 »

Offline Mte90

  • Moderator
  • *****
  • Post: 1129
    • Mte90.Net
Re:Common Voice per Linux Day 2019
« Risposta #1 il: 14 Ottobre 2019 12:22:34 »
Gli ultimi aggiornamenti:

* Abbiamo un modello per la lingua italiana considerato beta, https://github.com/mone27/DeepSpeech-Italian-Model/releases/tag/0.1 Allo stato attuale non riconosce tutto, causa dataset piccoli ma stiamo cercando altre fonti CC0 e nel frattempo sistemando gli script di generazione prima di pubblicarlo ufficialmente sul nostro repo
* Ora che abbiamo il modello vogliamo fare una demo, stile scarica e via. DeepSpeech stesso ha delle interfacce incluse ma potremmo pensare anche a cose più elaborate tipo https://blog.rasa.com/how-to-build-a-voice-assistant-with-open-source-rasa-and-mozilla-tools/
* Per lo scraper di Wikipedia la lingua italiana oramai è supportata ufficialmente
« Ultima modifica: 14 Ottobre 2019 12:54:10 da miki64 »

0 Utenti e 1 Visitatore stanno visualizzando questo topic.