martes. 04.11.2025

O galego dá un salto cualitativo no mundo dixital coa "fala espontánea" de Common Voice

A plataforma Common Voice incorpora "Spontaneous Speech", unha nova funcionalidade que permitirá gravar a diversidade dialectal do galego e a súa riqueza oral, facilitando así a creación de tecnoloxías de recoñecemento da fala máis inclusivas. Esta iniciativa, na que colabora o Proxecto Nós, busca garantir a presenza do galego no ecosistema dixital do futuro.

 A diversidade do galego e a súa riqueza oral están máis preto que nunca de ter unha presenza destacada no ecosistema dixital do futuro. A plataforma colaborativa Common Voice, impulsada por Mozilla, acaba de incorporar unha nova e revolucionaria funcionalidade, Spontaneous Speech (‘fala espontánea’), que permitirá documentar e protexer a variedade dialectal da nosa lingua.

Ata o de agora, as achegas a Common Voice, cuxa misión é construír recursos abertos para o recoñecemento da fala, consistían principalmente en gravacións de lectura en voz alta de textos de dominio público. Con Spontaneous Speech, que se atopa en fase de probas, ábrese a porta á recollida dunha fala máis natural, diversa e representativa do uso real da lingua no día a día. Esta nova ferramenta permitirá rexistrar doazóns con acentos diversos, variantes léxicas e morfolóxicas, cambios de código ou fenómenos propios da oralidade que adoitan desaparecer na fala lida.


 

Unha fala máis próxima e inclusiva

 

A través de preguntas sinxelas, as persoas voluntarias poderán gravar respostas breves e espontáneas que recollerán a súa variedade dialectal. Esta iniciativa de Common Voice reforza o seu compromiso coa diversidade lingüística e a accesibilidade dixital, facilitando a participación de falantes de distintas idades, rexións ou niveis de alfabetización dixital. Ademais, recoñécese e valorízase a fala real, moito máis rica en matices e representativa do uso lingüístico actual que os textos escritos tradicionais.


 

Como funciona Spontaneous Speech

 

Dentro da plataforma Common Voice, as persoas colaboradoras poden, na sección "Fale", escoller a opción "Responda preguntas" para gravar as súas respostas. Tamén é posible participar transcribindo as respostas doutras usuarias e validando esas transcricións, o que contribúe á creación dun corpus de fala de calidade.

O Instituto da Lingua Galega (ILG), a través do Proxecto Nós, colaborou na redacción do primeiro conxunto de preguntas dispoñibles para a recollida de fala espontánea en galego. Calquera persoa pode propoñer novas preguntas a través da plataforma, garantindo así que os contidos evolucionen de forma aberta e participativa.

As achegas recollidas mediante Spontaneous Speech xerarán un conxunto de datos independente, que se publicará baixo licenza CC0, seguindo a filosofía de datos abertos de Common Voice. Isto permitirá que investigadoras e lingüistas accedan de forma libre e gratuíta a datos de fala espontánea en galego, fomentando o desenvolvemento de tecnoloxías inclusivas e plurais, adaptadas ás necesidades reais das persoas usuarias, e a ciencia aberta ou cidadá.


 

AgasallaNós: A túa voz, un tesouro para o galego dixital

 

Baixo o lema AgasallaNós, o Proxecto Nós busca facilitar a participación na recollida de voz en galego dentro da plataforma Common Voice. A páxina web doagalego.nos.gal é unha vía sinxela e accesible para contribuír ao proxecto. A través desta web, calquera persoa pode doar a súa voz, tanto lendo textos en voz alta como respondendo ás novas preguntas de fala espontánea. O obxectivo é recompilar gravacións que representen a diversidade do galego, contribuíndo así ao desenvolvemento de tecnoloxías de recoñecemento da fala que identifiquen toda a riqueza da nosa lingua. Toda a información está dispoñible en doagalego.nos.gal.


 

Proxecto Nós: O galego á vangarda da Intelixencia Artificial

 

O Proxecto Nós é unha iniciativa da Xunta de Galicia, executada pola Universidade de Santiago de Compostela (USC) a través do Instituto da Lingua Galega (ILG) e o Centro Singular de Investigación en Tecnoloxías Intelixentes (CiTIUS). O seu obxectivo principal é situar o galego entre as linguas máis desenvolvidas no ámbito da tecnoloxía da lingua e a Intelixencia Artificial, xerando os recursos necesarios para facilitar o desenvolvemento de servizos e produtos baseados nesta tecnoloxía, como asistentes de voz, tradutores automáticos ou axentes conversacionais.

O proxecto tamén promove a presenza dixital do galego, facilitando a creación dunha ampla variedade de ferramentas e recursos de alta calidade e uso libre. Algunhas destas ferramentas, como un tradutor neuronal multilingüe, un recoñecedor de voz que converte fala en texto escrito, e unha aplicación de síntese de voz que le en galego, xa están dispoñibles na web do proxecto. Isto non só garante os dereitos lingüísticos da comunidade galegofalante no mundo dixital, senón que tamén contribúe á modernización e dixitalización do ecosistema de empresas galegas e á creación de valor con novos produtos que empreguen o galego.

O Proxecto Nós está actualmente financiado polo Ministerio para la Transformación Digital y de la Función Pública con fondos da Unión Europea-NextGenerationEU, no marco do proxecto ILENIA.

O galego dá un salto cualitativo no mundo dixital coa "fala espontánea" de Common Voice
Comentarios