La veu com a recurs
La incorporació de la veu en diferents programes pot tenir un efecte motivador, novedós i engrescador, sense perdre de vista l'efecte compensador. Per exemple, un alumne que presenta un trastorn de la parla, però que disposa d'una síntesi de veu, posseeix una eina molt valuosa no només per a ell, sinó també per a tots els companys.
Voldríem fer una aproximació als elements destacats de la veu i les oportunitats que poden brindar a les persones amb discapacitat motriu. La veu i/o els òrgans bucofonatoris poden utilitzar-se com a instrument per a l'accessibilitat en el cas de persones en situació de discapacitat generalitzada. Així, a través de programari específic es poden utilitzar programes d'escriptura, control de l'entorn, etc. amb el buf o amb un so. Podeu trobar diferent programari d'aquest tipus aProjecte Fressa. Jordi Lagares.
La lectura amb veu sintetitzada de documents o llibres, o del contingut de qualsevol pàgina web, correu electrònic, etc. permet, independentment de la presència o no de discapacitat, un millor seguiment dels continguts.
Utilitzant la parla, el so, es poden aconseguir un gran nombre de possibles aplicacions. La tecnologia pot oferir un nombre molt gran de possibilitats, l'economia pot retallar-les…, la imaginació equilibrar necessitats i costos.
La veu enregistrada
Els ordinadors i altres dispositius d'accés disposen de diferents models de targeta de so que poden enregistrar i reproduir sons fent les funcions d'una gravadora. Per fer servir aquesta utilitat cal disposar d’una tarja de so i d'un micròfon. El so digitalitzat es guarda en fitxers en format WAV, MP3 o altres. Els sistemes operatius incorporen programes d'enregistrament de so. En el cas de Windows es troba a Inici | Programes | Accessoris | Entreteniment. Permet enregistrar, emmagatzemar i reproduir sons en fitxers WAV.
Existeixen programes semblants que poden incorporar funcions més avançades per controlar la qualitat dels enregistraments del so, per exemple l’Audacity: http://audacity.sourceforge.net/.
Quan es fa servir veu enregistrada és necessari preparar un fitxer de so per a cada paraula, frase o tall de veu que es vulgui utilitzar. Com més missatges de veu, més fitxers i espai necessitarem. Es pot millorar la qualitat de la veu en funció dels locutors i dels processos d’enregistrament.
Síntesi de veu
Els sistemes de síntesi de veu són programes d'ordinador que converteixen el codi escrit en un missatge oral. Per tant, no cal enregistrar la veu. El programa reconeix l'escrit i l'emet en so. L’ordinador pot llegir qualsevol text o paraula que tingui en pantalla o a la memòria, fins i tot aquelles que no existeixen en el diccionari.
El sistemes operatius basats en codi lliure també disposen de motors de veu de bona qualitat que es poden fer servir de forma complementària en els processadors de textos, correus, etc. A tall d'exemple, podem citar el Festcat. És un projecte que neix amb la intenció de produir sintetitzadors de veu en català d'alta qualitat i d'accés lliure. En particular, es volen desenvolupar veus en català pel sistema operatiu Linux i per la distribució Linkat, tot i que els desenvolupaments no estan limitats a cap distribució ni entorn. Les mostres no funcionaran bé si no tenim instal·lada la Linkat.
Actualment es disposa de tres síntesis de veu en català, UPCTV, Verbio i Loquendo. N'existeixen moltes més en castellà i, no diguem, en d'altres idiomes.
- Síntesi de veu UPCTV
L’UPCTV és un sistema de veu en català i castellà, desenvolupat pel Grup de Tractament de la Parla de la UPC. Funciona a partir de Windows 95 o superior, però no és compatible amb altres formats de veu SAPI.
Incorpora dos idiomes, català i castellà, i dos locutors, un de masculí i un de femení, que es poden alternar per comandaments interns. També hi ha comandaments per controlar la velocitat del locutor, seleccionar la llengua, així com els controls de reproducció, pausa i aturada. L’Upctv llegeix nombres i dates, i disposa de diccionaris (DIC_*.txt) i abreviatures (fitxers ABR_*.txt), que es troben en el directori DAT de l'aplicació i que es poden editar i personalitzar per resoldre les expressions més complexes.
- Síntesi de veu Verbio
És una veu TTS compatible amb SAPI4, que disposa de locutors en català, castellà i es poden ampliar amb locutors en euskera, gallec i altres llengües. Verbio s’instal·la conjuntament amb la versió 4 de KidPix i el seus locutors en català són en Pau i la Meritxell.
Dins del CD del KidPix v.4 podem trobar la carpeta Third Party que conté els instal·ladors de les aplicacions que acompanyen el programa (QuickTime, Adobe Reader 5.1, DirectX 9.0 i VerbioSAPI4). Els fitxers necessaris per a la instal·lació de la síntesi de veu VerbioSAPI4 són: spchapi.exe, msttsL.exe i VerbioSAPI4.exe. A més, el fitxer Llegiu-me.txt que hi ha al CD conté instruccions específiques sobre els requeriments tècnics del programa i, també, per solucionar els problemes que puguin sorgir en el funcionament de la síntesi de veu.
També es pot utilitzar des d’altres aplicacions i canviar de locutors amb els codis CD010, locutor masculí en català; FE010, locutora femenina en català; EB010, locutor masculí en castellà, i AO010, locutora femenina en castellà.
En tractar-se d’una veu compatible SAPI4, es pot utilitzar en qualsevol programa que utilitzi una síntesi de veu.
- Síntesi de veu Loquendo
És una síntesi de veu en moltes llengües que pot funcionar amb diferents perifèrics d'accés, ordinadors, telèfons mòbils, PDA, etc. És compatible amb el motor SAPI5 i disposa de locutors en català on gairebé no es distingeix la seva síntesi. Diferents empreses i grups de treball l’estan introduint en el sistema educatiu.
Conversors de text a veu
Els conversors de text a veu poden ser molt útils per a tothom: professionals, docents d'idiomes o, encara més, per als autoaprenents. Les llengües que són susceptibles de la conversió de text a veu són cada vegada més nombroses. Un exemple seria:
- l'Acapela.
Si es vol, en un dels recursos anteriorment indicats, Loquendo, es pot sentir la varietat occidental valenciana del català. Sovint es pot triar entre sentir un personatge amb veu masculina o femenina que, lògicament, s'haurà d'adequar als interessos de la persona que presenta l'afectació de la parla.
Suports a la lectura
- Lectura en diferents mitjans
La lectura de textos amb veu es pot fer servir en els editors de textos, els programes de correu, les pàgines web, els documents en pdf i altres aplicacions que permetin seleccionar i copiar text. Alguns d'aquests poden ser editors de textos específics per a persones amb alguna discapacitat.
Hi ha qui pensa que la conversió en veu del text escrit pot fatigar els alumnes amb discapacitat motriu amb altres trastorns o dificultats associades. La nostra experiència ens diu que utilitzar el suport auditiu, els permetrà millorar les seves habilitats lectores tot reduint el cansament.
També són d'utilitat per al conjunt de persones amb baixa visió o cegues, com a població susceptible de fer servir eines amb suport de veu de fàcil accessibilitat, donat que també podran disposar de major control sobre la informació escrita.
Uns altres grups d'alumnes que poden beneficiar-se d'aquestes utilitats són els alumnes amb baixa capacitat lectora, els analfabets, els nouvinguts i/o les persones amb discapacitat intel·lectual.
La forma verbal oral facilita la comprensió del que es llegeix a la vegada que pot permetre moltes altres estratègies metodològiques. Per als alumnes amb discapacitat motriu pot suposar, a més a més, un estalvi d'energia i de temps, sobretot per als que poden tenir moviments o tremolors associats i no poden passar els fulls.
Un dels aplicatius més conegut és la Lectura de textos, que permet accedir a la informació escrita utilitzant la síntesi de veu, UPCTV o SAPI per llegir qualsevol finestra de text.
Control per veu
Són dispositius que faciliten el control de l'entorn tecnològic per mitjà de la veu o el so. Alguns dels sistemes de reconeixement de veu permeten realitzar els moviments del punter mitjançant sons vocàlics o les ordres esquerra, puja, clic, etc. Aquest programari de reconeixement accionat per un perifèric o micròfon està pensat per a persones que la millor acció de control la poden establir amb el cap i que poden accionar el dispositiu amb el so o el buf.
Un parell de programes que permeten establir aquesta fórmula de control són:
Per mirar d'afavorir el control per veu cal disposar d'un reconeixedor del so i/o de la veu humana que facili amb el mínim de temps d'entrenament el màxim de processos a controlar.
Fixeu-vos en aquesta adreça:
Mostra de control del ratoli per sons. Aquí trobareu un document on hi ha un vídeo de suport incrustat al final de la pàgina en què es demostra la possibilitat de control del ratolí amb els sons.
Per finalitzar, si disposeu de Windows Vista, aquest sistema disposa d'un reconeixedor de veu en catellà que permet controlar, dictar, emmagatzemar, establir el màxim nombre d'activitats sota el nostre control per veu. Enviar, dictar i obrir missatges són, també, algunes de les utilitats que permet el programari al qual us fem referència, així com moure's dins de la navegació web.