L'objectiu d'aquesta pràctica és conèixer les característiques del so digital i familiaritzar-se amb el funcionament del programa "Audacity".

El so digital

El so és la sensació per la qual percebem els canvis de pressió i densitat de l'aire que es transmeten en forma de vibracions. Tal com hem vist, els aparells digitals poden treballar únicament amb seqüències de xifres numèriques. Si volem treballar el so amb l'ordinador ens caldrà obtenir una representació numèrica d'aquestes vibracions. Primer cal convertir les vibracions de l'aire en oscil·lacions d'un corrent elèctric. D'això se n'encarreguen els micròfons i altres aparells similars. La imatge que veiem en un oscil·loscopi connectat a un micròfon és una analogia dels canvis que el so provoca en la pressió de l'aire al llarg del temps. També rep el nom de representació analògica.

Un micròfon connectat a un oscil·loscopi que mostra una representació analògica del so d'un diapasó

En el procés de digitalització hi intervenen tres factors:

  • La freqüència amb què es mesura la intensitat del senyal elèctric, que s'indica en Hz (Hertz: nombre de lectures per segon). No s'ha de confondre aquesta magnitud amb la freqüència del so, on els Hz indiquen el nombre de vibracions per segon.

Els valors emprats més usualment en els enregistraments digitals són:

  • 11.025 Hz Per enregistraments de veu
  • 22.050 Hz Per enregistraments de música amb qualitat mitjana
  • 44.100 Hz Per enregistraments de música amb alta qualitat
  • La resolució amb què s'anoten els valors de les lectures.

En tota mesura d'una magnitud física hi ha sempre un arrodoniment. No és el mateix pesar amb unes balances de precisió, que ens permeten afinar fins als mil·ligrams, que amb una bàscula domèstica, on sempre acabarem arrodonint a desenes de grams. Amb l'ordinador hi ha dues possibilitats:

  • 8 bits (un byte per lectura) Permet fer servir una escala de 256 valors possibles. Ve a ser com pesar amb una bàscula domèstica.
  • 16 bits (dos bytes per lectura) Ofereix una escala de 65.536 valors. Seria l'equivalent a les lectures que ens donaria una balança de precisió.
  • El nombre de canals.

La digitalització es pot fer a partir d'un senyal monofònic (un sol registre sonor) o estereofònic (dos registres simultanis).

Els valors que escollim per a cada un d'aquests tres paràmetres determinaran la qualitat de la digitalització, i ens indicaran també el nombre de bytes que necessitarem per a emmagatzemar les dades recollides.

Procés de digitalització a baixa qualitat i alta qualitat

Tècniques de compressió del so digital

Les dades provinents d'un enregistrament digital d'àudio poden ocupar molt d'espai, especialment si la digitalització s'ha realitzat a alta qualitat. Per exemple, per digitalitzar una cançó de 3 minuts de durada a 44.100 Hz es realitzen gairebé 8 milions de lectures:

44.100(mostres per seg.) x 3(minuts) x 60(seg. cada minut) = 7.938.000 mostres

Si l'enregistrament és estereofònic caldrà multiplicar per 2, i si les lectures es fan a 16 bits (que és el normal) necessitarem 2 bytes per emmagatzemar cada una de les xifres recollides. En total l'enregistrament ocuparà:

7.938.000(mostres) x 2(canals) x 2(bytes per mostra)=31.752.000 bytes

És a dir, gairebé 32 milions de bytes per només una cançó! Els códecs són algorismes matemàtics que permeten comprimir les dades, fent que ocupin molt menys espai. La paraula còdec ve de la contracció de les expressions COder i DECoder. Al vostre ordinador hi ha instal·lats uns quants còdecs especialitzats en àudio, i d'altres especialitzats en vídeo. Podeu veure'n la llista si aneu al tauler de control i remeneu per les pestanyes de la icona Multimèdia (o "Sons i multimèdia", segons la versió de Windows que estigueu fent servir). Sempre que es fa servir un còdec es perd una mica de qualitat, ja que s'acostumen a sacrificar les dades que els nostres sentits no poden percebre (per exemple, suprimint els harmònics més aguts que queden fora de les freqüències audibles pels humans). Per això convé fer el procés de compressió una sola vegada, quan ja haguem realitzat totes les modificacions desitjades a les dades originals.

Els còdecs d'àudio més usuals són:

  • MPEG Layer 3, també conegut com a "MP3"

És el còdec més estès. Permet comprimir el so digital fins a 1/10 de la seva mida original sense que es perdi gaire qualitat. S'utilitza en molts tipus de dispositius portàtils, i és el rei dels còdecs en l'intercanvi de música per internet.

  • Ogg Vorbis

A diferència de l'MP3, que té un complex sistema de patents, aquest format es basa en estàndards de codi obert i lliure. La qualitat és similar a de l'MP3.

  • GSM

És el còdec emprat pels telèfons mòbils. Està pensat per a comprimir el so de la parla. Té una relació de compressió molt alta, però la qualitat obtinguda és també molt limitada.

  • Real Audio

Aquest còdec és el que utilitza l'empresa Real Networks en els seus sistemes de transmissió d'àudio en temps real per internet.

  • PCM

Són les inicials de "Pulse Code Modulation". De fet el PCM no és un còdec, sinó el nom que reben les dades d'àudio digital sense comprimir. L'incloem en aquesta llista per ajudar a identificar els diversos formats de codificació de dades. Si consulteu la llista de còdecs des del tauler de control veureu que n'hi ha molts més, i probablement en el futur n'apareixeran de nous.

Formats d'emmagatzematge

Les seqüències numèriques provinents d'una digitalització d'àudio es poden emmagatzemar i transmetre en formats molt diferents:

  • CD - Àudio

Els CD de música que fem servir als reproductors domèstics contenen les dades provinents d'una digitalització a 44,1 KHz, 16 bits i estèreo, sense cap tipus de compressió. En un CD de 700 Mb hi caben uns 80 minuts d'àudio.

  • Àudio a raig o streaming audio

Consisteix en la transmissió per internet de dades d'àudio digital comprimides, que el receptor rep i consumeix al moment, convertint-les en so. S'utilitza, entre altres coses, per a escoltar una emissora de ràdio en temps real o programes "a la carta". Els sistemes més emprats són Real Audio i Windows Media, tot i que hi comença a haver emissores virtuals que emeten raigs de dades en MP3 i Ogg Vorbis. Aquí teniu algunes adreces on es pot provar el funcionament d'aquest sistema:

– XTEC Ràdio

http://www.xtec.cat/xtecmedia/radio/index.htm

La XTEC ofereix als centres docents la possibilitat de posar en marxa una emissora de ràdio a internet. En aquestes pàgines s'explica com funciona i hi ha alguns exemples de centres que ja ho fan servir.

– Emissores comercials de ràdio

Pràcticament totes les emissores ofereixen serveis d'àudio en directe o a la carta. Busqueu la web de la vostra emissora preferida i podreu comprovar-ho. També podeu localitzar emissores de tot el món a:http://www.radio-locator.com

  • FITXERS

El més usual és desar les dades d'àudio digital en un fitxer. Normalment l'extensió d'un fitxer (les tres darreres lletres) indica el format de les seves dades:

  • .wav

És l'extensió que s'acostuma a emprar en el Windows per a identificar els fitxers d'àudio digital. Prové de la contracció de "wave" (ona en anglès). Les dades dels fitxers .wav poden estar en format PCM (sense comprimir) o poden haver estat comprimides amb qualsevol dels còdecs disponibles per a Windows.

  • .au i .aiff

Els fitxers amb extensió .au i .aiff són els que s'acostumen a emprar en sistemes Mac i Linux. Contenen dades sense comprimir.

  • .mp3 i .ogg

Els fitxers amb aquestes extensions contenen dades comprimides en format MPEG-III o Ogg Vorbis

  • .ra

L'extensió .ra s'acostuma a utilitzar en els fitxers codificats amb el còdec Real Player. Hi ha altres extensions i formats, però aquests són potser els més usuals. El programa Media Player Classic, que vem instal·lar en la pràctica anterior, és capaç de reproduir tots aquests formats de fitxers, sempre que els còdecs corresponents estiguin instal·lats al sistema.

Desenvolupament de la pràctica

Aquesta pràctica consistirà a instal·lar el programa Audacity i fer-lo servir per a realitzar alguns enregistraments. Per realitzar-la necessitareu un micròfon i auriculars o altaveus.

Instal·lació del programa Audacity

L'Audacity és un programa de codi obert. Això significa que es pot descarregar lliurement d'internet, i que el seu codi font està disponible per a tothom que vulgui consultar-lo, modificar-lo o distribuïr-lo, sempre que es respectin certes condicions expressades a la llicència d'ús. Amb els programes de codi obert es defensa la idea de que el treball cooperatiu pot servir per a generar projectes de qualitat. A la pàgina eines dels Materials de Formació hi trobareu una de les darreres versions del programa, en una distribució especial que inclou la traducció al català i les llibreries necessàries per treballar amb fitxers MP3 i filtres VST. Descarregueu l'instal·lador de la pàgina indicada, executeu-lo i seguiu les indicacions que apareixeran a la pantalla. Quan arribeu al final del procés tindreu una icona del programa a l'escriptori i una altra al menú inici.

Introducció al funcionament de l'Audacity

L'Audacity és un editor de so digital multipistes. En posar-lo en marxa observarem tres barres d'eines i una barra d'estat:

  • Barra d'eines de control:

  • Barra d'eines del mesclador:

  • Barra d'eines d'edició:

Si deixeu el cursor damunt de cada un dels botons i controls us apareixerà una etiqueta amb una breu descripció de la seva funció. L'audacity treballa amb pistes, que es representen en forma de finestres horitzontals que es van col·locant una damunt de l'altra. Per crear una pista hem de fer un enregistrament.

Realització d'un enregistrament amb el micròfon

Abans de començar a enregistrar convé establir les característiques de les dades que volem obtenir: Com que farem servir un micròfon només necessitarem un canal (a no ser que tingueu un sistema estereofònic de dos micròfons), i per a enregistrar veu humana en tindrem prou amb una resolució de 22 KHz:

  • Aneu al menú Edita - Preferències, situeu-vos a la pestanya E/S d'àudio i assegureu-vos que a la secció Canals del bloc S'està enregistrant hi ha la opció 1 (Mono).

Aprofitem per comprovar una altra cosa: mireu si a les llistes de dispositius que hi ha a les seccions Reproducció i S'està enregistrant hi apareix més d'un dispositiu. Si és així, seleccioneu el que faci referència a la targeta de so en comptes de l'opció "Asignador de sonido de Microsoft". Si només n'hi ha un, no cal canviar res. Un cop fet això, confirmeu el diàleg.

  • Feu clic al selector de freqüències que hi ha a la part inferior esquerra de la barra d'estat i seleccioneu el valor 22.050.

  • Seleccioneu el canal Micròfon (pot ser que rebi un nom similar, com ara "Microphone" o "Mic volume") al selector de dispositius de la barra del mesclador.

  • Busqueu o inventeu-vos un text curt, d'uns cinc segons de durada. Cliqueu al botó d'enregistrar i llegiu-lo.
  • Quan acabeu cliqueu al botó d'aturar.
  • Rebobineu i escolteu l'enregistrament. Si no us agrada com ha quedat, tanqueu la finestra de la pista i torneu a enregistrar. Per tancar una pista cal fer clic a la creu de la cantonada superior esquerra:

  • Cal que l'ona ocupi un bon espai en l'espectre, i que no topi amb els marges. Si el so és massa feble o massa fort caldrà fer servir el lliscador del mesclador per ajustar els nivells i repetir-ho. També podeu jugar amb la distància a la que parleu del micròfon.

Enregistrament fet a un nivell massa febleEnregistrament fet a un nivell massa altEnregistrament correcte

És probable hagi quedat un fragment de silenci davant i darrera de l'enregistrament. Intentarem esborrar-los, fent que les dades quedin ajustades al fragment de la lectura:

  • Feu clic al botó de zoom Encabir el projecte a la finestra.
  • Agafeu l'eina de selecció i marqueu una zona que ocupi tot el vostre enregistrament, deixant fora els trams de silenci inicial i final.

  • Amb la barra d'espais (o amb el botó "reprodueix") comproveu que la zona seleccionada conté realment l'àudio que voleu conservar. Si cal, podeu ajustar els límits de la selecció per la dreta i per l'esquerra, acostant-vos-hi fins que aparegui un cursor amb forma de dit:

  • Feu clic al botó Deixa només la selecció i s'esborraran les zones no seleccionades.
  • Seleccioneu l'eina de desplaçament en el temps i arrossegueu l'enregistrament cap a l'esquerra, fins que quedi al principi de la pista. Si apareixen unes petites fletxes blanques és que l'heu dut massa a l'esquerra.

L'Audacity i els fitxers

L'Audacity fa servir un format propi per a desar els fitxers, que només ell entén. Aquest format, que porta l'extensió .aup, és útil per a desar projectes complexos, amb múltiples pistes, i amb els que volguem treballar al llarg de més d'una sessió.

Si volem escoltar o fer servir amb altres programes els sons creats amb l'Audacity caldrà exportar-los. Hi ha tres opcions, que es troben al menú Fitxer: exportar com a WAV (sense comprimir), exportar com a MP3 o exportar com a Ogg - Vorbis.

Recordeu que els formats comprimits sacrifiquen una mica de qualitat per a obtenir unes mides de fitxer acceptables. Per aquesta raó l'exportació a MP3 o a Ogg ha de ser sempre el darrer pas en l'edició d'un projecte. Cada vegada que importem i exportem un fitxer de so comprimit perdem una mica de qualitat.

Els formats comprimits (MP3 i Ogg) tenen la possibilitat d'incorporar unes etiquetes anomenades ID3 tags, que identifiquen algunes propietats de l'enregistrament: títol, autor/a, intèrpret, any d'enregistrament, etc.

També hi ha la possibilitat d'importar fitxers de diversos formats, des del menú Projecte | Importa àudio.

L'opció Importar MIDI del menú Projecte | Importar àudio, només és operativa a nivell visual. Ara per ara, l'Audacity no permet executar, enregistrar o editar fitxers MIDI.

Ara provarem a desar el so que hem enregistrat, en format estàndard i en format comprimit:

  • Seleccioneu l'opció Fitxer - Exportar com a WAV.
  • Busqueu la carpeta on guardeu els fitxers del curs, doneu-li el nom veu1 i confirmeu l'operació.
  • Un cop feu això, feu Fitxer - Exportar com a MP3. Doneu-li el mateix nom (veu1) i confirmeu. Apareixerà una finestra de diàleg on ens donen la possibilitat d'indicar les etiquetes ID3. Inventeu-vos un títol, poseu el vostre nom i accepteu.
  • Proveu també a fer una exportació a format Ogg - Vorbis.

Aquest enregistrament no el desarem en format aup (projecte audacity), ja que té només una pista i no el volem modificar més.

Per acabar, obriu l'explorador del Windows i busqueu la carpeta on heu desat els tres fitxers. Compareu les mides de cada un d'ells: veureu com el format WAV, que és l'únic no comprimit, ocupa molt més espai que els altres dos. Si proveu a escoltar-los amb el Media Player Classic veureu que la qualitat és molt similar.

És recomanable, sempre que sigui possible, exportar els fitxers de so a formats comprimits.