Physiologie de la phonation (Suite)
Cours d'ORL (Oto-rhino-laryngologie)
Réglage de la hauteur
:
Le réglage de la hauteur de la voix est donc le réglage de la
fréquence de la vibration.
Il peut s’agir, au terme des équations vues
plus haut, du réglage de la masse et/ou du réglage de la tension,
que cette tension soit active grâce à la contraction des muscles intralaryngés ou passive grâce à la contraction des muscles
périlaryngés.
L’épaisseur de la corde vocale a également été
démontrée comme ayant un effet sur la hauteur de la voix : si
l’épaisseur baisse, le ton de la voix (pitch) augmente aussi bien chez
l’homme que chez la femme.
En réalité, ce qui compte n’est pas la
masse totale de la corde vocale mais sa masse vibrante qui peut
n’être qu’une partie de la corde en fonction de la hauteur et en
fonction de l’intensité.
FRÉQUENCE VIBRATOIRE DE BASE :
Mécanismes de la modification de la fréquence
:
D’une manière générale, la fréquence de vibration (Fo) d’un
dispositif, quel qu’il soit, est inversement proportionnelle à sa taille.
La Fo est donc plus basse si l’instrument est plus gros (équation 1).
La fréquence peut également s’écrire avec l’équation 2 où l’on voit
que la fréquence est inversement proportionnelle à la longueur mais
proportionnelle à la racine carrée de l’étirement (la densité q ne
variant pas dans une première analyse).
Équation 2
Fo = 1
2L
s
r
Avec L : longueur, r : étirement, q : densité
En fait, cette équation doit être mise en parallèle avec l’équation 1 et
finalement la masse de la corde vocale dans ce type d’équation est
la quantité de matériel effectivement en vibration.
Cette quantité est
une fonction assez complexe de la géométrie glottique et de la
contraction musculaire.
Globalement, on peut considérer que de
toute façon, la Fo est une fonction « racine » du module élastique
que ce soit dans l’une ou l’autre des équations.
Ainsi, on peut
prédire qu’un changement de quatre fois de la raideur entraîne un
changement de deux fois dans la Fo et qu’un changement de 16 fois
de la raideur entraîne un changement de quatre fois dans la
fréquence.
La raideur est largement une fonction de la longueur mais
uniquement s’il s’agit d’un tissu inerte.
Dans ce cas, si les fibres sont
étirées, elles sont plus tendues et plus raides.
Dans le cas du muscle
vocal, un muscle en action (raccourci) a une raideur plus grande.
De
plus, la contraction du muscle antagoniste peut entraîner un
changement de la tension sans changement de la longueur
(contraction isométrique).
Ainsi, si le CT est contracté et le TA
relâché, la totalité de la longueur de la corde est augmentée et sa
raideur est globalement augmentée dans toutes ses couches et la Fo
est augmentée.
Inversement, si le TA est augmenté et le CT
désactivé, la rigidité de la masse musculaire augmente et la Fo
augmente malgré la diminution de la longueur de la corde.
Il existe
donc un contrôle différentiel de la Fo par ces deux muscles dont on
peut rappeler qu’ils reçoivent une innervation motrice différente,
l’un par le NLS (pour le CT) l’autre par le NLI (pour le TA).
En fait, les capacités élastiques des cordes (module élastique) sont
élevées.
Il faut donc une augmentation importante de la longueur
pour que la tension soit significativement modifiée.
La Fo ne peut
augmenter que si la racine carrée de l’étirement augmente avec la
longueur plus que la longueur n’augmente elle-même ce qui
nécessite une relation non linéaire entre la tension et la longueur.
La tension peut également être augmentée par l’amincissement de
la tranche de section de la vibration.
Cette solution est celle adoptée
pour le changement vers un registre plus léger comme le passage en
voix de falsetto.
Une diminution de la profondeur effective peut
entraîner des modifications de la Fo telles qu’elles auraient été
obtenues par les modifications autres de la tension et de la longueur.
La profondeur de la vibration peut être régulée par l’activité du
muscle thyroaryténoïdien.
Bien qu’il n’existe pas de données
quantitatives précises, on peut penser que le ligament vocal plutôt
que l’épithélium absorbe la majeure partie de l’étirement dans les
hautes fréquences.
Chez l’homme, le relâchement du TA fait porter
au ligament vocal la majeure partie de l’étirement.
Le ligament vocal
permet d’augmenter considérablement l’étirement dans la corde
vocale sans entraîner de stress effectif dans la muqueuse (rôle des
macula flava ?).
Dans les hautes fréquences, le ligament vocal
assume donc la plus grande partie de l’étirement, la muqueuse
restant relativement laxe.
Ainsi, la muqueuse de recouvrement peut
être libre de propager une ondulation muqueuse dont la vélocité
relativement basse peut être utile pour réguler le transfert de
l’énergie aérodynamique vers la vibration glottique.
Un ligament vocal tendu et une muqueuse « libre » et souple semblent donc la
configuration idéale pour la phonation dans l’aigu.
Dans les basses
fréquences et dans les fréquences intermédiaires, la portion
musculaire du body peut participer à l’étirement et à la mise en
tension.
Ainsi la muqueuse et le ligament vocal peuvent rester laxes
tous les deux et permettre une plus grande « profondeur » de la
vibration dans le registre modal.
La prédictibilité de la Fo en relation avec l’activité du TA reste faible.
Cette imprédictibilité peut être attribuable au fait qu’une portion
significative du body (c’est-à-dire du corps du TA) soit en vibration
dans les fréquences graves et à forte intensité en particulier.
Comme suggéré par Hirano, la contraction du muscle TA devrait
entraîner une augmentation de la tension du body tout en diminuant
la tension du cover.
C’est cette action complexe du TA sur la Fo qui
est en relation avec des couches de différentes tensions et de
différentes caractéristiques biomécaniques : si la partie vibrante
correspond uniquement à la muqueuse, la théorie du cover suffit et
la contraction du TA entraîne un abaissement de la Fo.
Inversement,
si la partie vibrante est essentiellement musculaire, la contraction
du TA entraîne une élévation de la fréquence.
La Fo est « d’autant
plus » en corrélation positive avec l’activité du TA que la vibration
va plus en profondeur.
La « carte d’activation musculaire » proposée par Titze est la clé de
la théorie body-cover.
Il s’agit du graphique de l’activité des muscles CT (en ordonnées) et TA (en abscisses).
On voit qu’il existe une
grande variété de combinaisons possibles de l’activité des deux
muscles pour produire chaque fréquence voulue.
Il existe même des
effets paradoxaux.
Dans la partie basse de la carte, pour les
fréquences les plus graves, on voit que les courbes sont presque
verticales, ce qui montre une corrélation positive entre TA et Fo.
Dans les fréquences aiguës au contraire, la pente s’inverse et on
retrouve une corrélation négative entre Fo et TA.
C’est dans cette
zone que la vibration des cordes vocales obéit aux équations du
« cover simple ».
On peut donc conclure que l’élévation de la Fo est
généralement obtenue par l’augmentation de l’activité de TA dans
les fréquences médium et graves et par l’augmentation de CT dans
les fréquences aiguës (registre de falsetto dans la voix chantée).
En fait chaque couche de la corde vocale a ses propres
caractéristiques biomécaniques en relation avec ce que l’on appelle
la relation longueur–tension c’est-à-dire la tension induite au sein
du matériau par un changement de sa longueur (stress-strain curve).
On sait par exemple que les fibres de collagène sont plus résistantes
à l’élongation que les fibres d’élastine.
On comprend que les
différentes couches de la lamina propria qui ont des contenus en
collagène et en élastine différents se comportent différemment en
fonction de leur élongation.
Au total, il existe donc une courbe
longueur–tension résultante pour toute la corde vocale.
Cette tension
peut être approchée par le terme k de l’équation.
On sait que si on
augmente la longueur de la corde vocale, on augmente passivement
la tension de la corde ce qui se traduit par une élévation de la
fréquence vibratoire comme cela a été démontré sur des larynx
excisés.
La tension totale de la corde (tension « résultante »)
correspond à la combinaison des phénomènes actifs et passifs de
mise en tension.
La tension de la corde est en fait réglée par la
combinaison des effets du CT et du TA.
Au total, il existe un réglage
« bipolaire » de la tension entrant globalement dans le cadre de la
théorie body-cover de Titze.
Vibrato :
Le vibrato est une caractéristique de la voix chantée dans certaines
cultures musicales et particulièrement dans le chant lyrique
occidental.
Il correspond à une vibration de la ligne de base de la
Fo.
Cette oscillation a elle aussi une fréquence Fvib qui est de 4,5 à
6,5 Hz avec une amplitude de plus ou moins 3 %, c’est-à-dire plus
ou moins un quart de ton.
L’origine du vibrato peut être considérée
comme une sorte de stabilisation grâce à l’expérience et aux
sensations du chanteur d’un tremblement « physiologique » au
niveau des muscles laryngés.
Cette hypothèse repose entre autres
sur une expérience de Titze sur un chanteur.
Une électrode a été
implantée dans le CT d’un chanteur et le muscle a été stimulé à
plusieurs fréquences pendant que le chanteur essayait de maintenir
un son « droit ».
Il a ainsi été obtenu un vibrato artificiel. La réponse
a été particulièrement nette à 5 Hz qui pouvait être considérée
comme la fréquence naturelle de l’oscillateur.
De plus, le chanteur
dont le vibrato naturel était à 5,6 Hz parvenait à synchroniser
cependant son vibrato avec l’oscillateur périphérique dans la gamme
de 5 à 6 Hz.
Ce point démontrait que le vibrato était susceptible
d’influences extérieures.
C’est dans ce cadre général que l’on
pourrait comprendre le cas de chanteurs réussissant à synchroniser
leur vibrato lors d’un duo.
Une certaine confusion dans les termes
vient du fait que des modifications contemporaines du vibrato
peuvent être retrouvées non seulement au niveau du larynx mais
aussi au niveau du pharynx, des lèvres, de la langue et même de
l’abdomen.
Mais les chanteurs expérimentés et les professeurs de
chant savent bien que même si une certain vibrato peut être créé de
cette manière, il ne s’agit pas d’un vibrato « correct ».
Le vibrato
naturel reste sous la dépendance de la cocontraction des muscles
intrinsèques du larynx.
Il existe de nombreux ajustements de l’amplitude.
Le vibrato a ainsi
une étendue plus grande lorsque l’intensité vocale augmente mais
une étendue plus petite lorsque de nombreuses notes doivent être
chantées en peu de temps, le but étant sans doute de ne pas
interférer avec la justesse.
Il existe également de nombreux
ajustements de la fréquence.
Il peut s’agir d’ajustements culturels
(au début du siècle, le vibrato était plus rapide que de nos jours
(7 Hz pour Caruso, 5,5 Hz pour Pavarotti) ou encore d’ajustements
liés à l’âge (le vibrato tend à ralentir avec l’âge).
La fonction physiologique, musicale et artistique du vibrato n’est
pas parfaitement élucidée.
Plusieurs explications ont été avancées
qui d’ailleurs ne s’excluent pas.
Il peut s’agir d’un moyen
d’identifier la particularité de la voix humaine parmi les éléments
de l’orchestre.
L’auditeur perçoit le vibrato comme un élément du
timbre et le vibrato aurait une fonction de « glue » qui permettrait
de lier les harmoniques entre eux et de participer à la perception de la qualité vocale.
De même, la perception exacte de la hauteur par
l’auditeur dépendrait de l’amplitude et de la cadence du vibrato.
Enfin, il faut rappeler que la sensation tonale d’un son persiste
pendant 0,14 s ce qui correspond à la durée moyenne d’un cycle de
vibrato.
Registres
:
Les registres peuvent être définis de façon perceptive à la fois en
voix parlée et en voix chantée.
Il s’agit de qualités de la voix qui se
maintiennent dans une certaine gamme de fréquences et d’intensité.
Dans la voix parlée, on distingue la voix pulsée (ou craquée ou
« fry »), la voix modale « normale » et falsetto.
Dans la voix chantée,
on distingue souvent la voix de poitrine, la voix de tête ou
intermédiaire et la voix de fausset.
Il existe en fait un ensemble
extrêmement complexe de définitions des registres tels que les
pédagogues du chant les utilisent dans le but d’un classement des
voix des chanteurs.
Il existe en fait deux mécanismes glottiques principaux souvent
appelés « registre lourd » (ou encore « voix de poitrine » ou
mécanisme I) et « registre léger » (ou encore « voix de tête » ou
mécanisme II).
Dans le registre lourd, c’est la totalité de la masse
musculaire qui entre en vibration.
Dans le registre léger, la masse
musculaire ne vibre pas et seul le bord libre est le siège de la
vibration.
Habituellement les hommes utilisent principalement le
registre lourd (sauf les ténors) et les femmes plutôt le mécanisme
léger (sauf les mezzos).
La transition entre deux registres se fait de façon brutale sur le plan
perceptif.
Le changement dans la configuration de l’appareil
phonatoire n’est cependant pas nécessairement aussi brutal.
En effet
la notion de registre est au moins partiellement en rapport avec la
perception catégorielle qui est la perception d’entités discrètes dans
un continuum (comme les couleurs d’un arc-en-ciel).
De ce fait, des
différences de catégories peuvent apparaître alors que la variable
physiologique a évolué de façon continue (comme dans la
perception des couples de consonnes voisées/non voisées par
exemple).
Sur le plan du changement de la configuration glottique, le
phénomène de registre est en effet extrêmement lié au réglage de la
hauteur de la voix.
Chez l’homme, dans les notes graves, on a vu
que l’augmentation de la hauteur est assurée par la mise en tension
du TA.
Dans ces conditions, il a été démontré que l’activité
musculaire du TA est importante tandis que l’activité du CT est
faible.
Lorsque le TA arrive à un certain seuil de tension, il peut
déclencher le passage de registre modal à registre de falsetto.
En
effet, il est encore possible d’augmenter la Fo par contraction du CT
lorsque le TA est complètement contracté mais cet effort serait réalisé
avec une très grosse dépense d’énergie.
À l’inverse, le relâchement
du TA et la contraction du CT font alors porter l’augmentation de
tension au ligament vocal, ce qui permet de désengager la masse
musculaire du travail de mise en tension.
Pour éviter le changement
brutal de registre, les chanteurs expérimentés désengagent
progressivement le TA au fur et à mesure qu’ils engagent le CT.
Ainsi la transition entre les deux registres n’est pas perceptible.
Cependant ce changement d’utilisation du TA doit aller de pair avec
l’utilisation de la pression pulmonaire. Dans une sirène avec un
crescendo–decrescendo, il n’y a pas de changement de registre.
L’amplitude de la vibration augmente dans la phase crescendo et
l’abduction doit être augmentée pour maintenir le ratio inchangé.
De même, le decrescendo s’accompagne d’une augmentation de
l’adduction pour maintenir le ratio.
Le contrôle de l’adduction peut aussi être utilisé pour compenser
les effets de la résonance du tractus vocal sous-glottique.
Quand les
cordes vocales sont amenées à vibrer de façon intense à certaines
hauteurs caractéristiques en raison des phénomènes de résonance,
une abduction limitée peut être utile pour compenser l’excès
vibratoire.
Dans ce type de configuration, une augmentation du
débit aérien peut être notée.
La configuration glottique et en particulier l’adduction glottique
peut être mise en rapport avec la qualité du son produit. Titze
rapporte les données d’expériences perceptives réalisées avec un
panel d’auditeurs.
Le timbre était jugé riche (voix de poitrine)
lorsque les cordes vocales étaient complètement closes pendant la
phase de fermeture de la vibration cordale.
En pratique, cela
correspond à une mise en contact préphonatoire des apophyses
vocales. Le timbre était à l’inverse jugé pauvre lorsqu’il existait une
fuite.
Plus les cordes vocales sont indépendantes, plus le flux d’air
produit est sinusoïdal et la pente spectrale est faible (signal pauvre
en harmoniques).
Mais les effets de la forme glottique et de
la puissance de la voix, c’est-à-dire de l’amplitude de la vibration
muqueuse se combinent pour donner la forme finale du flux.
Si
l’adduction est faible, le moyen d’obtenir un meilleur accolement
peut être d’augmenter l’intensité du son, c’est-à-dire l’amplitude
vibratoire.
On voit donc qu’il existe une forte interaction entre le
réglage de la hauteur de la voix et le réglage de l’intensité.
Réglage de l’intensité :
Il correspond au réglage de l’amplitude de la vibration par la
combinaison des réglages de la pression sous-glottique, de la
géométrie glottique, de la force d’adduction des cordes vocales et
de la géométrie du tractus vocal dans son ensemble.
L’intensité est
mesurée en dB et fait référence à la pression sonore (SPL pour Sound
Pressure Level), proportionnelle au carré de la distance entre la source
et le dispositif de recueil selon l’équation.
La pression sous-glottique dépend de la pression pulmonaire qui
est en rapport avec la pression imposée par les forces qui régissent
l’appareil respiratoire.
Il existe une relation quasi linéaire entre la
pression pulmonaire et trachéale et l’intensité du son.
En fait si on
augmente la pression sous-glottique, toutes choses étant égales par
ailleurs, la fréquence augmente en même temps que la pression, ce
qui n’est pas prévu dans l’équation classique de la Fo (voir
équations 1 et 2).
Il s’agit d’un des facteurs qui ont poussé les
chercheurs à proposer une autre théorie du mouvement des cordes
vocales.
Pour compenser cette élévation de la fréquence, il est
nécessaire d’augmenter la force d’adduction des cordes et
d’augmenter ainsi le temps de contact entre les cordes.
L’augmentation du temps de contact est un facteur qui s’oppose à
l’augmentation de fréquence et qui permet la transformation en
augmentation de l’intensité vocale.
Que ce soit chez les hommes ou
chez les femmes, l’augmentation de l’intensité va de pair avec la
diminution du temps pendant lequel les cordes vocales restent
ouvertes.
Plus l’adduction est importante et plus le temps de contact est
important, plus l’onde glottique est à pente abrupte.
La pente de fermeture est d’autant plus abrupte que les conditions de phonation
sont plus intenses.
La forme de la courbe de fermeture de l’onde
glottique peut être définie comme le taux de déclinaison maximum
du flux TDMF.
Une diminution du quotient ouvert et une
augmentation du TDMF correspondent à une augmentation de la
force d’adduction c’est-à-dire schématiquement à une augmentation
de l’intensité des conditions phonatoires (forçage vocal).
On peut se demander s’il existe un degré d’adduction idéal puisque
si les cordes vocales ne se touchent pas, la voix n’est ni forte ni
même bonne mais si elles sont trop serrées avec une force
d’adduction trop importante, la voix est « serrée », « étranglée » et il
s’agit d’un effort vocal.
Une configuration idéale semble être celle
où les cordes vocales sont presque en contact avant la mise en
phonation (diminution de la largeur glottique préphonatoire).
Cette
configuration assure un fonctionnement presque libre des cordes qui
sont ainsi capables d’exprimer leurs modes de vibration. En
pratique, le signal produit est presque sinusoïdal.
Ce type de
fonctionnement correspond à ce que les pédagogues du chant
appellent « la voix qui flotte sur le souffle » ou une image mentale
voisine.
On peut supposer que l’image de parler ou de chanter sur
le souffle est utilisée pour ajuster la résistance glottique de manière
à assurer le meilleur rendement possible de la conversion de
l’énergie aérodynamique en énergie acoustique en modifiant le
moins possible la vibration des cordes vocales.
Lorsqu’il est nécessaire d’augmenter l’intensité, on a vu que la forme
de l’onde glottique change, ce qui correspond à un mode de
fonctionnement glottique plus proche d’un modèle « ouvert-fermé »
du type oscillateur à relaxation.
Ce mode de
fonctionnement a un rendement plus faible et une énergie
importante est dissipée au niveau des cordes vocales sous forme de
frottements qui sont susceptibles d’entraîner une inflammation
locale et même des lésions des cordes.
Ces lésions, appelées, lésions dysfonctionnelles, siègent préférentiellement au niveau de la zone
des cordes vocales sur laquelle les phénomènes d’accolement sont
les plus importants, c’est-à-dire le tiers moyen.
Dans la parole, l’augmentation des tensions dans l’appareil vocal
correspond à un ensemble comportemental de la part du locuteur
qui est appelé « effort vocal » ou encore forçage vocal lorsqu’il tend
à se pérenniser.
Dans la littérature anglo-saxonne, il est souvent fait
référence à la notion de vocal misuse ou de vocal abuse.
En réalité, les
configurations glottiques correspondent, au-delà du fonctionnement
des cordes vocales, à tout l’ensemble des phénomènes
physiologiques qui sous-tendent la communication.
Dans une
communication parfaitement « détendue », les phénomènes de
tension musculaire sont au minimum.
La tension des cordes vocales
et de l’appareil respiratoire correspondent au fonctionnement idéal
que l’on vient de voir.
Dans une communication dont l’objectif est
de modifier le comportement de l’interlocuteur (voix projetée), une
tension musculaire plus grande est requise pour produire une voix
plus forte et plus « efficace ».
En réalité, il existe une augmentation
de la tension à tous les niveaux de l’organisme : il a été démontré
que tous les muscles, y compris les muscles de la posture voient
leur activité augmenter.
Au niveau comportemental, on observe en
général une attitude de redressement du corps avec un regard
tourné vers l’interlocuteur.
Au niveau respiratoire, on observe une
inspiration plus ample (anticipation préphonatoire) pour faire face à
l’augmentation prévue de la pression sous-glottique.
Il est à noter
que certains sujets peuvent avoir des difficultés à obtenir le
relâchement musculaire nécessaire à une inspiration profonde suivie
d’une expiration contrôlée par les muscles de la paroi abdominale.
Au niveau postural, on observe également une augmentation de la
raideur de tous les muscles, qu’il s’agisse des muscles du cou et du
larynx ou de muscles situés plus à distance comme les muscles des
mollets et du dos.
Les modifications de l’activité musculaire en
rapport avec l’augmentation de l’intensité sont donc génératrices
d’une dépense d’énergie.
Normalement, le sujet compense cet excès
d’énergie par un repos compensateur.
Mais dans certains cas, le sujet
n’observe pas ce repos et risque l’apparition de complications à type
de laryngopathies dysfonctionnnelles (malmenage vocal).
On
comprend que la prise en charge rééducative des patients présentant
un malmenage vocal ne puisse se résumer à la modification de la
configuration glottique même si elle est nécessaire et que la prise en
charge d’aspects aussi divers que la tension musculaire générale, le
niveau de stress, la posture, la respiration préphonatoire soient des
éléments indispensables d’une rééducation.
Modèles non linéaires de la vibration :
La compréhension de la vibration glottique comme un oscillateur à
masse et à ressort ne permet donc pas de comprendre complètement
les phénomènes présents au niveau laryngé.
Plusieurs arguments
sont en faveur de l’introduction de modèles non linéaires : présence
de phénomènes « non linéaires » comme des modulations, des
subharmoniques, des bifurcations, rapports entre fréquence
vibratoire et intensité du son, synchronisations des cordes vocales.
A - PRESSION SOUS-GLOTTIQUE ET FRÉQUENCE
:
La pression sous-glottique intervient dans le réglage de la fréquence.
Sur des larynx excisés, on peut démontrer que l’augmentation de la
pression sous-glottique est responsable d’une augmentation de la
fréquence.
Ce phénomène bien connu et déjà présent dans la théorie
« body-cover » de Titze est d’interprétation difficile dans un modèle
classique à masses et à ressort.
Il ressort en effet de l’équation qui
gouverne ces modèles, qu’il n’existe pas de place pour les
phénomènes de pression.
Sur le plan clinique, la notion d’élévation de la fréquence de la Fo
lorsqu’un sujet émet une voyelle tenue et qu’on lui applique une
brusque augmentation de pression au niveau du sternum est bien
connue.
Sur le plan expérimental, l’augmentation de la pression sous-glottique augmente la tension dynamique de la corde vocale
(qui dépend du rapport longueur/amplitude), ce qui augmente à la
fois l’amplitude de la vibration et sa fréquence.
En pratique, la
pression sous-glottique augmente la Fo surtout dans les notes basses
(lorsque les cordes vocales sont courtes et détendues).
Le fait que ce
soit plutôt les notes graves qu’il est possible de faire monter avec la
pression d’air est d’ailleurs un phénomène bien connu des
chanteurs.
Il est donc possible de combiner les effets de la pression
pulmonaire avec les effets des contractions des muscles intrinsèques
pour parvenir au réglage de la Fo.
B - PHÉNOMÈNES DE SYNCHRONISATION
ENTRE LES CORDES VOCALES :
Les modèles à masses et à ressort ont en commun la description du
mouvement des cordes vocales et de leur muqueuse sans que ce
mouvement ne soit modifié par le contact avec la corde vocale controlatérale.
De nombreuses observations expérimentales ainsi que
l’évidence clinique commandent cependant de mettre en place des
modèles qui font place aux effets mécaniques des contacts physiques
entre les cordes.
En particulier, il est difficile de comprendre à l’aide
des équations classiques comment deux cordes vocales qui sont
forcément différentes du point de vue de la tension ou de leur
longueur, comme sont différentes les deux mains, les deux moitiés
du visage, etc peuvent vibrer exactement à la même fréquence.
Nous avons étudié ce type de phénomènes sur des larynx excisés à
l’aide d’un banc expérimental.
Nous avons pour cela mis au
point un dispositif d’optoréflectométrie miniaturisé qui nous
permettait d’avoir une information sur la composante verticale de
la vibration glottique.
Celle-ci est nécessairement couplée à sa
composante horizontale et cette information sur la composante
verticale donne en réalité une information sur la totalité du cycle
vibratoire.
Puis nous avons provoqué des asymétries entre les cordes vocales
en modifiant la tension de leur partie vibrante à l’aide de dispositifs
de micromanipulateurs.
Notre hypothèse était que, en cas
d’asymétrie et en l’absence de toute interaction, les cordes vocales
vibreraient chacune à une fréquence propre sans qu’il existe de
relation entre les deux fréquences.
À l’inverse, en cas d’interaction,
il existerait une modulation d’une fréquence par l’autre.
Cette
interaction a été démontrée à la fois sur le signal glottique détecté
par électroglottographie (EGG) et grâce aux optoréflectomètres
(ORM).
Sur le signal glottique global tel qu’il est détecté par l’EGG, nous
avons pu démontrer qu’il existe dans huit cas sur dix des
phénomènes présents dans le signal et qui correspondent à une
modulation, c’est-à-dire à un mélange non linéaire des deux
fréquences.
C’est dans ce cadre que nous avons retrouvé des
attracteurs étranges, des modulations,
des subharmoniques.
L’apport des ORM a été de mettre en évidence des modifications de
la trajectoire d’une des deux cordes vocales lorsqu’elle est en contact
avec la corde vocale controlatérale.
Les facteurs de synchronisation entre les cordes sont nombreux.
Le
premier est la relative proximité de forme et de tension entre les
cordes vocales à l’état normal.
La situation des paralysies laryngées
unilatérales est à l’évidence la situation la plus opposée.
Il est à noter
que la récupération d’une vibration correcte peut être obtenue
lorsque le contact entre les cordes vocales est rétabli comme on le
voit en cas de rééducation orthophonique ou en cas de
« manipulation » laryngée.
Un autre facteur est l’effet Bernoulli luimême
qui s’exerce de façon symétrique sur les deux cordes vocales
et qui tend donc, en fonction de la géométrie glottique, à provoquer
les mêmes phénomènes au niveau des deux cordes vocales.
Mais
c’est surtout le contact direct entre les cordes vocales et la mise en
commun d’une certaine partie de leur masse qui doit être mis en
lumière.
Ce contact est amélioré par le mucus de revêtement des
cordes vocales et on comprend le rôle majeur joué par la viscosité
de ce mucus sur le contact entre les cordes.
Nous avons ainsi pu
démontrer que la fréquence de vibration de larynx excisés est
directement fonction de la viscosité du mucus artificiel utilisé.
Plus
le mucus utilisé est visqueux, plus la fréquence vibratoire diminue
par augmentation du temps « fermé » des cordes vocales.
Dans le
même temps, nous savons que plus le mucus est visqueux plus le
seuil de phonation est élevé.
On voit donc la complexité des
relations qui régissent fréquence et amplitude.
Il en est de même
lorsque la configuration glottique change comme on a vu dans le
chapitre « Réglage de l’intensité ».
C - NOTION D’OSCILLATEUR À RELAXATION :
Dans le cas d’une corde de guitare, on comprend
que la Fo ne dépend que des caractéristiques d’étirement et de
longueur et qu’elle ne dépend pas de la force avec laquelle le doigt
du guitariste agit sur la corde.
À l’inverse des oscillateurs harmoniques, on peut
décrire des oscillateurs dits « à relaxation » parce qu’il s’agit de
systèmes dans lesquels l’énergie est successivement emmagasinée puis
relâchée.
Un exemple intuitif est un siphon.
Si un robinet d’eau continu (analogue à l’air
pulmonaire qui est une énergie continue) remplit un récipient, le
récipient se remplit jusqu’au niveau du siphon.
Lorsque l’eau atteint le niveau du siphon, le
récipient se vide complètement d’un seul coup puis recommence à se
remplir.
Le niveau de l’eau dans le récipient est donc
alternatif (plein, vide) mais non sinusoïdal.
On dit qu’il y a accumulation puis relaxation.
Ce type d’oscillateur transforme donc aussi
l’énergie continue en une énergie alternative, mais on comprend que
ici la fréquence du phénomène est directement fonction du débit,
donc de l’énergie introduite.
Ce type d’oscillateur est plus « robuste » que
les oscillateurs harmoniques.
Au niveau des cordes vocales, on peut considérer
que ce type d’oscillateur est le modèle convenable lorsque la
configuration glottique est « serrée ».
D - MODÈLE « SLIP STICK »
:
Il correspond en français à un modèle « glissé-collé » et de façon
plus intuitive au fonctionnement des cordes de violon.
Dans un tel
modèle, la force dirigeante de la vibration (driving force) est l’archet qui correspond à l’ensemble des phénomènes de synchronisation
déjà vus : l’air phonatoire avec l’effet Bernoulli bien sûr mais
également le contact avec la corde vocale controlatérale avec son
mucus de revêtement.
D’ailleurs, le violoniste dépose sur la surface
de l’archet du collophane dont le but est précisément d’augmenter
la viscosité de surface de l’archet et d’améliorer l’adhésion de la
corde.
La corde elle-même répond bien sûr aux équations habituelles
de la vibration.
Lorsque l’archet commence à entraîner la corde hors de sa position
d’équilibre, les forces élastiques tendent à s’opposer à ce mouvement
jusqu’au moment où ces forces de rappel sont plus importantes que
la force d’adhésion à l’archet.
Dès lors, la corde « se décolle » de
l’archet et se met à osciller.
Lorsqu’elle a dissipé suffisamment
d’énergie, elle est à nouveau capable d’être collée par l’archet et à
nouveau entraînée.
On voit qu’il existe dans ce fonctionnement une
partie libre pendant laquelle la corde oscille (vibre) à la fréquence
correspondant à sa tension propre et à sa masse propre et une partie
« forcée » pendant laquelle le mouvement correspond à celui de la
« driving force ».
Il s’agit donc bien d’un oscillateur à relaxation.
Ce type de modèle est ainsi capable de prendre en compte les
phénomènes que nous avons vus concernant les rapports entre la
fréquence et l’intensité ainsi que les phénomènes de synchronisation.
On peut considérer que lors d’un cycle normal, les deux cordes ne
sont pas exactement identiques et leur vibration devrait permettre
d’exprimer cette différence mais la partie « collée » du cycle met en
commun leur masse vibrante ce qui les synchronise.
Aussi
longtemps que les deux cordes restent dans une certaine gamme de
différence, le mécanisme fonctionne.
Au-delà de ce point, d’autres
phénomènes peuvent apparaître.
On peut observer des biphonations
qui correspondent en réalité, comme on l’a vu plus haut, à une
synchronisation lors d’un cycle sur deux.
Mais on peut observer
aussi des phénomènes plus complexes correspondant aux
modulations réciproques des cordes.
Ces phénomènes correspondent aux lois des mélanges non linéaires et sont
caractérisés, entre autres, par la présence de subharmoniques et de
bifurcations (c’est-à-dire des changements brusques d’état).
Lorsque
les cordes vocales ne sont plus en contact et que leur tension et leur
masse sont par trop différentes, comme on l’observe dans les
immobilités laryngées unilatérales par exemple, on peut observer
soit une disparition de toute vibration ce qui est le cas le plus
fréquent soit deux cordes vocales vibrant chacune à sa fréquence
propre.
L’analyse du signal dans ces cas retrouve non pas les traces
d’un mélange non linéaire c’est-à-dire une mise en commun de la
vibration comme précédemment, mais au contraire un mélange
linéaire c’est-à-dire une simple coexistance des deux signaux.
Dans
ce cas, l’analyse spectrale retrouve deux pics spectraux
correspondant chacun à la fréquence d’une corde.
Il est intéressant de revoir la notion de configurations glottiques
différentes vue dans le chapitre sur le réglage de l’intensité à la
lumière de cette hypothèse.
On peut alors considérer que le
mode de fonctionnement « idéal » qui est en bas correspond à un
mode de fonctionnement dans lequel les tensions et les longueurs
des cordes sont si semblables et si bien réglées qu’aucun processus
de synchronisation n’est nécessaire.
Ce mode de fonctionnement
correspond à un oscillateur « harmonique » et délivre un signal
quasi sinusoïdal.
Au contraire, plus les asymétries sont présentes et
plus les degrés de liberté auraient tendance à apparaître et plus la
nécessité d’une synchronisation « forcée » apparaît.
On comprend
donc que le mécanisme de forçage vocal tel qu’il est utilisé pour
l’augmentation du volume sonore est très voisin du mécanisme
utilisé pour compenser les anomalies vibratoires du larynx.
On peut
même penser que c’est l’objectif de la rééducation que de faire
revenir le plus possible la voix des patients vers ce modèle idéal.
Transformation du son en voyelles
:
Toutes les réalisations vocales humaines nécessitent une
configuration du tractus vocal.
L’idée générale de la théorie
« source–filtre » est que le son source est le débit d’air pulsé au
niveau glottique, ce son contenant de nombreuses fréquences.
Puis
le son est filtré par le tractus vocal qui sélectionne un certain nombre
de ces fréquences pour qu’elles irradient au niveau de la bouche.
Il
s’agit des fréquences qui « résonnent » avec le tractus vocal.
La notion de résonance dans un tube correspond à des interférences
entre des ondes soumises à de multiples réflections.
Le tractus vocal
humain comme le corps d’un instrument à vent résonne pour
certaines fréquences de la source.
Ces fréquences dépendent de la
forme du tractus vocal, ce qui détermine l’apparition des sons du
langage (phonèmes).
Un formant est une résonance du tractus vocal.
Les voyelles sont
perçues et classifiées sur la base des deux formants les plus graves
appelés F1 et F2.
Pour schématiser, le formant grave correspond au
pharynx et le formant aigu à la cavité buccale.
Ainsi du point de
vue de la perception des voyelles, le processus de filtrage aboutit à
une simplification du code qui doit être perçu par l’auditeur.
Dans
la phonétique articulatoire classique, les voyelles sont décrites en
fonction de la position haute ou basse de la langue ainsi que de sa
position reculée ou avancée : pour le /a/ la langue est basse et
reculée, pour le /i/, elle est haute et avancée, pour le /u/, la langue est haute et reculée.
Ces trois voyelles déterminent donc sur une
représentation orthonormée F1 et F2, le triangle vocalique.
La forme du tractus vocal pour le son /eu/ est approximativement
tubulaire avec une section à peu près uniforme du fait d’une
position neutre de la langue.
La position de F1 est environ 500 Hz et
de F2 à 1 500 Hz.
On peut voir sur le même schéma la position de
F1 et de F2 lorsque la position de la langue varie.
En pratique, on
peut modéliser le tractus vocal dans /a/ avec un tube étroit pour le
pharynx et un tube plus large pour la cavité buccale.
Les formants peuvent être modifiés par quelques manoeuvres
articulatoires.
La première règle est que tous les formants diminuent
uniformément au fur et à mesure que la longueur du tube s’allonge.
Ces modifications de longueur peuvent être obtenues par un
abaissement du larynx ainsi que par une projection ou au contraire
une rétraction des lèvres.
Ces modifications entraînent donc un
glissement global des fréquences sans modification de l’intervalle
entre les formants, donc sans modification de l’identification de la
voyelle.
La seconde façon de modifier les voyelles est d’arrondir les
lèvres, ce qui correspond schématiquement à obturer légèrement la
bouche comme font parfois certains instrumentistes à vent.
Cette
« couverture » aboutit à l’équivalent acoustique de l’augmentation
de la longueur du tube et donc à un glissement des fréquences vers
le grave.
La combinaison entre la hauteur du larynx et la position et
la forme des lèvres permet effectivement d’éclaircir ou d’assombrir
le timbre de la voix.
L’abaissement de la mâchoire peut également
être utilisé.
En particulier, F1 peut être abaissé par un abaissement
de la mâchoire, ce qui est utilisé par certaines sopranos pour amener
leur F1 au contact de F0 et ainsi augmenter leur puissance
acoustique.
Par ailleurs, la contraction de la bouche abaisse F1 et
élève F2, ce qui donne une voyelle au spectre plus large avec un
étalement de la puissance acoustique comme dans /i/.
Inversement,
la contraction du pharynx élève F1 et diminue F2, ce qui rend la
voyelle plus compacte comme /a/.
Les chanteurs parlent fréquemment du « placement » de la voix,
affirmant que certaines voyelles sont censées avoir des localisations
précises dans le tractus vocal.
Ces sensations de placement précis de
telle ou telle voyelle peuvent correspondre à la localisation des
maxima de pression des ondes stationnaires dans le tractus vocal.
Il
y a donc plusieurs endroits dans lesquels les sensations doivent être
maximales.
Pour la voyelle /i/ par exemple, les pressions sont
hautes au niveau palatal.
Pour /u/, les pressions sont hautes dans
la région vélaire et enfin pour /a/ elles sont hautes dans la région
du pharynx.
On peut concevoir que certains chanteurs font
confiance à ces sensations pour modifier les voyelles comme ils le
désirent.
D’autres sensations comme chanter dans le masque, faire
résonner le maxillaire ou encore viser la note au niveau du palais
juste en arrière des incisives supérieures peuvent aussi être en
relation avec l’obtention de maxima de pression à des endroits précis
du tractus.
Contrôle nerveux de la production
vocale :
La production vocale est le résultat d’une coordination neuromotrice
des muscles de tous les organes impliqués dans la phonation depuis
les muscles de la posture et de la respiration jusqu’aux muscles du
larynx et de l’appareil articulatoire pharyngo-bucco-labial.
A - INNERVATION SENSITIVE DU LARYNX :
Elle est assurée surtout par le nerf laryngé supérieur qui reçoit des
fibres sensitives issues du vestibule laryngé et de la margelle.
Ces
fibres rejoignent le nerf vague au niveau du ganglion inférieur du
vague.
Elle est assurée également en ce qui concerne l’innervation
de la corde vocale et de la région sous-glottique par des fibres qui
rejoignent le nerf laryngé inférieur.
Il existe des récepteurs muqueux
sensibles au contact (mécanorécepteurs) et qui entraînent, lorsqu’ils
sont stimulés, le réflexe de toux.
Ceux-ci sont situés principalement
au niveau de l’étage vestibulaire.
Il existe également des
mécanorécepteurs articulaires et intramusculaires dans les muscles
intrinsèques et extrinsèques de plusieurs types (corpusculaires,
fuseaux neuromusculaires, spiralés) qui renseignent les centres
nerveux sur les phénomènes proprioceptifs de tension et d’étirement
présents au niveau des cordes.
Ces récepteurs plus particulièrement
situés au niveau des cordes transmettent des messages qui sont
acheminés par le nerf récurrent.
Les fibres pénètrent dans le bulbe avec le nerf vague et se dirigent
vers le noyau du faisceau solitaire où certaines fibres issues du
larynx se terminent.
Les autres fibres continuent leur chemin à
travers le tronc cérébral vers le noyau rond.
À partir de celui-ci des deutoneurones rejoignent le lemniscus médian (ruban de Reil) et se
projettent dans le noyau ventral postérieur du thalamus.
À partir
du noyau du faisceau solitaire, il existe des projections thalamiques
et de nombreuses projections dans le noyau ambigu.
B - CENTRES NERVEUX
:
La zone cérébrale motrice du pharyngolarynx est au niveau de la
partie basse de la circonvolution frontale ascendante (ou gyrus
précentral) des deux hémisphères.
Il existe une autre zone qui a été
mise en évidence expérimentalement qui est à la partie postérieure
de la première circonvolution frontale, empiétant sur la face interne
de l’hémisphère.
Lors de la stimulation de tout ou partie de ces
zones, on observe une réponse laryngée globale avec vocalisation,
inhibition du muscle cricoaryténoïdien postérieur et activation de
un ou plusieurs muscles adducteurs de façon bilatérale (des lésions
cérébrales à ce niveau n’entraînent pas d’immobilité unilatérale).
De très nombreuses connexions cérébrales existent, en particulier
avec les centres impliqués dans le langage.
On cite en particulier les
voies associatives entre les régions motrices pharyngolaryngées et
les aires auditives corticales et sous-corticales.
C - CONTRÔLES RÉFLEXES :
Des ajustements articulatoires surviennent dans le processus de
phonation à deux niveaux : lors de l’ajustement préphonatoire et lors
de l’émission sonore.
L’ajustement préphonatoire est indépendant
du contrôle audiophonatoire.
Ainsi en voix chantée, il est possible
d’émettre un son qui soit d’emblée à la hauteur et à l’intensité
voulues.
Ce réglage préphonatoire d’origine corticale dépend
notamment des informations fournies par les mécanorécepteurs
laryngés qui donnent aux centres des informations sur l’état de
tension et la position des différents muscles et des différentes
articulations.
En cours de phonation, ces informations permettent
les ajustements instantanés nécessités par le maintien d’une
configuration glottique donnée.
D’autres arcs réflexes d’origine
abdominale, thoracique, cervicale, linguale etc, contribuent
probablement aux ajustements permanents agissant par feed-back sur
le larynx au cours de la phonation.
La rapidité du flux de la parole et la précision des points
d’articulation nécessitent des adaptations à la fois très rapides et
très fines, ces points d’articulation pouvant être très proches les uns
des autres.
Ainsi le degré de constriction du conduit vocal est
déterminé par l’espace entre différentes structures telles que la
langue et le palais.
Ce degré de constriction définit à son tour le
type d’écoulement de l’air (laminaire ou turbulent).
De très faibles
variations de l’ordre du millimètre de la distance entre langue et
palais permettent donc de produire des sons aussi différents qu’une
voyelle, une consonne voisée ou encore une consonne occlusive.
Les
adaptations sont assurées grâce à des arcs réflexes rapides reposant
sur la sensibilité tactile et proprioceptive de la langue, du palais et
des lèvres.
D - CONTRÔLE AUDIOPHONATOIRE :
La voix est sous le contrôle des centres auditifs comme le montre la
voix perturbée et non modulée des sourds profonds.
Ce contrôle audiophonatoire semble comporter un processus automatique
involontaire et un processus volontaire.
Il existe probablement des
commandes induites volontairement par les voies corticobulbaires
en réponse aux informations acoustiques parvenues jusqu’au cortex
auditif de même qu’un ensemble de réflexes acousticolaryngés.
Ce
contrôle s’exerce cependant en synergie avec le contrôle
proprioceptif qui permet l’anticipation préphonatoire (c’est ce qui
permet à un chanteur d’émettre d’emblée une note à la hauteur
voulue sans attendre le contrôle auditif).
Cet ensemble proprioceptif
explique la voix relativement peu altérée des sourds récents.