Profweb

Accueil » Publications » Articles » La saisie vocale, la reconnaissance automatique de la parole

Publications

Articles

Publié le 10 septembre 2018 | Multidisciplinaire

La saisie vocale, la reconnaissance automatique de la parole

Les outils de saisie vocale, qui transcrivent en texte ce que vous dites dans le micro de votre appareil, ont atteint un certain raffinement. Que ce soit dans les produits Google avec Speechnotes, par exemple, les résultats sont imparfaits, mais tout de même impressionnants!

Dicter du texte à son ordinateur ou son téléphone

Chaque fois que j'utilise un outil de saisie vocale, je me sens importante. J'ai l'impression d'avoir un secrétaire personnel à qui dicter mes pensées, comme les hommes d'affaires importants dans les films en noir et blanc. Ou les radiologistes...

Je peux dicter mes courriels, ou simplement noter des idées, tout en ayant les mains libres. Ça fonctionne étonnamment bien. L'avez-vous déjà essayé?

Si vous êtes un utilisateur de Google Drive, ouvrez un document, puis cliquez sur « Outils » et « Saisie vocale ». Cliquez sur l'icône de microphone qui apparaît, puis commencez à parler. Le texte que vous direz s'écrira sous vos yeux. Si vous dites « point », c'est un « . » qui apparaîtra. Idem pour la virgule. Vous pouvez changer de paragraphe en disant « Nouveau paragraphe ».

Activer la saisie vocale dans Google Drive.

Si vous n'êtes pas un utilisateur de Google Drive, vous pouvez dicter un texte sur le site Speechnotes, qui fonctionne tout aussi bien (et même mieux à certains égards). Speechnotes existe également sous la forme d'une application pour Android.

La reconnaissance de la parole ne permet pas que d'écrire du texte : les assistants personnels de type Siri ou Alexa le démontrent. Par exemple, la saisie vocale existe aussi dans la barre de recherche de Google, sur n'importe quel appareil.

Plutôt que de l'écrire, on peut dire ce qu'on veut chercher dans Google.

Microsoft a également un outil reconnaissance vocale, inclus dans Windows. Cet outil permet en théorie de contrôler l'ordinateur (démarrer des programmes, taper du texte dans Word, etc.). Personnellement, j'ai obtenu des résultats désastreux avec cet outil sous Windows 7. Pour l'essayer vous-mêmes, tapez « Reconnaissance vocale de Windows » dans l'explorateur de programmes.

Traduction instantanée

Dans Google Traduction, on peut dicter la phrase à traduire, et ensuite entendre la traduction, en cliquant sur l'icône du haut-parleur dans l'encadré où s'affiche le texte traduit.

On clique sur le micro et on parle. Le texte s'affiche et se traduit instantanément. On peut entendre le résultat en cliquant sur le haut-parleur.

De là à de la traduction instantanée automatisée, il n'y a qu'un pas… Mais même si des écouteurs qui prétendent le faire sont déjà sur le marché, comme les Pixels Buds ou les Pilot (en Europe seulement), ils ne sont pas réellement fonctionnels.

Applications au collégial

Les services adaptés de votre collège connaissent sans doute des outils de reconnaissance de la parole depuis longtemps. Ceux-ci sont particulièrement utiles aux personnes atteintes d'un handicap moteur ou visuel, par exemple.

Les textes écrits avec la saisie vocale contiennent parfois de très grosses coquilles qu'aucun être humain n'aurait pu faire. N'empêche, la saisie vocale pourrait être utile aux étudiants qui butent très souvent sur l'orthographe de mots.

La saisie vocale peut être utile pour obtenir rapidement le verbatim d'un entretien ou d'une conférence. Il faudra réviser le texte, assurément, mais cela permettra quand même d'économiser du temps.

De même, vous pouvez utiliser la saisie vocale pour obtenir une transcription de commentaires vocaux que vous enregistrez pour vos étudiants en guise de rétroaction à un travail, par exemple.

Vous voulez ajouter des sous-titres à une vidéo que vous avez déposée sur YouTube (au bénéfice d'étudiants en situation de handicap ou simplement pour permettre à tous de voir l'orthographe de certains mots), ou de pouvoir utiliser la vidéo en mode « muet »? YouTube dispose d'un outil de reconnaissance de la parole et peut ajouter automatiquement des sous-titres à votre vidéo. Une vérification de l'exactitude de ces sous-titres s'impose, mais c'est quand même nettement plus rapide que de les écrire en entier.

Vous avez d'autres idées? Partagez-les dans la zone de commentaires!

Reconnaissance de dessins

En plus de la parole, l'intelligence artificielle s'exerce maintenant à reconnaître ce que vous dessinez! Par Marijo Emond, j'ai été informée de l'existence d'AutoDraw, une expérience en intelligence artificielle menée par l'équipe de Google Creative Lab.

Encore une fois, les résultats sont très imparfaits, mais tout de même remarquables. Vous dessinez un objet à l'écran, du mieux que vous pouvez (ou, dans certains, je devrais dire « du moins pire que vous pouvez ») et Autodraw le reconnaît et vous propose un joli dessin de la même chose pour remplacer votre gribouillis.

Qui de vous ou d'AutoDraw pourra deviner en premier ce que je dessine?

À propos de l'auteure

Catherine Rhéaume est éditrice et rédactrice pour Profweb depuis 2013. Elle est également enseignante de physique au Cégep Limoilou et chargée de cours pour les cours compensateurs à l'Université Laval. Son travail pour Profweb l'amène tout naturellement à s'intéresser à la technopédagogie et à tenter d'innover dans son enseignement.

0 commentaire(s)

Commenter

* champs obligatoires
Type d'intervention*