La transcription audio également connue sous l’appellation « audiotypie » concerne tout type d’enregistrements sonores. Tous les propos oraux tenus lors de divers évènements et dans différentes circonstances peuvent être transposés en texte. Les sources utilisées peuvent alors être des pistes audio comme des documents vidéo.
On parle ainsi de transcription audio en texte quand il s’agit de convertir des entretiens, interviews, conversations, réunions ou encore débats enregistrés sous forme audio. Pour que les sources soient exploitables sans passer par différents logiciels de traitement du son, elles doivent être prises avec des équipements professionnels, comme un dictaphone numérique ou encore un microphone professionnel relié à une table de mixage et un ordinateur.
Lorsqu’il est question de flux vidéo provenant de YouTube, Dailymotion ou encore Vimeo, le processus est appelé transcription vidéo en texte. Généralement pour les vidéos, ce sont des documentaires, des formations en ligne ainsi que des films/animations/séries. Les textes obtenus peuvent ensuite être exploités de nombreuses manières : utilisation pour les personnes souffrant de perte auditive, traduction, sous-titrage, etc.