Transcribe.Wreally

Transcribe.Wreally : Revue (Avis, Caractéristiques, Prix)

Transcribe est un logiciel de transcription en SaaS, qui permet à son moteur de conversion de Speech-to-text et d'intelligence artificielle (STT-AI) d'effectuer des transcriptions.
Note Générale

4.3

/5

Tarif à partir de

1.9

$

/mois

Version Gratuite
chevron gauche 1chevron droite 1
Version d'Essai
chevron gauchevalidation icon
Siège

Irlande

Ville d'Origine

Kinvara

Followers Linkedin
300
validation icon 3
Page Linkedin
validation icon 2logo linkedin
Page Twitter
Merci d'avoir voté ! 🏆
Veuillez patienter...Pour éviter le Spam, la mise à jour se fera dans 30 secondes ...
🚨Une erreur est survenue ... Avez-vous déjà voté pour cet outil ?
< Revenir à la liste complète des outils
Transcribe.Wreally

Avantages et Inconvénients

Plus icon
AVANTAGES
  • Inscription très abordable et tarifs horaires réduits
  • Facile à utiliser Éditeur intégré + lecteur multimédia pour une saisie vocale illimitée (dictée)
  • Transcription automatique efficace avec codes temporels et identification du locuteur
  • La transcription automatique fonctionne dans un grand nombre de langues.
  • Intégration du pédalier & boucles de lecture pour la transcription manuelle
  • Utilisé par des clients respectés tels que Time Warner et Wall Street Journal
Minus icon
INCONVÉNIENTS
  • La transcription automatique nécessite un enregistrement audio/vidéo clair et de qualité pour fonctionner correctement.
  • Les forts accents régionaux peuvent être un problème

Qu'est-ce que Wreally Transcribe ? 

transcribe_logo

Transcribe est un logiciel de transcription en SaaS, qui permet à son moteur de conversion de Speech-to-text et d'intelligence artificielle (STT-AI) d'effectuer des transcriptions.

Transcribe prend en charge les 7 formats audio suivants : mp3, wma, wav, m4a, aac, amr et mp4. Il est également possible de télécharger une vidéo YouTube directement depuis les serveurs de YouTube vers la base de données de l'application pour la transcription.

De plus, Transcribe offre un support multilingue et peut convertir des fichiers audio réalisés dans les langues suivantes : Anglais américain et britannique, mandarin, arabe, portugais, espagnol, français, allemand, hébreu, hindi, japonais, coréen, italien, néerlandais, russe, roumain, catalan et grec.

Caractéristiques.

Voici un aperçu de certaines des fonctions intégrées que Transcribe contient :

Éditeur de texte intégré.

L'éditeur de texte intégré Transcribe est synchronisé avec le lecteur multimédia de manière à permettre l'inclusion d'horodatages dans le texte, ce qui est très utile pour les discours et les sous-titres vidéo (car cela permet de synchroniser les images vidéo en fonction de leur horodatage avec le bon segment de sous-titre).

L'éditeur de texte intégré est un traitement de texte entièrement fonctionnel qui prend en charge le formatage des documents, ainsi que le formatage du texte à l'aide des options suivantes : gras, italique, souligné, création de listes et ajout d'hyperliens.

Cela permet d'éditer le document texte de manière à supprimer l'erreur et à réduire le WER à presque 0%. De plus, comme ce traitement de texte peut être configuré pour développer des caractères de sténographie spécifiques tels que imo en "à mon avis", il est considéré comme ayant une capacité de développement de mots.

Pédale de transcription.

Transcribe prend également en charge une pédale de commande. Il s'agit d'une pédale de transcription qui est utilisée comme un dispositif d'entrée pour contrôler la lecture des médias.

Dictionnaire intégré.

Transcribe utilise le dictionnaire de Google dans son éditeur de texte intégré, et pour cette raison, l'application web est mieux utilisée avec le navigateur Chrome si l'on utilise le système d'exploitation (OS) Windows ou MacOS, ou le navigateur Chromium si l'on utilise un OS Linux ou un OS basé sur BSD.

En outre, la fonction d'enregistrement automatique de l'éditeur de texte intégré sauvegarde le texte dans la mémoire cache du navigateur. Il ne faut pas vider la mémoire cache avant d'avoir exporté le texte, sous peine de perdre le texte enregistré.

Transcription multilingue.

Comme mentionné, Transcribe prend en charge la transcription multilingue car il utilise plusieurs dictionnaires, chaque dictionnaire étant spécifique à une langue particulière.

Actuellement, il prend en charge l'anglais américain et britannique, le mandarin, l'arabe, le portugais, l'espagnol, le français, l'allemand, l'hébreu, l'hindi, le japonais, le coréen, l'italien, le néerlandais, le russe, le roumain, le catalan et le grec.

Facteurs ayant un impact sur les transcriptions.

La qualité de la transcription automatique obtenue en utilisant le mode dictée est déterminée par la qualité du résidu audio qui est introduit dans le STT-AI.

Ce résidu audio est déterminé par la qualité audio du clip de mots parlés. Par conséquent, le clip audio source a un impact sur la qualité de la transcription alimentée par le VRAI effectuée par Transcribe.

Les qualités suivantes de ces clips audio source affectent la qualité de la transcription générée par la machine :

  • Qualité du son dans l'enregistrement audio ou le fichier vidéo.
  • Le bruit de fond, y compris les échos et les bruits causés par des phénomènes électriques comme une mauvaise mise à la terre de l'amplificateur du microphone. Il peut même s'agir de bruits d'usine ou de bruits de circulation.
  • L'accent du locuteur, ainsi que la nasalité, le volume et la vitesse de son discours.
  • La distance entre l'orateur et le microphone.
  • Type de codage audio utilisé.
  • Qualité du codage audio utilisé.

Comme prévu, le mode dictée élimine la plupart des défauts du fichier audio source en demandant à l'utilisateur de dicter un son propre à l'application, ce qui garantit que Transcribe fonctionne avec une entrée audio de haute qualité.

Malgré tout, si l'utilisateur ne peut pas distinguer les mots en raison d'un fort bruit de fond, d'une mauvaise qualité de la source audio et d'une incapacité à comprendre l'accent, certains mots peuvent être manqués.

De plus, il existe des fautes dépendantes du SRS qui affectent la qualité de la transcription générée par la machine. Ces défauts sont :

  • Taille et gamme de vocabulaire dans sa base de données.
  • Confusion - Le SRS peut confondre deux mots différents dont la prononciation est similaire (homonymes) ou des mots mal prononcés.
  • Contrainte syntaxique - Le système SRS contient un moteur de grammaire pour créer un texte lisible par l'homme, et ce moteur peut ignorer les erreurs syntaxiques ou les phrases maladroites telles que "la mangue a donné naissance", même si les mots sont audiblement clairs dans le discours.

D'autres facteurs ont un impact sur la qualité de la transcription générée par la machine :

Capacité à transcrire la parole continue.

De même, la capacité du STT-AI du SRS à transcrire la parole isolée et discontinue affecte la qualité de la transcription.

Normalement, dans un discours discontinu, les phrases complètes sont séparées les unes des autres par un silence, ce qui permet à Transcribe de faire immédiatement la différence entre deux phrases et d'inclure les bons signes de ponctuation.

Transcribe peut également transcrire une parole continue qui a été enregistrée à la vitesse d'une conversation humaine normale.

Cela signifie que l'on ne peut pas soumettre un clip audio jouant à x2 la vitesse normale d'une conversation pour une transcription rapide.

Capacité à transcrire un discours spontané VS un discours lu.

Ceci est déterminé par la qualité de l'inscription de l'IA qui alimente le SRS. De plus, la parole spontanée a un vocabulaire limité et contient des bégaiements, des phrases incomplètes et des interjections fréquentes (comme ah, oh, umm) ; ainsi que des sons de rire, de toux et même de mouchage !

D'autre part, le discours lu est généralement riche en vocabulaire et est fait à une vitesse de parole mesurée avec des pauses discernables entre les phrases.

C'est pour cette raison que le mode dictée exige que l'on convertisse la parole spontanée en parole de lecture en répétant ce que l'on entend à l'application.

Précision de la transcription.

L'exactitude de toute transcription générée par une machine est déterminée par le nombre d'erreurs trouvées dans cette transcription lorsqu'elle est comparée à une transcription manuelle réalisée par un spécialiste qui a reproduit exactement ce qui a été dit dans l'enregistrement audio.

Cette précision est mesurée par le taux d'erreur de mot (WER) qui peut être exprimé sous la forme d'une équation :

Précision (WER) = (Nombre d'erreurs dans les mots de la transcription générée par la machine / Nombre total de mots dans la transcription manuelle précise) x 100

Comme prévu, la transcription manuelle exacte est supposée avoir un taux de reconnaissance des mots de 100 %. De plus, le WER augmente avec la longueur du clip audio.

Pour réduire le WER, Wreally's Transcribe prend le mot reconnu par son moteur de reconnaissance vocale et fait référence à ce mot à son équivalent dans le dictionnaire pour obtenir l'orthographe, ainsi qu'une référence si la prononciation du mot parlé est proche de la prononciation du dictionnaire.

Ce référencement est effectué en utilisant l'alignement dynamique des chaînes de caractères, de sorte que chaque phénome ou caractère du mot parlé reconnu est comparé au phénome/caractère correspondant de son équivalent dans le dictionnaire.

Tarifs.

transcribe pricing 2

Sécurité.

Selon la nature du travail de transcription, la sensibilité de l'enregistrement et du texte traité peut constituer un problème de sécurité pour certains.

Un aspect intéressant de la sécurité de Transcribe est que toutes les données ne circulent pas vers le nuage dans ce service pendant l'auto-transcription. Et, de ce fait, les transcriptions d'un compte ne sont accessibles que depuis l'ordinateur où elles ont été créées.

Cette méthode a été conçue à dessein, bien que ce ne soit pas également le cas des conversions automatiques, pour lesquelles les données sonores et le texte traité sont conservés dans le nuage par nécessité.

Mais même dans ce scénario, les fichiers audio ou vidéo téléchargés sont supprimés au bout de cinq heures une fois qu'ils ont été traités, et la transcription créée peut être supprimée par l'utilisateur.

Verdict final.

De l'extérieur, il peut sembler un peu dépassé, mais Wreally a mis l'effort là où ça compte dans Transcribe.

Ils revendiquent une précision de 90% pour la transcription automatique. Dans nos tests, il a obtenu des résultats supérieurs à ce niveau si l'enregistrement source était de qualité raisonnable.

Le fait de pouvoir dicter directement les parties les plus difficiles ou les plus obscures d'un enregistrement permet de traiter de longs discours de manière relativement indolore.

Un grand nombre de langues prises en charge, des dictionnaires personnalisés, l'insertion de timecode et la possibilité de découper sélectivement l'audio dans l'interface sont autant de fonctionnalités intéressantes.

Et les nouvelles, comme l'identification d'un locuteur ou certaines des langues expérimentales, montrent que ce produit est susceptible d'être considérablement amélioré à l'avenir.

Nous avons été particulièrement impressionnés par l'outil d'auto-transcription, qui constitue une plateforme idéale pour les personnes qui reprennent des parties d'un enregistrement existant et les enrichissent de leurs propres réflexions et commentaires.

Dans l'ensemble, pour ceux qui réalisent des entretiens et ont besoin de les transcrire pour référence ultérieure, Transcribe by Wreally est une option efficace et flexible qui ne nécessite pas l'installation d'un logiciel.

Tags

Speech to Text

Vidéo marketing