en fr ru
Installation du YazikRecorder
- Si vous utilisez les paquets debian sur une machine debian ou ubuntu, c'est très facile et il vous suffit de suivre les instructions données sur la page de téléchargement.
- Dans les autres cas, il vous faudra récupérer les sources sur le serveur svn: http://www.yojik.eu/svn, module yazik2. Copiez ces sources dans le répertoire de votre choix, allez dans le répertoire yazik2 et tapez:
python yazikrecorder.py
Ce dont il vous faudra tenir compte sont les librairies nécessaires au fonctionnement du programme. Il vous faudra installer la librairie gstreamer complète avec tous ses plugins, ainsi que certains modules python. Si certains sont manquants, vous verrez le message d'erreur dans le terminal. Installez les librairies manquantes et le programme fonctionnera correctement.
Utilisation du YazikRecorder
Lancez le programme:
le splashscreen s'affiche temporairement pendant l'initialisation des répertoires de travail. Il s'efface et apparaît l'écran principal de l'enregistreur.
Fenêtre principale
La fenêtre principale comporte 4 onglets: nous allons voir comment renseigner les différents champs.
Nous avons 3 zones de saisie: la plus grande permet d'entrer vos listes de mots/phrases, soit directement en les tapant dans la fenêtre correspondante, soit par drag and drop à partir du gestionnaire de fichiers si vous avez au préalable préparé une liste de mots (utf-8).
Cette liste peut comporter des commentaires qui commencent par le caractère "#":tout ce qui suit ce caractère est ignoré, mais sauvegardé dans la liste.
Vous pouvez également utiliser le bouton "ouvrir" qui va lancer un navigateur de fichiers: choisissez votre liste et cliquez sur "ok".
Nous avons donc 3 manières de saisir une liste de mots: directe, avec un navigateur de fichier ou par drag and drop.
Il nous reste 2 champs à renseigner:
- le champ "language": permet de spécifier la langue de le liste de mots (des mots russes ou français par exemple): vous ne pouvez pas saisir n'importe quoi: le code de langue respecte et vérifie le codage ISO des langues. Vous pouvez voir les codages en cliquant sur "..." situé à droite du champ de saisie; en double-cliquant sur votre choix, il va apparaître dans le champ désiré. N'oubliez pas de valider ensuite par un retour chariot. En cas d'erreur, le champ s'entoure de rouge. Vous ne pourrez sauver votre projet tant que cette zone n'est pas renseignée correctement.
- Juste en-dessous, vous avez un bouton qui permet de spécifier si vous voulez ré-enregistrer tous les mots, même ceux déjà enregistrés ou n'enregistrer que les nouveaux mots de la liste (certains mots peuvent faire partie de plusieurs listes).
Il nous permet de saisir les données du locuteur ainsi que le copyright et license qui s'applique aux enregistrements effecués.
- Premier champ:le nom du locuteur: ce champ présente une particularité: après avoir tapé la première lettre de votre nom, si vous aviez préalablement saisi ces informations, le nom ou les noms qui correspondent à cette première lettre vont apparaître dans une liste déroulante; choisissez alors le nom correspondant. Tous les champs "locuteur" déjà saisis seront renseignés.
- Deuxième champ: la ville où le locuteur habite.
- Troisème champ: le pays où habite le locuteur. (ici, vous ne pourrez saisir n'importe quoi; le code doit correspondre au code ISO. En cliquant sur les "..." à droite du champ, vous aurez la liste des pays avec le codage correspondant. Un double clic permet de choisir. Il y a aussi complétion dans le champ lui-même: tapez la première lettre et une liste apparaît.
- Quatrième champ: le sexe du locuteur.
- Cinquième champ: année de naissance du locuteur.
- Sixième champ: langue maternelle du locuteur. (même remarque que dans l'onglet précédent sur le choix du codage).
- Septième champ: la région d'habitation du locuteur.
- Huitième champ: le pays d'acquisition de la langue maternelle. (même remarque quant au choix du codage que précédemment)
- Neuvième champ: la license sous laquelle seront diffusés les enregistrements. Vous pouvez soit choisir une des licenses préalablement déterminées soit saisir une license personnelle.
- Dixième champ: le copyright qui s'applique à ces enregistrements.
Cet onglet nous permet d'indiquer quels types de fichiers nous voulons obtenir (leur format), le nom de la liste (qui correspond aussi au nom du projet) ainsi que la génération des fichiers accessoires (fichiers index au format "txt" ou "xml".)
Voyons ensemble les différents champs:
- Premier champ: le répertoire dans lequel seront sauvés les fichiers audio générés ainsi que les fichiers index.
- Deuxième champ: le style de nommage des fichiers audio; le style yazik et shtooka sont très proches et utilisent un codage CRC32 des textes de l'enregistrement, associés suivant le cas avec des données de langue. Le style Wikidictionnary utilise le texte (avec les espaces transformés en caractère souligné) comme nom de fichier. Cela vous permet d'avoir directement des fichiers audio au format voulu par Wikidictionnary.
- Troisième champ: 3 cases à cocher: génération de fichiers au format mp3, ogg ou flac. Choisissez ce que vous voulez.
- Quatrième champ: le nom de la liste (et incidemment du projet)
- Cinquième et sixième champ: cochez l'ensemble des cases pour générer les index au format txt et xml.
Il correspond aux données de la collection: un chmap descriptif (long), un champ descriptif court, la section dans laquelle ranger la collection et l'auteur de la collection. Rien de bien extraordinaire.
Les 2 champs suivants permettent de spécifier, un la qualité de l'enregistrement (dépendant de la qualité du matériel audio utilisé ainsi que des conditions d'enregistrement) et la vitesse de prononciation des mots/phrases: normale, basse ou rapide.
Une fois toutes ces données saisies, cliquez sur "save project": tout sera sauvegardé sur disque. Vous pourrez rappeler le projet en cliquant sur "open project": un choix de projets déjà enregistrés vous sera proposé. Tous les champs préalablement remplis seront renseignés. Vous pourrez reprendre votre projet d'enregistrement là où vous l'avez laissé la fois précédente (enregistrer des milliers de mots peut être très long, vous pourrez donc diviser votre travail en plusieurs séances).
Fenêtre d'enregistrement
Cliquez ensuite sur "enregistrer" (en bas): la fenêtre d'enregistrement apparaît!
Sautez directement à la partie: début d'un enregistrement audio et revenez ici pour les détails.
Il y a quatre zones:
- La zone centrale graphique: elle montre le niveau audio de l'enregistrement en cours avec des zones colorées pour le temps de pré-enregistrement, le temps minimal d'enregistrement. Des lignes horizontales indiquent également la zone de saturation (en rouge en haut), le niveau de déclenchement (threshold), et le niveau de bruit. Toutes ces valeurs sont ajustables dans les préférences. Nous verrons comment les modifier dans la suite du document.
- La zone de boutons: située sous la zone graphique, se comporte comme les boutons d'un enregistreur classique: on clique sur "enregistrer" pour commencer l'enregistrement, sur "pause" pour faire une pause: certains boutons ne sont utilisables que dans ce mode (en grisé sinon et inactifs); c'est en pause que vous pourrez utiliser les boutons "suivant et précédent" pour choisir quel mot à ré-enregistrer.
- La zone à droite verticale: se remplit au fur et à mesure des enregistrements avec le nom (CRC32) du fichier ainsi que le texte correspondant.
- La zone située au-dessus de la zone graphique: elle contient la liste de mots à enregistrer; le mot en cours est d'une couleur différente des autres (les couleurs sont également configurables dans la fenêtre des préférences). Dans le menu principal, option "edit", vous pouvez chosir si vous voulez votre liste de mots "les uns après les autres" ou un mot par ligne. La méthode "un mot par ligne" est utile pour l'enregistrement de phrases surtout.
Toutes les zones sont redimensionnables gràce à l'utilisation de panneaux ajustables. (seul défaut, le réglage n'est pas (encore) conservé).
Fenêtre de paramètrage
Vous accédez à cette fenêtre dans le menu "edit->préférences". Cette fenêtre est composée de 4 onglets qui permettent de régler les paramètres d'enregistrement (seuil, bruit, temps de pré-enregistrement, longueur minimale d'un son), des paramètres de couleurs pour la zone graphiqe et la vue de la liste de mots, ainsi que les paramètrages matériels (choix de la carte son, et des paramètres d'échantillonage)
Paramètres d'enregistrement:
- Première zone de saisie: cette valeur correspond à la fréquence d'échantillonage pour l'affichage graphique. Il vaut mieux ne pas y toucher, même si cela ne changera rien à l'enregistrement lui-même. (mais peut avoir une influence sur la détection de la saturation)
- Deuxième zone de saisie: c'est le seuil en décibel de déclenchement de l'enregistrement. Vous pouvez avoir à modifier cette valeur suivant les conditions sonores d'enregistrement (bruit ambient important).
- Troisème zone de saisie:longuer de l'enregistrement en secondes, Pour l'enregsitrement de mots courts, cette valeur peut être diminuée, mais pour l'enregistrement de phrases avec des périodes de pause, vous devrez l'augmenter quelque peu (à expérimenter).
- Quatrième zone de saisie: cette valeur correspond au temps d'enregistrement qui précède le déclenchement et qui est incroporé à l'enregistrement final. Si les mots commencent par des chuintantes ou des sons de niveau faible, il faut augmenter cette valeur pour que tout soit compris dans l'enregistrement.
- Cinquième zone de saisie: temps minimal pour un enregistrement: ce temps permet d'éviter d'enregistrer comme "mot" un son ou bruit de longieur faible (bruits de bouche, langue etc ...)
- Sixième zone de saisie: leaky ... alors là .... je laisse à True, mais essayez à False pour expérimenter ...
Paramètres d'enregistrement et apparence.
- Première zone de saisie: le niveau de bruit maximum.
- Deuxième zone de saisie: la longuer en secondes d'un élément indivisible d'affichage. (n'y changez rien ...)
- Troisème et quatrième zone de saisie: l'étendue de l'affichage en décibel. n'y changez rien non plus.
- Les 4 zones suivantes permettent de personnaliser les couleurs des zones et des lignes d'information (saturation, threshold).
- La cinquième zone de saisie permet de changer la fonte d'affichage des caractères de la zone graphique. Vous pouvez être amenés à la changer pour des affichages très grands ou très petits.
Propriétés d'afficage de la liste de mots. Ces différents champs permettent de personnaliser les couleurs du mot en cours d'enregistrement et des autres mots de la liste. Là, votre choix est libre ... et faites comme il vous semblera le mieux. Vous pouvez également modifier la fonte utilisée pour l'affichage de ces mots.
paramètres matériels de votre carte son.
- Champ 1: la carte son utilisée pour l'entrée micro; ce n'est utile que si vous disposez de plusieurs cartes sons sur votre machine, typiquement, la carte son intégrée à la carte mère et une carte son de qualité en USB ou insérée dans la machine. Pour une qualité d'enregistrement optimale, des cartes son externes (USB ou Firewire) sont recommandées. Elles permettent de diminuer le bruit de fond ainsi que les parasites électriques.
- Champ 2: fréquence d'échantillonage: les différentes valeurs disponibles sont affichées dans la liste déroulante. La valeur de 44100 Hz est une valeur standard de qualité, mais d'autres valeurs supérieures peuvent être utilisées sur des cartes son de qualité.
- Champ 3: format audio d'enregistrement; sur 8,16 ou 24 bits habituellement. La valeur de 16 bits est celle utilisée pour les Ís audio, donc très correcte.
- Champ 4: le périphérique de sortie audio: soit celui de votre carte mère, soit celui de votre super carte son additionnelle. ;)
Voilà, nous avons fait le tour de la fenêtre de paramètrage. Un défaut de cette fenêtre est qu'il vaut mieux après modifications des valeurs, enregistrer (bouton enregistrer) ces paramètres, fermer la fenêtre et relancer la fenêtre d'enregistrement. Le bouton "appliquer" ne fonctionne que pour certains champs ... (c'est dans la liste des TODOs)
Enregistrement
Une fois les données de la première fenêtre saisies, passez sur la fenêtre enregistrement (bouton enregistrer).
Redimensionnez les panneaux pour avoir une zone de travail agréable.
le liste de mots à enregistrer apparaît dans la partie du haut, avec le prmeier mot en surbrillance.
Cliquez sur le bouton "enregistrer" en bas, et les fichiers correspondants aux sons vont être affichés dans la liste de droite.
Une fois tous les enregistrements effectués, vous pouvez fermer la fenêtre (bouton fermer).
La fenêtre d'enregistrement se ferme et vous retrouvez le premier écran.
Cliquez ensuite sur le bouton "générer: le programme va générer et tagguer tous les enregistrements audio. Cliquez sur "OK" quand cette fenêtre de dialogue vous le demande.
Allez ensuite sur le menu principal, option Audio: 2 choix se présentent à vous: cliquez sur Edition des fichiers audio. Une fenêtre s'ouvre:
Fenêtre d'édition et affichage des fichiers audio
Redimensionnez les panneaux comme vous l'entendez: les dimensions dépendant grandement des fontes de caractères utilisées sur le système.
Là, 2 panneaux principaux avec une zone de boutons :)
- Panneau de gauche: il affiche la liste des enregistrements audio. il vous donne 3 informations: une case à cocher dont nous verrons l'utilité par la suite, le texte ou mot ou phrase enregistré, et le nom du fichier (CRC32). La case à cocher permet lors de l'écoute successive des enregistrements de noter ceux à supprimer. Si vous avez coché une case, une fenêtre de dialogue s'affichera après avoir cliqué sur le bouton "del" pour vous demander de confirmer l'effacement des fichiers marqués.
- Panneau de droite: il affiche les tags sur 2 onglets: les tags communs à tous les enregistrements sur le premier onglet et les tags spécifiques à chaque enregistrement dans le deuxième onglet.
- La barre d'outils: ici, 3 zones principales:
- zone 1: 4 boutons radio permettent de chosir les fichiers enregistrés (soit les "flacs" d'origine (bouton tmp) soit les "ogg", "mp3" et "flac" définitifs (et taggués). Une case à cocher existe dans tous les cas et permet de choisir de les effacer sélectivement. Le bouton par défaut (tmp) est particulier dans le sens où il permet en effaçant certains fichiers de pouvoir automatiquement les ré-enregistrer dès la fermeture de cette fenêtre.
- zone 2: elle n'est constituée que d'un bouton : écoute ;)
- zone 3: 2 boutons qui permettent de passer d'un enregistrement à l'autre, mais le clic de souris fonctionne également.
- zone 4: le bouton suppression dont nous avons déjà parlé (il sera parfois nécessaire de cliquer plusieurs fois dessus pour que tous les fichiers marqués soient effacés (ce bug est dans le TODO ...)
- zone 5: un bouton pour fermer la fenêtre.
Suite à l'écoute des enregistrements et à l'effacement des enregistrements défectueux, vous pouvez reprendre le cycle d'enregistrement/écoute/vérification en n'oubliant pas de cliquer sur "adding new only" pour éviter d'avoir à tout ré-enregistrer.
Voilà la fin du manuel d'utilisation. Un graphique des opérations sera inclus très prochainement ainsi que des captures d'écran pour "égayer" cette présentation.