Manuel d’utilisation
Adobe PDF
Les fichiers PDF sont une option populaire pour stocker et imprimer des diagrammes d'accords et des feuilles de paroles. Vous utilisez peut-être des fichiers PDF depuis des années pour cataloguer votre bibliothèque numérique. Le format de fichier Adobe PDF est excellent pour représenter avec précision la page imprimée et il est portable entre différentes plates-formes informatiques. Examinons quelques défis avec ce format de fichier et les façons dont nous pouvons extraire du texte pour obtenir les meilleurs résultats.
Les fichiers Adobe PDF sont affichés « en l'état » dans OnSong et ne peuvent pas être modifiés, formatés ou participer au mode faible luminosité. Bien que ces fichiers puissent contenir du texte, celui-ci est placé sur la page virtuelle de manière à permettre son impression, et non facilement compris ou modifié par d'autres applications. De plus, les fichiers PDF peuvent également être composés de graphiques ou d'images numérisées, ou de toute combinaison de ceux-ci. Ils peuvent également être chiffrés, protégeant leur contenu contre l'extraction. Pour cette raison, chaque fichier PDF est différent, il n'y a donc aucun moyen de gérer une conversion parfaite en un document basé sur du texte.
Vous pouvez extraire le texte d'un fichier PDF dans OnSong en utilisant l'Éditeur de chanson et en appuyant sur le bouton Extraire le texte dans la Barre d'outils de conversion qui apparaît avant que le clavier à l'écran ne soit révélé. OnSong tentera d'abord d'extraire le texte du fichier PDF, et si aucun texte n'est disponible, il traitera le fichier à l'aide de la reconnaissance optique de caractères (OCR). Le résultat se terminera très probablement par du texte, mais vous devrez examiner et ajuster le texte dans un format de fichier qu'OnSong comprend. De plus, si le fichier était chiffré, le résultat de l'extraction peut aboutir à des caractères brouillés. Ces fichiers ne peuvent pas être extraits en raison de la protection qui leur est appliquée par le logiciel d'auteur.
Voici quelques problèmes que vous pourriez rencontrer avec les fichiers PDF extraits :
Espacement incorrect
Vous remarquerez peut-être que certains textes sont placés hors de l'ordre ou avec un espacement médiocre. Cela est dû au fait que les fichiers PDF peuvent utiliser des raccourcis de texte pour aligner le texte en utilisant plusieurs fragments de texte. OnSong s'efforce de placer ces fragments de texte à proximité les uns des autres en utilisant des calculs de proximité de cadre, mais il peut y avoir encore des problèmes qui vous obligent à corriger manuellement.
Accords avec des espaces supplémentaires
Chaque diagramme d'accord est créé différemment selon l'auteur et le logiciel utilisé. Par exemple, le fichier d'origine peut avoir utilisé plusieurs caractères d'espacement pour aligner les accords au-dessus des paroles. Si une police de largeur variable est utilisée, cela peut entraîner l'utilisation de beaucoup plus d'espaces que les paroles ci-dessous. Utilisez Corriger les espaces d'alignement trouvé dans le Menu Outils de texte trouvé dans la Barre de menu de l'Éditeur de chanson pour rapprocher ces accords de leur position, puis ajustez manuellement si nécessaire.
Accords comprimés
Un autre problème peut être les accords qui sont trop proches l'un de l'autre sur une ligne au-dessus des accords. Cela peut se produire si les accords ont été placés à l'origine dans des zones de texte, puis alignés au-dessus des accords. Vous devrez aligner manuellement ces accords au-dessus des paroles correspondantes dans l'Éditeur de chanson.
Caractères brouillés
Si vous tentez d'extraire du texte d'un document PDF chiffré, cela peut entraîner un écran plein de caractères. Vous devrez annuler le processus d'extraction ou fermer l'Éditeur de chanson et trouver une autre façon d'extraire le texte.
Caractères non reconnus
Si OnSong ne peut pas extraire le texte du document directement, il peut avoir besoin de soumettre le document à la reconnaissance optique de caractères (OCR). Cela signifie qu'un ordinateur tentera de « lire » le document visuellement. Selon la qualité du PDF, cela peut entraîner l'utilisation d'un caractère incorrect. Par exemple, si votre document avait un symbole bémol, il peut être interprété comme une lettre minuscule « b », ou si le PDF a été numérisé, le texte estompé peut entraîner d'autres caractères. Examinez le document et apportez ces modifications manuellement si nécessaire dans l'Éditeur de chanson.