Gebruikershandleiding

Adobe PDF

PDF-bestanden zijn een populaire optie voor het opslaan en afdrukken van akkoordschema's en liedtekstbladen. U hebt PDF-bestanden mogelijk al jaren gebruikt om uw digitale bibliotheek in te delen. De Adobe PDF-bestandsindeling is ideaal voor nauwkeurig weergeven van de afgedrukte pagina en is draagbaar tussen verschillende computerplatforms. Laten we enkele uitdagingen met dit bestandsformaat bekijken en manieren waarop we tekst kunnen extraheren voor de beste resultaten.

Adobe PDF-bestanden worden "ongewijzigd" in OnSong weergegeven en kunnen niet worden bewerkt, opgemaakt of deelnemen aan low light mode. Hoewel deze bestanden tekst kunnen bevatten, is deze op de virtuele pagina geplaatst op een manier die het mogelijk maakt om af te drukken, maar niet gemakkelijk door andere apps te begrijpen of aan te passen. Daarnaast kunnen PDF-bestanden ook uit afbeeldingen of gescande afbeeldingen bestaan, of een combinatie daarvan. Ze kunnen ook versleuteld zijn, wat hun inhoud beschermt tegen extractie. Daarom is elk PDF-bestand anders, dus er is geen manier om perfecte conversie naar een tekstgebaseerd document uit te voeren.

U kunt de tekst van een PDF-bestand in OnSong extraheren met behulp van de Song Editor en door te tikken op de knop Extract Text in de Conversion Toolbar die verschijnt voordat het schermtoetsenbord wordt weergegeven. OnSong zal eerst proberen de tekst uit het PDF-bestand te extraheren, en als er geen tekst beschikbaar is, zal het bestand worden verwerkt met optische tekenherkenning (OCR). Het resultaat zal waarschijnlijk eindigen met tekst, maar u moet de tekst controleren en aanpassen in een bestandsindeling die OnSong begrijpt. Bovendien kan het resultaat van de extractie garbled characters opleveren als het bestand was versleuteld. Deze bestanden kunnen niet worden geëxtraheerd vanwege de bescherming die door de authoring-software wordt toegepast.

Hier zijn enkele problemen die u kunt hebben met geëxtraheerde PDF-bestanden:

Slechte afstand

U kunt zien dat bepaalde tekst niet in de juiste volgorde staat of slecht is verdeeld. Dit komt omdat PDF-bestanden tekstsnelkoppelingen kunnen gebruiken om tekst uit te lijnen met behulp van meerdere tekstfragmenten. OnSong probeert deze tekstfragmenten dicht bij elkaar te plaatsen met behulp van frameproximiteitberekeningen, maar er kunnen nog steeds problemen optreden waarvoor u handmatig moet corrigeren.

Akkoorden met extra spaties

Elk akkoordschema wordt anders gemaakt, afhankelijk van de auteur en de gebruikte software. Het oorspronkelijke bestand kan bijvoorbeeld meerdere spatietekens hebben gebruikt om akkoorden boven liedteksten uit te lijnen. Als een lettertype met variabele breedte wordt gebruikt, kan dit resulteren in veel meer spaties dan de liedteksten eronder. Gebruik Fix Alignment Spaces in het Text Tools Menu in de Menubar van de Song Editor om die akkoorden dichter bij hun positie te brengen en pas deze vervolgens handmatig aan.

Samengedrukte akkoorden

Een ander probleem kan zijn dat akkoorden te dicht bij elkaar op een regel boven de akkoorden staan. Dit kan gebeuren als akkoorden oorspronkelijk in tekstvakken zijn geplaatst en vervolgens boven akkoorden zijn uitgelijnd. U moet deze akkoorden handmatig boven de bijbehorende liedteksten uitlijnen in de Song Editor.

Garbled characters

Als u probeert tekst uit een versleuteld PDF-document te extraheren, kan dit resulteren in een scherm vol karakters. U moet het extractieproces terugdraaien of uit de Song Editor sluiten en een ander mannier zoeken om tekst te extraheren.

Niet-herkende karakters

Als OnSong de tekst niet rechtstreeks uit het document kan extraheren, kan het nodig zijn het document in te dienen voor optische tekenherkenning (OCR). Dit betekent dat een computer het document visueel zal proberen "lezen". Afhankelijk van de kwaliteit van de PDF, kan dit resulteren in het gebruik van het onjuiste teken. Als uw document bijvoorbeeld een platsymbool had, kan het worden geïnterpreteerd als een kleine letter "b", of als de PDF was gescand, kan vervagde tekst andere karakters opleveren. Bekijk het document en breng deze handmatige wijzigingen waar nodig aan in de Song Editor.

OnSong 2026 — Laatst bijgewerkt op January 13, 2020