Brukerveiledning

Adobe PDF

PDF-filer er et populært alternativ for lagring og utskrift av akkordskjemaer og tekstark. Du har kanskje brukt PDF-filer i årevis til å katalogisere ditt digitale bibliotek. Adobe PDF-filformatet er utmerket for å representere trykt side nøyaktig og er portabelt mellom forskjellige datamaskinplattformer. La oss se på noen utfordringer med dette filformatet og måter vi kan trekke ut tekst på for beste resultater.

Adobe PDF-filer vises «som de er» i OnSong og kan ikke redigeres, formateres eller delta i lavlys-modus. Selv om disse filene kan inneholde tekst, er den plassert på den virtuelle siden på en måte som gjør det mulig å skrive ut den, og den blir ikke lett forstått eller endret av andre apper. I tillegg kan PDF-filer også bestå av grafikk eller skannet bilder, eller en hvilken som helst kombinasjon av disse. De kan også være kryptert, noe som beskytter innholdet mot å bli ekstrahert. På grunn av dette er hver PDF-fil annerledes, så det er ingen måte å håndtere perfekt konvertering til et tekstbasert dokument.

Du kan trekke ut teksten fra en PDF-fil i OnSong ved å bruke Sangredigeringsverktøyet og trykke på knappen Trekk ut tekst i Konverteringsverktøylinjen som vises før skjermtastaturet blir vist. OnSong vil forsøke å trekke ut teksten fra PDF-filen først, og hvis ingen tekst er tilgjengelig, vil den behandle filen ved hjelp av optisk tegngjenkjenning (OCR). Resultatet vil mest sannsynlig ende med tekst, men du må gjennomgå og justere teksten til et filformat som OnSong forstår. I tillegg, hvis filen var kryptert, kan resultatet av ekstraksjonen resultere i ødelagte tegn. Disse filene kan ikke ekstraheres på grunn av beskyttelsen som er brukt på dem av forfatterprogramvaren.

Her er noen problemer du kan ha med ekstraherte PDF-filer:

Dårlig mellomrom

Du kan oppdage at noe tekst er plassert i feil rekkefølge, eller med dårlig mellomrom. Dette er fordi PDF-filer kan bruke tekstsnarveier for å justere tekst ved hjelp av flere tekstfragmenter. OnSong arbeider for å plassere disse tekstfragmentene i nærheten av hverandre ved hjelp av beregninger av rammenærhet, men det kan fremdeles være problemer som krever at du manuelt korrigerer dette.

Akkorder med ekstra mellomrom

Hver akkordskjema opprettes annerledes avhengig av forfatteren og programvaren som brukes. For eksempel kan den opprinnelige filen ha brukt flere mellomromskarakterer for å justere akkorder over teksten. Hvis en variabel bredde skrift brukes, kan dette resultere i mange flere mellomrom enn teksten nedenfor. Bruk Rett opp justeringsmellomrom som finnes i Tekstverktøy-menyen som finnes i Menylinja i Sangredigeringsverktøyet for å bringe disse akkordene nærmere deres posisjon og deretter justere manuelt etter behov.

Komprimerte akkorder

Et annet problem kan være akkorder som er for tett sammen på en linje over akkordene. Dette kan skje hvis akkorder opprinnelig var plassert i tekstbokser og deretter justert over akkorder. Du må manuelt justere disse akkordene over den tilsvarende teksten i Sangredigeringsverktøyet.

Ødelagte tegn

Hvis du forsøker å trekke ut tekst fra et kryptert PDF-dokument, kan det resultere i et skjermbilde fullt av tegn. Du må tilbakestille ekstraksjonen eller avbryte Sangredigeringsverktøyet og finne en annen måte å trekke ut tekst på.

Ugjenkjente tegn

Hvis OnSong ikke kan trekke ut teksten fra dokumentet direkte, kan det trenge å sende dokumentet til optisk tegngjenkjenning (OCR). Dette betyr at en datamaskin vil forsøke å «lese» dokumentet visuelt. Avhengig av kvaliteten på PDF-en, kan dette resultere i at det brukes feil tegn. For eksempel, hvis dokumentet ditt hadde et symbol for flat, kan det tolkes som små bokstav «b», eller hvis PDF-en var skannet, kan falmet tekst resultere i andre tegn. Gjennomgå dokumentet og gjør disse manuelle endringene etter behov i Sangredigeringsverktøyet.

OnSong 2023 — Sist oppdatert January 13, 2020