Uživatelská příručka

Adobe PDF

Soubory PDF jsou populární možností pro ukládání a tisk akordových schémat a listů s texty. Možná jste používali soubory PDF již léta k katalogizaci své digitální knihovny. Formát souboru Adobe PDF je skvělý pro přesné reprezentaci tištěné stránky a je přenosný mezi různými počítačovými platformami. Pojďme se podívat na některé problémy s tímto formátem souboru a způsoby, jak můžeme extrahovat text pro dosažení nejlepších výsledků.

Soubory Adobe PDF jsou v aplikaci OnSong zobrazovány „tak jak jsou" a nelze je upravovat, formátovat ani účastnit se režimu slabého osvětlení. Ačkoli tyto soubory mohou obsahovat text, je umístěn na virtuální stránce způsobem, který jej umožňuje tisknout, a ne snadno pochopit nebo upravit jinými aplikacemi. Kromě toho mohou soubory PDF také obsahovat grafiku nebo naskenované obrázky, nebo jakoukoli jejich kombinaci. Mohou být také zašifrovány, což chrání jejich obsah před extrakcí. Z tohoto důvodu je každý soubor PDF jiný, takže neexistuje způsob, jak dosáhnout dokonalé konverze do textového dokumentu.

Text souboru PDF můžete extrahovat v aplikaci OnSong pomocí Editor písní a klepnutím na tlačítko Extrahovat text v panelu Nástrojů pro konverzi, který se zobrazí před zjevením se klávesnice na obrazovce. Aplikace OnSong se nejprve pokusí extrahovat text ze souboru PDF, a pokud není k dispozici žádný text, bude soubor zpracován pomocí optického rozpoznávání znaků (OCR). Výsledek se velmi pravděpodobně skončí textem, ale budete muset zkontrolovat a upravit text na formát souboru, kterému aplikace OnSong rozumí. Navíc, pokud byl soubor zašifrován, výsledek extrakce může vést k zkomoleným znakům. Tyto soubory nelze extrahovat kvůli ochraně, kterou jim aplikuje autorský software.

Zde jsou některé problémy, které se vám mohou vyskytnout s extrahovanými soubory PDF:

Špatné rozestupy

Můžete zjistit, že některý text je umístěn mimo pořadí nebo se špatným rozestupem. To je proto, že soubory PDF mohou používat zkratky pro zarovnání textu pomocí více textových fragmentů. Aplikace OnSong pracuje na umístění těchto textových fragmentů blízko sebe pomocí výpočtů proximity rámce, ale stále mohou existovat problémy, které vyžadují vaši ruční opravu.

Akordy s dalšími mezerami

Každé akordové schéma je vytvářeno různě v závislosti na autorovi a použitém softwaru. Například původní soubor mohl mít více znaků mezery použitých k zarovnání akordů nad textem. Pokud je použit font s proměnnou šířkou, může to vést k použití mnohem více mezer než textu níže. Použijte Opravit mezery zarovnání nalezené v Nabídce nástrojů textu nalezené v Nabídce v Editoru písní a přibližte tyto akordy zpět k jejich pozici a poté ručně upravte podle potřeby.

Komprimované akordy

Dalším problémem mohou být akordy, které jsou příliš blízko sebe na řádku nad akordy. To se může stát, pokud byly akordy původně umístěny do textových polí a poté zarovnány nad akordy. Budete muset ručně zarovnat tyto akordy nad odpovídajícím textem v Editoru písní.

Zkomolené znaky

Pokud se pokusíte extrahovat text ze zašifrovaného dokumentu PDF, může to vést k obrazovce plné znaků. Budete muset vrátit proces extrakce zpět nebo zavřít Editor písní a najít jiný způsob extrakce textu.

Nerozpoznané znaky

Pokud aplikace OnSong nemůže extrahovat text z dokumentu přímo, může jej potřebovat odeslat optickému rozpoznávání znaků (OCR). To znamená, že počítač se bude pokoušet »čtení« dokumentu vizuálně. V závislosti na kvalitě PDF to může vést k použití nesprávného znaku. Například, pokud váš dokument měl symbol béčka, může být interpretován jako malé písmeno „b", nebo pokud byl PDF naskenován, slabý text může vést k jiným znakům. Zkontrolujte dokument a proveďte tyto ruční změny podle potřeby v Editoru písní.

OnSong 2026 — Poslední aktualizace: January 13, 2020