Podręcznik użytkownika
Adobe PDF
Pliki PDF są popularnym sposobem przechowywania i drukowania arkuszy akordów i tekstów piosenek. Możliwe, że od lat używasz plików PDF do katalogowania swojej cyfrowej biblioteki. Format pliku Adobe PDF jest doskonały do precyzyjnego odtwarzania drukowanej strony i jest przenośny między różnymi platformami komputerowymi. Przyjrzyjmy się niektórym wyzwaniom związanym z tym formatem pliku i sposobom na ekstraktowanie tekstu w celu uzyskania najlepszych wyników.
Pliki Adobe PDF są wyświetlane „bez zmian" w OnSong i nie mogą być edytowane, formatowane ani uczestniczyć w trybie niskiego oświetlenia. Chociaż te pliki mogą zawierać tekst, jest on umieszczony na wirtualnej stronie w taki sposób, aby można go było wydrukować, a nie aby łatwo zrozumieć lub zmodyfikować przez inne aplikacje. Ponadto pliki PDF mogą również składać się z grafiki lub zeskanowanych obrazów albo dowolnej kombinacji tych elementów. Mogą być również zaszyfrowane, co chroni ich zawartość przed ekstraktowaniem. Z tego powodu każdy plik PDF jest inny, więc nie ma sposobu na doskonałą konwersję na dokument oparty na tekście.
Możesz ekstraktować tekst z pliku PDF w OnSong, korzystając z Edytora piosenki i naciskając przycisk Ekstraktuj tekst w Pasku narzędzi konwersji, który pojawia się przed ujawnieniem klawiatury ekranowej. OnSong będzie najpierw próbować ekstraktować tekst z pliku PDF, a jeśli tekst nie będzie dostępny, plik będzie przetwarzany za pomocą optycznego rozpoznawania znaków (OCR). Wynikiem będzie prawdopodobnie tekst, ale będziesz musiał przejrzeć i dostosować tekst do formatu pliku, który OnSong rozumie. Ponadto, jeśli plik został zaszyfrowany, wynik ekstraktowania może skutkować zniekształconymi znakami. Te pliki nie mogą być ekstraktowane ze względu na ochronę zastosowaną przez oprogramowanie autorskie.
Oto kilka problemów, które możesz mieć z ekstraktowanymi plikami PDF:
Złe odstępy
Możesz stwierdzić, że niektóry tekst jest umieszczony poza kolejnością lub ze słabymi odstępami. Dzieje się tak, ponieważ pliki PDF mogą używać skrótów tekstowych do wyrównania tekstu przy użyciu wielu fragmentów tekstu. OnSong pracuje nad umieszczeniem tych fragmentów tekstu blisko siebie za pomocą obliczeń bliskości ramki, ale mogą nadal występować problemy wymagające ręcznej korekcji.
Akordy z dodatkowymi spacjami
Każdy arkusz akordów jest tworzony inaczej w zависności od autora i używanego oprogramowania. Na przykład oryginalny plik może miał wiele znaków spacji używanych do wyrównania akordów powyżej tekstów. Jeśli zostanie użyta czcionka o zmiennej szerokości, może to skutkować użyciem znacznie więcej spacji niż tekst poniżej. Użyj Napraw odstępy wyrównania znajdującego się w Menu narzędzi tekstowych dostępnym w Pasku menu Edytora piosenki, aby przywrócić te akordy bliżej ich pozycji, a następnie dostosować ręcznie w razie potrzeby.
Ściśnięte akordy
Innym problemem mogą być akordy znajdujące się zbyt blisko siebie na linii powyżej akordów. Może się to zdarzyć, jeśli akordy były pierwotnie umieszczone w polach tekstowych, a następnie wyrównane powyżej akordów. Będziesz musiał ręcznie wyrównać te akordy nad odpowiednimi tekstami w Edytorze piosenki.
Zniekształcone znaki
Jeśli spróbujesz ekstraktować tekst z zaszyfrowanego dokumentu PDF, może to skutkować ekranem pełnym znaków. Będziesz musiał wycofać proces ekstraktowania lub zamknąć Edytor piosenki i znaleźć inny sposób na ekstraktowanie tekstu.
Nierozpoznane znaki
Jeśli OnSong nie może ekstraktować tekstu z dokumentu bezpośrednio, może być konieczne przesłanie dokumentu do optycznego rozpoznawania znaków (OCR). Oznacza to, że komputer będzie próbować „czytać" dokument wizualnie. W zależności od jakości pliku PDF może to skutkować użyciem niewłaściwego znaku. Na przykład, jeśli Twój dokument miał symbol bemola, może być zinterpretowany jako mała litera „b", lub jeśli plik PDF był zeskanowany, zanikający tekst może skutkować innymi znakami. Przejrzyj dokument i dokonaj tych zmian ręcznie w razie potrzeby w Edytorze piosenki.