ユーザーマニュアル
Adobe PDF
PDFファイルは、コードチャートと歌詞シートを保存および印刷するための一般的なオプションです。PDFファイルを何年も使用してデジタルライブラリをカタログ化していたかもしれません。Adobe PDFファイル形式は、印刷されたページを正確に表現し、異なるコンピュータプラットフォーム間で携帯性に優れています。このファイル形式の課題と、最適な結果を得るためにテキストを抽出する方法を見てみましょう。
Adobe PDFファイルはOnSongで「そのまま」表示され、編集、フォーマット、または低光モードに参加することはできません。これらのファイルにテキストが含まれている場合がありますが、印刷を可能にするために仮想ページに配置されており、他のアプリが容易に理解または変更することはできません。さらに、PDFファイルはグラフィックスまたはスキャンされた画像、またはこれらの任意の組み合わせで構成することもできます。また、暗号化されて、その内容が抽出されないように保護することもできます。このため、すべてのPDFファイルは異なるため、テキストベースのドキュメントへの完全な変換を処理する方法はありません。
Song Editorを使用してOnSong内でPDFファイルのテキストを抽出し、オンスクリーンキーボードが表示される前に表示されるConversion ToolbarのExtract Textボタンをタップできます。OnSongはまずPDFファイルからテキストを抽出しようとし、テキストが利用できない場合は、光学文字認識(OCR)を使用してファイルを処理します。結果は最終的にテキストで終わる可能性が高いですが、テキストをOnSongが理解できるファイル形式に確認して調整する必要があります。さらに、ファイルが暗号化されていた場合、抽出の結果は文字化けに終わる可能性があります。これらのファイルは、作成ソフトウェアによって適用された保護のため、抽出できません。
抽出されたPDFファイルで発生する可能性のある問題をいくつか紹介します。
悪いスペース
テキストが順序外で配置されている、またはスペースが不足している場合があります。これは、PDFファイルがテキストショートカットを使用してテキスを複数のテキストフラグメントを使用して配置する可能性があるためです。OnSongはフレーム近接計算を使用してこれらのテキストフラグメントを互いに近づけようとしますが、手動で修正する必要がある問題がある場合があります。
余分なスペースのあるコード
すべてのコードチャートは、作成者と使用されるソフトウェアに応じて異なる方法で作成されます。たとえば、元のファイルは、歌詞の上にコードを配置するために複数のスペース文字が使用されていた可能性があります。可変幅フォントが使用されている場合、これにより、以下の歌詞よりもはるかに多くのスペースが使用される可能性があります。Song EditorのMenubarにあるText Tools Menuで見つかったFix Alignment Spacesを使用して、これらのコードをその位置に戻してから、必要に応じて手動で調整します。
圧縮されたコード
別の問題は、コードの上の行に密集しすぎているコードである可能性があります。これは、コードが元々テキストボックスに配置され、コードの上に配置された場合に発生する可能性があります。Song Editorで、これらのコードを対応する歌詞の上に手動で配置する必要があります。
文字化けした文字
暗号化されたPDFドキュメントからテキストを抽出しようとすると、画面いっぱいの文字が表示される場合があります。抽出プロセスを戻すか、Song Editorから出て、テキストを抽出する別の方法を探す必要があります。
認識されない文字
OnSongがドキュメントからテキストを直接抽出できない場合、光学文字認識(OCR)にドキュメントを送信する必要があるかもしれません。これは、コンピュータがドキュメントを視覚的に「読む」ことを試みることを意味します。PDFの品質に応じて、これにより不適切な文字が使用される可能性があります。たとえば、ドキュメントにフラットシンボルがある場合、小文字の「b」として解釈される可能性があります。PDFがスキャンされた場合、フェードしたテキストは他の文字に結果する可能性があります。ドキュメントを確認し、Song Editorで必要に応じてこれらの手動変更を加えます。