מדריך המשתמש
Adobe PDF
ملفات PDF هي خيار شهير لتخزين وطباعة جداول الحبال وأوراق الكلمات. قد تكون تستخدم ملفات PDF لسنوات لفهرسة مكتبتك الرقمية. تنسيق ملف Adobe PDF رائع لتمثيل الصفحة المطبوعة بدقة وهو محمول بين منصات الكمبيوتر المختلفة. دعنا نلقي نظرة على بعض التحديات مع تنسيق الملف هذا والطرق التي يمكننا من خلالها استخراج النص للحصول على أفضل النتائج.
يتم عرض ملفات Adobe PDF "كما هي" في OnSong ولا يمكن تحريرها أو تنسيقها أو المشاركة في وضع الإضاءة المنخفضة. بينما قد تحتوي هذه الملفات على نص، إلا أنه يتم وضعه على الصفحة الافتراضية بطريقة تمكنه من الطباعة وليس من السهل فهمه أو تعديله بواسطة تطبيقات أخرى. بالإضافة إلى ذلك، يمكن أيضًا أن تتكون ملفات PDF من رسومات أو صور ممسوحة ضوئيًا أو أي مزيج من هذه. يمكن أيضًا تشفيرها، مما يحمي محتوياتها من الاستخراج. لهذا السبب، كل ملف PDF مختلف لذا لا توجد طريقة للتعامل مع التحويل المثالي إلى مستند يعتمد على النص.
يمكنك استخراج نص ملف PDF داخل OnSong باستخدام محرر الأغنية والضغط على زر استخراج النص في شريط أدوات التحويل الذي يظهر قبل الكشف عن لوحة المفاتيح على الشاشة. سيحاول OnSong استخراج النص من ملف PDF أولاً، وإذا لم يكن هناك نص متاح، فسيعالج الملف باستخدام التعرف البصري على الأحرف (OCR). ستنتهي النتيجة غالبًا بنص، لكنك ستحتاج إلى مراجعة وضبط النص إلى تنسيق ملف يفهمه OnSong. بالإضافة إلى ذلك، إذا كان الملف مشفرًا، فقد ينتج عن استخراج قد تؤدي إلى أحرف مشوهة. لا يمكن استخراج هذه الملفات بسبب الحماية المطبقة عليها من قبل برنامج التأليف.
فيما يلي بعض المشاكل التي قد تواجهها مع ملفات PDF المستخرجة:
المسافات السيئة
قد تجد أن بعض النص يتم وضعه بدون ترتيب، أو بمسافات سيئة. وذلك لأن ملفات PDF قد تستخدم اختصارات نصية لمحاذاة النص باستخدام عدة أجزاء نصية. يعمل OnSong على وضع هذه الأجزاء النصية بالقرب من بعضها البعض باستخدام حسابات قرب الإطار، لكن قد تكون هناك مشاكل تتطلب منك تصحيحها يدويًا.
الحبال بمسافات إضافية
يتم إنشاء كل جدول حبال بشكل مختلف حسب المؤلف والبرنامج المستخدم. على سبيل المثال، قد يكون الملف الأصلي قد استخدم أحرف مسافة متعددة لمحاذاة الحبال فوق الكلمات. إذا تم استخدام خط بعرض متغير، فقد يؤدي هذا إلى استخدام عدد أكبر بكثير من المسافات مقارنة بالكلمات أدناه. استخدم إصلاح مسافات المحاذاة الموجود في قائمة أدوات النص الموجودة في شريط القائمة لـ محرر الأغنية لإعادة تلك الحبال إلى أقرب موقع لها ثم اضبطها يدويًا حسب الحاجة.
الحبال المضغوطة
قد تكون هناك مشكلة أخرى وهي الحبال التي تكون قريبة جدًا من بعضها البعض على سطر فوق الحبال. يمكن أن يحدث هذا إذا تم وضع الحبال في الأصل في صناديق نصية ثم محاذاتها فوق الحبال. ستحتاج إلى محاذاة تلك الحبال يدويًا فوق الكلمات المقابلة في محرر الأغنية.
الأحرف المشوهة
إذا حاولت استخراج نص من مستند PDF مشفر، فقد ينتج عن ذلك شاشة ممتلئة بالأحرف. ستحتاج إلى استعادة عملية الاستخراج أو الإلغاء من محرر الأغنية والعثور على طريقة مختلفة لاستخراج النص.
الأحرف غير المعترف بها
إذا لم يتمكن OnSong من استخراج النص من المستند مباشرة، فقد يحتاج إلى إرسال المستند للتعرف البصري على الأحرف (OCR). هذا يعني أن الكمبيوتر سيحاول "قراءة" المستند بصريًا. اعتمادًا على جودة ملف PDF، قد ينتج عن هذا استخدام الحرف غير الصحيح. على سبيل المثال، إذا كان مستندك يحتوي على رمز مسطح، فقد يتم تفسيره كحرف صغير "b"، أو إذا تم مسح ملف PDF ضوئيًا، فقد ينتج عن النص الباهت أحرف أخرى. راجع المستند واجعل هذه التغييرات يدويًا حسب الحاجة في محرر الأغنية.