تستضيف مؤسسة الحوار الانساني بلندن يوم الاربعاء 7/9/2016 الدكتور عدنان عيدان ولي في أمسية ثقافية يتحدث فيها عن التحديات التي تواجهها اللغة العربية ومؤسساتنا التعليمية في ظل عصر المعلومات. د.عدنان عيدان ولي ولد عام 1946،حصل على شهادة البكالوريس في العلوم العسكرية، 1967، الكلية العسكرية العراقية – العراق ،كما حصل على شهادة البكالوريوس في علم الإحصاء عام 1974، كلية الاقتصاد والعلوم السياسية – جامعة القاهرة،و شهادة الماجستير
(MA) في علم الاجتماع السياسي عام 1976، معهد البحوث والدراسات العربية – مصر،وشهادة الدراسات العليا (MPhil) في علم الحاسب الآلي في مجال تطبيق علوم الحاسبات ومعالجة اللغة العربية، “إعراب الجملة العربية حاسوبياً”، عام 1989، جامعة برونيل – لندن – المملكة المتحدة. المدير التنفيذي الحالي وأحد مؤسسي شركة أي تي أي للبرمجيات وعمل في مجال تطوير البرامج العربية على الحاسبات الشخصية منذ أوائل ظهورها في بداية ثمانينات القرن الماضي وله خبرة أكاديمية وتطبيقية تزيد على ربع قرن وخاصة في مجال الحاسوبيات اللغوية والترجمة الآلية ومحركات البحث.
نحو بنية تحتية أساسية للمحتوى اللغوي العربي في عصر تقنية المعلومات
استضافت مؤسسة الحوار الانساني بلندن يوم الاربعاء 7/9/2016 الدكتور عدنان عيدان ولي في أمسية ثقافية تحدث فيها عن التحديات التي تواجهها اللغة العربية ومؤسساتنا التعليمية في ظل عصر المعلومات. د.عدنان عيدان ولي ولد عام 1946،حصل على شهادة البكالوريس في العلوم العسكرية، 1967من الكلية العسكرية العراقية – العراق ،كما حصل على شهادة البكالوريوس في علم الإحصاء عام 1974، كلية الاقتصاد والعلوم السياسية – جامعة القاهرة،و شهادة الماجستير (MA) في علم الاجتماع السياسي عام 1976من معهد البحوث والدراسات العربية – مصر،وشهادة الدراسات العليا (MPhil) في علم الحاسب الآلي في مجال تطبيق علوم الحاسبات ومعالجة اللغة العربية، “إعراب الجملة العربية حاسوبياً”، عام 1989، جامعة برونيل – لندن – المملكة المتحدة. يعمل حاليا مديرا تنفيذيا لشركة (ATA) للبرمجيات وعمل في مجال تطوير البرامج العربية على الحاسبات الشخصية منذ أوائل ظهورها في بداية ثمانينات القرن الماضي وله خبرة أكاديمية وتطبيقية تزيد على ربع قرن وخاصة في مجال الحاسوبيات اللغوية والترجمة الآلية ومحركات البحث.
المقدمة
ابتدء الدكتور عدنان عيدان ولي محاضرته بالتعريف باللغة قائلا؛ اللغة هي هوية القوم فهم يعرفون بها وتميّزهم عن بقية بني البشر،واللغة هي أداة للتفاهم بين الناس بدونها لا توجد ولا تتطوّر المجتمعات كمؤسسات بشرية. واللغة العربية، لغة القرآن الكريم قد حباها الله نسيجاً خاصاً جعل منها نظاماً هندسياً دقيقاً لا يقبل الخطأ أو التلاعب،ولهذا السبب بالذات يجب أن تتطوّر وتتجدّد اللغة العربية مع العصور في طُرق تعليمها ومعالجتها وتقديمها للنشء الجديد الذي يعيش في زمان غير زمان أجدادنا الأولين.
فما كان صالحاً للتعليم قبل قرون لا يصلح اليوم بالرغم من أنّ اللغة هي نفس اللغة ونظامها هو نفسه بدون تغيير، اذا المطلوب هو النظرة العصرية لهذا النظام الهندسي اللغوي العتيد من زوايا جديدة وبعيون أبناء هذا الزمن كي نضمن بقاء اللغة وديمومتها وانتشارها بدون أنّ نُخلّ بنظامها.
ﻭﺒﻌﺩ ﺨﺒﺭﺓ ﻁﻭﻴﻠﺔ ﺒﺎﻟﻠﻐﺔ ﺍﻟﻌﺭﺒﻴﺔ ﻭﺨﺼﻭﺼﺎﹰ ﻓﻲ ﻤﺠﺎﻻﺕ ﺘﻁﺒﻴﻕ ﺃﻨﻅﻤﺔ ﺍﻟﺤﺎﺴﻭﺏ ﺍﻟﺒﺭﻤﺠﻴﺔ ، ﻋﻠﻴﻬﺎ ﻭﺇﻨﺘﺎﺝ ﺍﻟﻌﺩﻴﺩ ﻤﻥ ﺍﻟﺒﺭﻤﺠﻴﺎﺕ ﻓﻲ ﻤﺠﺎﻻﺕ ﺍﻟﺘﺭﺠﻤﺔ ﻭﺍﻟﺒﺤﺙ ﻭﺍﻟﻘﻭﺍﻤﻴﺱ ﻭﻏﻴﺭﻫﺎ ﺘﺭﻯ ﺸﺭﻜﺔ (ATA) توّفر إمكانيات كبيرة وطاقات هائلة في بناء العديد من أنظمة البرمجة الحاسوبية التي تعمل على نظام اللغة العربية فتيسر تعّلمها ووصولها للطالب والمعلم والمتعلم الأجنبي والباحث والكاتب والأديب وغيرهم في مختلف مناحي الحياة.
الترجمة الآلية من الإنجليزية إلى العربية
منذ أن أصدرت شركة (ATA) أول نظام للترجمة الآلية من اللغة الإنجليزية إلى اللغة العربية على الحاسبات الشخصية عام 1994 في معرض (جايتكس) في دبي، بذلت الشركة كل وسعها من أجل تطوير نظام الترجمة كي يعطي أعلى نوعية ممكنة من النص المترجم. ويبقى هذا الهدف هو منارعمل الشركة اليومي في مجال تطوير نظام الترجمة ولا نخفي سراً أن قلنا بأّننا قد قطعنا شوطاً بعيداً على طريق تحقيق هذا الهدف الكبير. ولكن مازال أمامنا الكثير للوصول بنوعية الترجمة إلى حدود عليا لا تقل عن نسبة %95.
إن نظام (ATA) للترجمة الآلية يستند بالدرجة الأولى على طريقة تصميم القاموس العام للنظام، وكذلك على محتواه اللغوي من الكلمة المفردة حتى المصطلح المتعدد الكلمات. وكلما تضمن القاموس المزيد من الكلمات والمزيد من المصطلحات وتنوعها بما يكتب وينطق بلغة المصدر الإنجليزية، وكلما تحسنت نوعية المقابلات العربية لمفردات القاموس العام، كلما سهل الأمر على بقية مكونات النظام من أدوات فهم المعاني وتحليل النص والصرف وقواعد اللغة وتحليل النص المترجم من أجل إعطاء ترجمة عربية ذات نوعية عالية.
ليس لدينا شك بأن الجهد المتواصل منذ حوالي عقدين من الزمان في عمل الخبراء في الشركة في نظام القواميس والمتخصصين في اللغتين العربية والإنجليزية وفريق المبرمجين العاملين ضمن المشروع، سيثمر كما شهدنا طول الوقت إنتاج نظام الترجمة الآلية الذي نطمح له والذي يقدم أعلى نوعية للترجمة العربية الآلية. إن هذه الثقة العالية ناجمة عن أن عمل مؤسستنا في مجال الترجمة ينصب على وضع نظام متكامل من لبناته الأولى وحتى أعلى الدرجات في سلم التطور في نظام برمجيات الترجمة الآلية، ولا يستند على الحظ أو الاحتمال والطرق الإحصائية العشوائية.
آلية البحث العربية (الهدهد)
في عصر الإنترنت لم تعد المعلومات الهائلة والتي تغطي كل ما يمكن تخيله من مجالات المعرفة الإنسانية قديمها وحديثها بعيدة المنال عن الباحث – فهي لا تبعد سوى بضعة كبسات على مفاتيح الحاسوب المتصل بالشبكة العالمية! ولكن للحصول على المعلومات التي نريدها بالضبط لا بد من استعمال محرك بحث مناسب ودقيق كي لا نتيه في خضم ذلك السيل الهائل من المعلومات والبيانات التي تقدر بعدة بلايين من الصفحات المنشورة على الشبكة وبمختلف لغات العالم، منها عدة ملايين فقط من الصفحات العربية لحد الآن. والأمر لا يتعلق بكفاءة محرك البحث في سرعة جلب المعلومات التي نبحث عنها وحسب ولكن أيضاً بتوافقه مع اللغة المكتوبة بها تلك المعلومات والطريقة التي يتعامل بها محرك البحث مع قواعد وأصول تلك اللغة. فاللغة العربية على سبيل المثال لها نظام صرفي وقواعدي خاص بها لا مناص من تحليله بدّقة شديدة لضمان نجاح عملية البحث. وهذا بالضبط ما يقوم به محرك البحث العربي – الهدهد… فالكلمات العربية التي يعرضها الهدهد نتيجة البحث يمكن أن تظهر على الشاشة بغض النظر عن شكل حرف الألف (الهمزة الأولية) مثلاً (ا – أ – إ – آ) أو الحركات والشدة، لا بل حّتى اختلاف طريقة كتابة بعض الكلمات مثل (شؤون – شئون)، ويهتم نظام الهدهد بالتحليل الصرفي للكلمات العربية فيعطي الباحث الفرصة للبحث عن كلمات مثل (يصومون) حتى وإن كان البحث هو عن الفعل الماضي (صام) فقط. ويغني الهدهد عملية البحث كثيراً وذلك بالبحث عن المرادفات أيضاً موفراً للباحث خاصية مهمة جداً في البحث. فإن كنت تبحث عن الفعل (عاد) فيمكنك أيضاً أن تحصل على (أتى – رجع – أقبل – ارتد وغيرها الكثير). ويوفر نظام الهدهد أيضاً خاصية البحث في الإطار الدلالي للكلمات. فالبحث عن كلمة (الذَهب) يمكن أن يعطي نتائج (العسجد، النضار، التبر، …الخ) وهذا المعنى الدلالي في مجال الاسم من (الذَهب) وهناك إطار آخر يأتي بمعنى الذهاب على عكس الإياب وغيرها. وباختصار فإن محرك البحث العربي الهدهد هو الآلية الأمثل للباحث في الإنترنت عن النصوص العربية. وهذه الآلية إضافة إلى أنها تضاهي مثيلاتها باللغة الإنجليزية مثل (جوجل وألتافيستا وياهو) فإنها مصممة خصيصاً للبحث باللغة العربية التي لا تتوفر بنفس الدقة في آليات البحث المذكورة.
المواصفات العامة للنظام:
- بحث بسيط أو متقدم
- بحث في مواقع الإنترنت،
- بحث متقدم باستعمال عوامل البحث المنطقية ( و – أو) أو عبارات متطابقة
- بناء دليل بحث تراكمي للكلمات العربية
- ترتيب الدليل التراكمي وفق جدول زمني محدد
- اختيار المستعمل للكلمات غير المرغوب فيها (من – على – في)
- اختيار المستعمل للكلمات المختلفة الكتابة (شئون – شؤون)،
- وجود دليل بالكلمات المرادفة (أتى – عاد – رجع – آب)
- تحليل صرفي تام للكلمات بحيث تحصل على (يصومون) من (صام)
- البحث في الإطار الدلالي للكلمات. فالبحث عن كلمة (ذهب) يمكن أن يعطي نتائج (عسجد، نضار، تبر، … الخ) إضافة إلى إطار آخر يأتي بمعنى الذهاب على عكس الإياب وغيرها.
- قبول أو إهمال :
– الحركات
– الشدة
– اللواحق الأمامية
– اللواحق الخلفية
- البحث عن الكلمة نفسها بالضبط أو جزء منها
- البحث عن الكلمات بغض النظر عن أشكال الهمزة (أ = إ= ا= آ)
- البحث عن الكلمات بتساوي حرفي (ي) و (ى) (دولي = دولى)
- البحث عن الكلمات بتساوي حرفي (ه) و (ة) (مدرسة = مدرسه)
- إظهار الكلمات الناتجة عن البحث بالألوان لسهولة التمييز
- إظهار نتائج البحث في فقرات أو صفحات
- واجهة استعمال سهلة.
أنواع آلية البحث العربي – الهدهد:
- ·البحث العام في مواقع شبكة الإنترنت:
هذا النوع من آلية البحث مخصص للبحث في مواقع الشبكة العالمية كما تفعل آليات البحث العالمية المعروفة: جوجول – ياهو – إم إس إن من مايكروسوفت .
- ·البحث الخاص في البيانات التابعة للمؤسسات:
هذا النوع من آلية البحث مخصص للبحث في قواعد البيانات الخاصة التابعة للمؤسسات وضمن شبكتها الداخلية الخاصة. عملية البحث تتم بنفس نوعية وسرعة البحث في مواقع شبكة الإنترنت أعلاه.
قاموس الهدهد :
وهو قاموس باللغتين (عربي – إنجليزي وإنجليزي – عربي) حيث يختار المستعمل الكلمة الظاهرة على الشاشة وينقر على زر (قاموس الهدهد) فتظهر معاني الكلمة كفعل أو اسم أو صفة.
صوت الهدهد :
يوفر محرك البحث العربي (الهدهد) إضافة للقاموس إمكانية قراءة النصوص العربية الظاهرة على الشاشة، حدد النص أولاً ثم انقر على زر (صوت الهدهد) لتسمع النص مقروءاً بصوت عربي واضح.
نظام (عاجل) Ajil لترجمة الأخبار
نظام (عاجل) هو نظام إلكتروني للحصول على آخر الأخبار المترجمة إلى اللغة العربية فور صدورها من مواقع الأخبار والصحافة العالمية على شبكة الإنترنت. وهو وسيلة سهلة وسريعة تعوضك عن تصفح أعداد كبيرة من مواقع وكالات الأنباء والصحافة والمجلات والمواقع الإخبارية الأجنبية وحتى اليوميات الشخصية على الإنترنت المسماة (Weblogs) وتبلغك خدمة (عاجل لقراءة الأخبار) بورود آخر الأخبار المترجمة من اللغة الإنجليزية إلى العربية بواسطة آلية الترجمة الخاصة بشركة (ATA) (RSS) المعروفة عالمياً. ويعرف هذا النظام بالإنجليزية بخدمة (آر إس إس) يتكون نظام (عاجل) الذي طورته مؤخراً شركة (أي تي أي) من ثلاث تطبيقات برمجية توضع على جهاز المستعمل وخدمات أخرى خاصة بشبكة الإنترنت لتوفير آخر التحديثات من النشرات الإخبارية بالعربية ووضعها في متناول المستعمل.
- ·برنامج (عاجل) لقراءة الأخبار RSS Aggregator :
وهو عبارة عن برنامج يجلس على سطح مكتب حاسبة المستعمل وعند تشغيله يقوم بتنزيل آخر نشرات الأخبار على الحاسبة لتمكين المستعمل من قراءتها وتنظيمها وكذلك تصفح كافة مواقع تنظيم عملية الاشتراكات مع وكالات النشر الإخباري (RSS feeds) و نشرات الأخبار وترجمتها إلى العربية. ويتضمن هذا البرنامج أيضاً على محرك البحث العربي (الهدهد) وآلية الترجمة المعروفة من شركة (أي تي أي).
- ·برنامج (عاجل) للنشر RSS publisher:
ﻫﺫﺍ ﺍﻟﺒﺭﻨﺎﻤﺞ ﺨﺎﺹ ﺒﺎﻟﺼﺤﻑ ﻭﻭﻜﺎﻻﺕ ﺍﻷﻨﺒﺎﺀ ﺍﻟﺘﻲ ﺘﻨﺸﺭ ﺍﻷﺨﺒﺎﺭ ﺍﻟﻤﺘﺭﺠﻤﺔ ﺇﻟﻰ ﺍﻟﻌﺭﺒﻴﺔ ﻋﺒﺭ ﺍﻹﻨﺘﺭﻨﺕ ﺇﻟﻰ ﺍﻟﻤﺸﺘﺭﻜﻴﻥ . ﻭﻴﻭﻓﺭ ﺒﺭﻨﺎﻤﺞ (ﻋﺎﺠل ﻟﻠﻨﺸر) ﻟﻠﺼﺤﻴﻔﺔ ﺃﻭ ﻟﻭﻜﺎﻟﺔ ﺍﻷﻨﺒﺎﺀ ﻭﻋﺒﺭ ﻤﻭﻗﻌﻬﺎ ﻋﻠﻰ ﺸﺒﻜﺔ ﺍﻹﻨﺘﺭﻨﺕ ﺇﻤﻜﺎﻨﻴﺔ ﻭﻀﻊ ﺍﻷﺨﺒﺎﺭ ﻭﺍﻟﻤﻌﻠﻭﻤﺎﺕ ﺍﻟﺘﻲ ﺘﺼﺩﺭﻫﺎ ﻭﺘﺭﻴﺩ ﻨﺸﺭﻫﺎ ﻤﻊ ﺁﺨﺭ ﺘﺤﺩﻴﺜﺎﺘﻬﺎ ﺍﻟﻤﺴﺘﻤﺭﺓ ﻋﻠﻰ ﺍﻟﻤﻭﻗﻊ ﺍﻹﻟﻜﺘﺭﻭﻨﻲ ﻭﺘﺒﻴﺎﻥ ﻜﻴﻔﻴﺔ ﺍﻻﺸﺘﺭﺍﻙ ﻓﻲ ﺍﻟﺨﺩﻤﺔ ﻜﻲ ﻴﺘﻤﻜﻥ ﺍﻟﻤﺸﺘﺭﻜﻭﻥ ﻤﻥ ﺍﻟﻭﺼﻭل ﺇﻟﻰ ﺍﻷﺨﺒﺎﺭ ﻭﺍﺴﺘﻘﺒﺎﻟﻬﺎ.
- ·برنامج (عاجل الصحفي) RSS Repository Service
ﻫﺫﺍ ﺍﻟﺒﺭﻨﺎﻤﺞ ﻋﺒﺎﺭﺓ ﻋﻥ ﻤﺤﺭﻙ ﺨﺎﺹ ﺒﺘﻨﻅﻴﻡ ﻭﺤﻔﻅ ﺍﻷﺨﺒﺎﺭ ﻭﺍﻟﻤﻌﻠﻭﻤﺎﺕ ﺍﻵ ﺘﻴﺔ ﻤﻥ ﻤﺼﺎﺩﺭ ﻤﺨﺘﻠﻔﺔ ﻜﺎﻟﺼﺤﺎﻓﺔ ﻭﻭﻜﺎﻻﺕ ﺍﻷﻨﺒﺎﺀ ﺍﻟﻌﺎﻟﻤﻴﺔ ﺍﻟﻤﺨﺘﻠﻔﺔ ﻓﻲ ﻤﺴﺘﻭﺩﻉ ﻭﺍﺤﺩ ﻋﻠﻰ ﺍﻟﻤﻭﻗﻊ ﺍﻹﻟﻜﺘﺭﻭﻨﻲ ﻜﻲ ﺘﻭﺯﻉ ﻋﺒﺭ ﺸﺒﻜﺔ ﺍﻹﻨﺘﺭﻨﺕ ﻟﻠﻤﺸﺘﺭﻜﻴﻥ . ﻭﺒﻴﻨﻤﺎ ﺘﻭﺯﻉ ﺍﻷﺨﺒﺎﺭ ﺍﻟﻌﺭﺒﻴﺔ ﻜﻤﺎ ﻫﻲ ﻓﺎﻥ ﺍﻷﺨﺒﺎﺭ ﺍﻹﻨﺠﻠﻴﺯﻴﺔ ﺘﺘﺭﺠﻡ ﺇﻟﻰ ﺍﻟﻌﺭﺒﻴﺔ ﻤﻊ ﺁﺨﺭ ﺍﻟﺘﺤﺩﻴﺜﺎﺕ ﻭﺘﻭﺯﻉ ﻋﻠﻰ ﺍﻟﻤﺸﺘﺭﻜﻴﻥ .ﻘ ﻭﻴﺴﺘ ﺒل ﺒﺭﻨﺎﻤﺞ)ﻔﻲ ﻋﺎﺠل ﺍﻟﺼﺤ ( ﺍﻷﺨﺒﺎﺭ ﻋﻥ ﻁﺭﻴﻕ ﺒﺭﺍﻤﺞ ﺍﻟﺘﻘﺎﻁ ﺍﻷﺨﺒﺎﺭ ﺍﻟﻤﺴﻤﺎﺓ ﻻﻗﻁﺎﺕ ﺍﻷﺨﺒﺎﺭ RSS Spiders.
- ·نظام تصحيح الأخطاء الإملائية
فتح عصر التقنيات الإلكترونية الحديثة وعالم الحاسوب والإنترنت مجالات رحبة أمامنا جميعاً بحيث أصبح كلّ منا ﻜﺎﺘﺒﺎﹰ ﻴﻨﺸﺭ ﺇﻨﺘﺎﺠﻪ ﻋﻠﻰ ﺍﻟﺸﺒﻜﺔ ﺍﻟﻌﺎﻟﻤﻴﺔ ﺒﻴﺴﺭ ﻭﺴﻬﻭﻟﺔ ﻭﻟﻜﻥ ﻫﺫﻩ ﺍﻟﻔﺭﺼﺔ ﺍﻟﺜﻤﻴﻨﺔ ﻟﻡ ﺘﻜﻥ ﺒﺩﻭﻥ ﺜﻤﻥ . ﻓﻘﺩ ﺍﻤﺘﻸﺕ ﺼﻔﺤﺎﺕ ﺸﺒﻜﺔ ﺍﻹﻨﺘﺭﻨﺕ ﻭﺨﺼﻭﺼﺎ ﻤﻭﺍﻗﻊ ﺍﻟﺩﺭﺩﺸﺔ ( ﺃﻭ ﻤﺎ ﺘﺴﻤﻰ ﺒﺎﻟﺸﺎت!) ﺒﺎﻟﻨﺼﻭﺹ ﺍﻟﺘﻲ ﻴﺠﻬل ﻜﺘﺎﺒﻬﺎ ﺃﺒﺴﻁ ﻗﻭﺍﻋﺩ ﺍﻟﻠﻐﺔ ﺍﻟﻌﺭﺒﻴﺔ ﻤﻤﺎ ﻴﻘﻠل ﻤﻥ ﺍﻟﻘﻴﻤﺔ ﺍﻷﺩﺒﻴﺔ ﻭﺍﻟﻠﻐﻭﻴﺔ ﻟﻜﺘﺎﺒﺎﺘﻬم . ﻓﻠﻴﺱ ﻜل ﻤﻥ ﻤﺴﻙ ﺍﻟﻔﺭﺸﺎﺓ ﻭﺒﺩﺃ ﺍﻟﺭﺴﻡ ﻋﻠﻰ ﻟﻭﺤﺔ ﺃﻨﺘﺞ ﻓﻨﺎﹰ ﻭﺼﺎﺭ ﻓﻨﺎﻨﺎﹰ.
ﻭﻟﻌل ﻤﻥ ﺃﻜﺜﺭ ﺍﻷﺨﻁﺎﺀ ﺍﻟﺸﺎﺌﻌﺔ ﻓﻲ ﻴﻭﻤﻨﺎ ﻫﺫﺍ ﻋﻠﻰ ﺴﺒﻴل ﺍﻟﻤﺜﺎل ﻫﻭ ﺍﻟﺨﻁﺄ ﺒﻜﺘﺎﺒﺔ ﺍﻟﻬﻤﺯﺓ في ﻟﻔﻅ ﺍﻟﺠﻼﻟﺔ (ﺃﷲ) ﻭﻤﺎ ﻟﺤﻘﻬﺎ ﻤﻥ ﻜﺘﺎﺒﺔ ﺍﻟﻬﻤﺯﺓ ﻋﻠﻰ كلمة ﺘﺒﺩﺃ ﺒﺤﺭﻑ ﺍﻷﻟف ، ﻜﻤﺎ ﻓﻲ (ﺃﻟﻤﻤﻠﻜﺔ – ﺃﻟﺭﺌﻴﺱ – ﺃﻟﺼﺒﺎح) . ﻭﻫﺫﻩ ﺃﻤﺜﻠﺔ ﺒﺴﻴﻁﺔ ﻓﻘﻁ ﻟﻤﺎ ﻴﺤﺩﺙ ﺒﺎﻟﻔﻌل ﻓﻲ ﻜﺘﺎﺒﺔ ﺍﻟﻨﺼﻭﺹ ﻋﻠﻰ ﺸﺒﻜﺔ ﺍﻹﻨﺘﺭﻨﺕ . ﺃﻤﺎ ﺇﺫﺍ ﺍﻨﺘﻘﻠﻨﺎ ﺇﻟﻰ ﺍﻟﺼﺤﺎﻓﺔ ﺍﻟﻤﻁﺒﻭﻋﺔ ﻓﻨﺠﺩ ﺍﻟﻜﺜﻴﺭ ﻤﻥ ﺍﻟﺼﺤﻑ ﺍﻟﻤﻌﺭﻭﻓﺔ لا تفرق بين حرف الياء المقصورة (ى) وبين الياء العادية كما في حالة (على) و (علي)، و (أخري) و (أخرى)، (إلى) و (إلي)، وهي أخطاء شائعة في صحافتنا العربية.
إن مواجهة هذه المشكلة صار أمراً ضرورياً قبل استفحاله مما قد يصبح خطراً كبيراً على اللغة العربية ويشوه نظامها الدقيق في الإملاء والإعراب واللفظ، ويهدد بالتالي نسيج اللغة بكامله لا سامح الله. وهذه المشاكل يمكن أن تأخذ أبعاداً خطيرة إذا ما عرفنا أن هناك 54 مليون مستعملاً لشبكة الإنترنت في العالم العربي و 50 مليون آخر حول العالم، يستخدمون الإنترنت باللغة العربية.
إن هذه الزيادة الهائلة في النصوص العربية المنشورة لم يحصل لها مثيل من قبل، حتى في العصر الحديث. ففي الماضي لم يكن ينشر لغير الكتاب المحترفين المعروفين تقريباً، كما أن عامة الناس لم تكن تجرب حضها في الكتابة أكثر من الرسائل المتبادلة. وبمعنى آخر لم يجد ما يكتبه الإنسان العادي القراء خارج دائرة المرسل إليهم، أما اليوم فالعالم واسع وهناك مئات الملايين من القراء اللذين قد يقع أمامهم النص ويمكن أن يقرؤوه.
وهنا تصبح خطورة انتشار الأخطاء كبيرة وبالتالي تعود الناس عليها مما يضعف من قابلية اللغة الصحيحة على الانتشار. هذه الظاهرة الجديدة بانتشار الكتابة العربية عالمياً عبر شبكة الإنترنت وتوّفر الأعداد الكبيرة من القراء هي أمر صحي ومرغوب إن لم نقل مطلوب، فهو يعني زيادة هائلة في النص والمحتوى العربي. لكّنها تستدعي في نفس الوقت توّفر النظام الإلكتروني الذي يعمل على تصحيح ما يقع من أخطاء إملائية وطباعية في الكتابة كي يجعل النص مستساغاً للقراءة إضافة إلى خدمة اللغة العربية بنشرها على نطاق واسع وتوحيد كتابتها أيضاً. إن نظام (أي تي أي لتصحيح الأخطاء الإملائية) يقدم للمستعمل إمكانية وضع النص العربي تحت التصحيح الآلي لتخليصه من شوائب الأخطاء الإملائية بالدرجة الأولى. فبالإضافة إلى الأخطاء المذكورة أعلاه نجد هناك أخطاء استخدام الهاء المربوطة (ه) بدل التاء المربوطة (ة) كما في (السعوديه) (السعودية)، والفرق شاسع بين الكلمتين.
ويعالج النظام أيضاً الأخطاء الطباعية كتوّفر الفراغات الزائدة بين الكلمات بحذفها ووضع فراغ واحد فقط. كذلك حذف الفراغات بين علامات التنقيط والكلمة التي تسبقها. مثال (كلمة ،) تصبح (كلمة،) وهكذا. ومن المشاكل العويصة في اللغة العربية هي مشكلة كتابة الهمزة بالشكل الصحيح. إضافة إلى ما ذكر أعلاه هناك مشكلة همزة الوصل وهمزة القطع. فالكثير من مستعملي الحاسوب لا يحسنون كتابة الهمزة بشكلها الصحيح. على سبيل المثال كلمة (الإستثمار) تظهر هكذا في الصحافة والتلفزيون والإعلانات. والصحيح هو كتابتها بالشكل (الاستثمار) والأمر واضح من لفظ الكلمة حيث السهولة في لفظها الصحيح مقابل صعوبتها في اللفظ الخطأ ناهيك عن الكتابة العربية الصحيحة. يعالج النظام جميع هذه الأخطاء وغيرها بشكل آلي وبدون تدخل المستعمل مما يوّفر الوقت والجهد ويعطي النتائج الصحيحة. إن تصحيح النصوص العربية المليئة بالأخطاء آلياً لا يجعل منها نصوصاً صحيحة وحسب بل مستساغة للقراءة ويساعد على تقييس وانتشار الكتابة باللغة العربية الصحيحة وضعف استعمال اللهجات المحلية.
- القواميس العربية الإلكترونية
دخلت الأجهزة الإلكترونية معظم جوانب حياتنا المعاصرة وأصبح بعض منها لا غنى عنه كأجهزة الحاسوب والتلفزيون والهواتف النقالة وغيرها الكثير. وبدخول الإنترنت المزيد من بيوتنا أصبحت أداة مهمة أخرى في تزودنا بالمعلومات ومنها نشرات الأخبار والصحافة وقراءة الكتب والنشرات والبحوث العلمية الإلكترونية المنشورة على الآلاف من مواقع الشبكة العالمية. وتوفر شبكة الإنترنت أيضاً فرصة ثمينة أمام المستعمل للحصول على الترجمة الآلية واستعمال القواميس الإلكترونية. وهذه الأخيرة أصبحت أداة ضرورية للتعليم في المدارس إضافة إلى الاستعمال المتخصص والعام.
بالرغم من توفر أعداد كبيرة من كتب قواميس اللغة العربية والقواميس الثنائية اللغات كالقواميس الإنجليزية العربية وغيرها، إلا أن انتشارها محدود على المستوى الشعبي بشكل خاص. فبقدر تعلق الأمر بقواميس اللغة العربية نلاحظ أن طالب المدرسة أو المواطن العام الذي يريد اقتناء قاموس واستعماله في البيت، لغرض تعليم الأطفال أو في حالات أقل لغرض الاطلاع على معاني الكلمات العربية، لا يجد سهولة في استعمال القاموس لسبب أساس هو أن معظم قواميس اللغة العربية المتوفرة تتبع نظاماً معقداً لعرض المفردات، كأن يكون وفق جذر الكلمة. فكلمة (استخارة) مثلاً تأتي تحت الجذر (خار)، والبحث عن الجذر (خار) يكون بالبحث من حرفه الأخير (الراء). أي للبحث عن هذه الكلمة يجب أن نفتح القاموس على حرف الراء ثم ننتقل إلى الجذر (خار). وهذا كلّه قد لا يخطر على بال المستعمل غير العارف ببواطن اللغة العربية.والمطلوب هو القاموس العربي الجديد الذي تبحث فيه عن الكلمة فتجدها نفسها. هذا هو القاموس العربي الإليكتروني الجديد الذي يمكن أن يصبح في متناول الجميع من تلاميذ المدارس وطلبة الجامعات وحتى الكتاب والأدباء والصحفيين… وبالطبع في نسخ تلائم كل شريحة من هذه الشرائح.
البحث عن الكلمات في القاموس الجديد سهل جداً، تدخل الكلمة في المكان المخصص لها فتحصل عليها فوراً، ويمكن أن تحصل على جذرها وتصريفاتها كاملة إضافة إلى المعنى والاستعمالات وبالأمثلة أيضاً.
لكن القاموس الجديد يجب أن لا يخرج عن كونه قاموساً، أي بمعنى أن لا يكون مجمعاً هائلاً للكلمات التي تظهر بأكثر من 200 صيغة عربية للكلمة نفسها. بل الكلمة العربية موجودة في القاموس بجذرها وتتولد الصيغ الأخرى آلياً من الجذر بيسر وسهولة. فعند البحث عن كلمة (استخارة) كما ذكرنا سابقاً نرى أن القاموس يرجعها إلى المزيد الخماسي (استخار) والذي يعود للجذر الثلاثي(خار) ثم تتولد منها كافة صيغ الكلمة والأمثلة والاستعمالات.
- ·مدونة اللغة العربية
لم تأت حركة التطور العلمي والتقني الذي يتسم بها عصرنا الحاضر من فراغ، بل هي نتاج عمل دءوب على مستويات مختلفة استمر قروناً عديدة. وَلرب سائل يسأل ما هي الأسس التي استند إليها بناة حضارة العصر الحالي كي يصلوا بالعالم إلى هذه المستويات العليا من التقدم العلمي والتقني؟
في البدء يجب أن نبين بأن الحاسوب هو أهم آلة صنعها الإنسان ساهمت في جلّ التقدم العلمي والتقني العالمي منذُ البدايات الأولى في ثلاثينات القرن الماضي. فالحاسوب دخل في كُلّ حيز ومجال ليساهم في تسريع البحث العلمي والإنتاج الصناعي وطرق التدريس والتربية الاجتماعية وكُلّ ما له علاقة بحياة الناس. ونتيجة لهذا الدور الكبير الذي أخذ يلعبه هذا الجهاز العملاق في حياتنا كان من الطبيعي أن يفكر العلماء بإيجاد طرق سهلة للتعامل بل “التفاهم” معه لتحقيق أقصى الفوائد. ومن هنا بدأ العمل في بحوث علمية في العديد من الجامعات في بلدان الغرب واليابان وغيرها تركز على إيجاد لغة للتفاهم بين الإنسان والآلة. وبما أن اللغة الإنجليزية كانت لغة غالبية العلماء والمهندسين وغيرهم من العاملين في مجال بحوث ودراسات الحاسوب فقد كان الهدف هو إيجاد طرق سهلة يفهم بها الجهاز اللغة الإنجليزية.
ومن نتائج البحوث في مجال التفاهم مع الآلة وجد العلماء أن اللغة الإنجليزية بحد ذاتها تحتاج ويمكن أن تتطور وتدخل فيها مفردات جديدة نتيجة استخدام الحاسوب في التقنيات الحديثة في معالجة المعلومات. ومن أهم التطورات العلمية اللغوية في هذا المجال كان استخدام المنطق اللغوي وما يسمى باللسانيات الحاسوبية علم جديد يجمع بين علم الحاسب الآلي وعلم ] (computational linguistics)اللغة] في البرمجة أي كتابة برمجيات توجه الآلة تستند إلى منطق اللغة البشرية وإلى النظريات الجديدة في هذا المجال وخصوصاً تلك التي وضعها العالم الأمريكي نعوم تشومسكي (حاز على درجة الماجستير في أواخر الأربعينات في بحث حول التصريف في اللغة العبرية) في بحوثه المشهورة:
- تركيب السياق عام 1957 Syntactic Structure
- جوانب نظرية السياق عام 1965 Aspects of the Theory of Syntax
- تأملات لغوية عام 1975 Reflections on Language
وساهمت هذه البحوث والدراسات في تطوير برمجيات للترجمة الآلية بين اللغات العالمية وخصوصاً بين الروسية والإنجليزية وغيرها. لقد أحدث تطور اللغة الإنجليزية ثورة علمية كبيرة في علوم الحاسوب خلال عقدي الستينات والسبعينات من القرن الماضي. ومكنت هذه الثورة الإنسان من التعامل مع الحاسوب ليس كجهاز حسابي فقط، بل كجهاز يمكن أن يأخذ دوره في حلّ مشاكل التطبيقات العملية لمختلف العلوم كالطب والفيزياء والجغرافية وعلم النفس والتاريخ واللغة وغيرها. وبالتالي تمكن العلماء المعنيين من جمع العلوم كافة بشقيها الإنساني والأساسي العلمي في جهاز واحد هو الحاسوب بفضل تطوير اللغة والحرص على تدوين ذخيرتها والتعامل معها كبنية تحتية لإنجاز مهام أخرى.
لقد فتحت العلاقة بين الحاسوب واللغة منهجاً جديداً تم من خلاله فتح الأبواب على مصراعيها لتيسير التفاهم بين كافة شعوب الأرض. وهكذا نشطت في ثمانينات القرن الماضي حركة الترجمة الآلية بين مختلف اللغات العالمية وبهذا أصبح بمقدور العلماء والمتخصصين من مختلف البلدان تبادل المعلومات العلمية والنتائج التي توصلوا إليها. وبعبارة أخرى سهلت الترجمة الآلية عملية تبادل النصوص العلمية بين علماء العالم بصورة أسرع وأدق مما ساهم في انتشارها وتبادل الخبرات وتطوير العلوم التي تخدم الإنسانية جمعاء.
وفي مجال الاستفادة من السرعة العالية والكفاءات التقنية للحاسوب بدأ العلماء والمتخصصون اللغويون في بناء مدونات اللغة الإنجليزية لدفع عملية تطوير اللغة وبالتالي دفع المؤسسات العلمية والاجتماعية بل ومختلف جوانب حياة الناس إلى الإمام وذلك بمعرفة المزيد عن لغتهم ورفدهم بالحديث والمتطور في مجال اللغة. وبقدر تعلق الأمر باللغة العربية التي تعتبر بحق أكثر اللغات العالمية جمالاً وأكثرها ثراء ورغم دخول التقنيات الحديثة في جميع البلدان العربية إلا أن الأمور لم تتحرك من سكونها كثيراً لمواكبة التطور التقني والاستفادة من العلوم الحديثة. ويبدو أن فقرالتفكير في كيفية إيجاد بنية تحتية حديثة خاص باللغة العربية وتأسيس ذخيرة لغوية كان السبب الأساس في التأخر في مواكبة التطور العلمي والتقني العام. وإن لم تتخذ الخطوات الأولى في بناء المدونة اللغوية للغة العربية فأنها وللأسف الشديد ستتلكأ في مجالات العلوم وتطبيقاتها الحديثة خلف اللغات العالمية الأخرى ومنها على سبيل الحصر اللغات الإنجليزية والفرنسية والألمانية والأسبانية. إ ن بناء مدونة اللغة العربية سوف لا يقوم بتعزيز مكانة العالمين العربي والإسلامي اللغوية فحسب، بل وسيمكنهما من سبر أغوار العلوم والتقنيات الحديثة بثقة وكفاءة عالية تتماشى مع التطور الحديث وخدمةالإنسان.
إن الخزين الخاص باللغة العربية الذي نحن بصدده يجب أن يغطي القديم والحديث مما كُتب في مجالات العلوم المختلفة، بالإضافة إلى كتب الآداب واللغة والفلسفة والدين والتاريخ والسياسة وغيرها من التخصصات الأُخرى. وبالتأكيد سيتم مراعاة الحيادية والتوازن في اختيار الكتب والمقالات اللغوية من تلك المصادر المختلفة، بغض النظر عن أصل المصدر ونوعه والأفكار الواردة فيه. وعليه فالمصدر المنشور باللغة العربية والمراد الاستفادة من ذخيرته اللغوية في هذه المدونة يجب أن يكون صادراً عن جهة معروفة يمكن ذكرها كمصدر. ولغرض الحفاظ على مستوى معين من التمييز العملي والموضوعي ومن الضروري استبعاد النصوص الواردة أو المنشورة في مواقع التحاوروالدردشة على شبكة الإنترنت.
الأهداف العامة للمدونة العربية
- تطوير تعليم اللغة العربية في المدارس بما يضمن سلامة الكلام العربي المكتوب والمنطوق عند الطلبة.
- تسهيل الإملاء العربي وتجنب الأخطاء في الكتابة وكشف الأخطاء الشائعة لضمان سلامة الكتابة والنشر باللغة العربية وخصوصاً في وسائل الإعلام والنشرالجماهيري.
- زيادة الذخيرة اللغوية لطلاب المدارس والجامعات كي تصل إلى عشرات آلاف من الكلمات والتركيز بشكل خاص على مرادفات الكلمة والحقول الدلالية لها. وسيحّفز هذا الأمر بدون أدنى شك الطالب إلى الكتابة الأدبية والعلمية من تقارير وبحوث ذات قيمة لغوية إلى جانب قيمتها المدرسية والعلمية.
- تنقية اللغة العربية من الشوائب التي لحقت بها عبر القرون منذُ بداية عصر الإسلام وقيام الحضارة العربية الإسلامية في مناطق واسعة من العالم مروراً بعصور التدهور والانحسار وصولاً إلى يومنا هذا، حيثُ نشأت ظروف جديدة في العقود القليلة الماضية ترك فيها انتشار اللغة الإنجليزية كلغة للعلوم والتقنيات الحديثة وتوسع الوجود الغربي في البلدان العربية بكافة أشكاله آثاراً سلبية على تعليم واستخدام اللغة العربية في الكلام والكتابة والنشر، خصوصاً في أجهزة الإعلام المسموعة منها والمرئية. ولعل دخول العالم عصر الإنترنت وانتشار النشر الإلكتروني على الشبكة العالمية واتساع استعمال الرسائل النصية عبر الهاتف النّقال وما يتطلبه هذا الأمر من اختصار للكلمة المرسلة وبالتالي تشويه الكلمة والعبارة لضمان السرعة وتوفير الوقت والجهد والمال قد أساء إلى استعمال اللغة العربية.
- توحيد وتوسيع استخدام الكلام والكتابة باللسان العربي الفصيح وتقليص الاعتماد على اللهجات الدارجة خصوصاً في البلدان العربية، الأمر الذي يحط من القيمة العلمية للغة ويشكل عائقاً بوجه انتشارها عالمياً والترجمة منها وإليها.
- وضع قواميس ومعاجم عربية حديثة تتماشى مع متطلبات عصرنا الحالي حيثُ تكون شاملة وواسعة وسهلة الاستعمال وتصدر بمستويات مختلفة، مما يجعلها في متناول الجميع من أطفال المدارس إلى كبار المتخصصين والباحثين. وهذا يعني أيضاً نشر مثل هذه المصادر اللغوية الثمينة بطرق مختلفة ليمكن اقتنائها وتداولها بسهولة سواء بصيغة كتاب ورقي أو إلكتروني أو بصيغة برمجيات حاسوبية تكون متوفرة للاستعمال عند الطلب.
- التخلص من الافتراضية في اللغة والتأليف والاستناد إلى القواعد التطبيقية الحقيقية التي تُستنتج من مدونة اللغة العربية.
- تحقيق إمكانية إدخال المصطلحات المشتقة من جذور اللغة العربية الصحيحة كمقابل للمصطلحات الأجنبية التي تأتينا في مختلف فروع المعرفة. ولا يخفى علينا الكم الكبير من هذا النوع من المصطلحات الذي يصلنا يومياً خصوصاً في مجال التقنية الحديثة، الهدف أن نجد مقابلاً عربياً سهلاً مثل المصطلحات الحالية (قمر صناعي )مقابل satellite وصاروخ مقابل rocket ،ولا يضيع شبابنا مثلا في التعبير عن المحادثات التي يتبادلونها مع أصحابهم عبر مواقع الإنترنت بمصطلحات ممجوجة مثل (شات) وهي المقابل لكلمة. chat
- ترجمة كُلّ ما يظهر في العالم في مجالات المعرفة الإنسانية المهمة إلى اللغة العربية ورفد مدوّنة اللغة المنشودة بالمصطلحات الناتجة عن الترجمة لإغنائها وبذلك دفع عملية الترجمة نفسها إلى الأمام.
- تمهد المدونة العربية اللغوية لبناء أرضية صلبة من أجل مسح نظم الترجمة الآلية المتوفرة حالياً بكافة اللغات العالمية لدراسة وتطوير مدى ملائمة العربية كلغة للترجمة من وإلى اللغات العالمية الأخرى.
- تسهيل تعليم العلوم الإنسانية والدقيقة في المدارس والجامعات ومدى التأثير الإيجابي الحاسم لهذا الأمر على الأجيال الحالية والقادمة ومستقبل الأمة بشكل عام.
- كشف عمق اللغة العربية والتناسق الهائل في تركيباتها اللغوية وهندستها العلمية الدقيقة مما يقربها من العلوم الدقيقة. فإن تعمق معرفة الإنسان الناطق بالعربية بالقدرات الهائلة للغته في التعبير والصياغة وتصريف الكلام يزيد من اهتمامه بالكلام العربي وحسن التعبير والكتابة وبالتالي يخدم عملية التطور الجارية في مختلف مجالات الحياة، ويمكن لأجيال من الشباب الذي تربى على احترام لغته وحبها أن يساهم بإنتاج العلم والمعرفة بلغته لا استيراد واستهلاك العلوم المكتوبة بلغات أجنبية.
- استخدام التقنيات الحديثة كالحاسوب في تطوير تعليم اللغة العربية. ويمكن أن يشمل هذا الهدف استخدام التقنيات النظرية الحديثة في دراسة اللغات والمنطق اللغوي كما هو معروف عالمياً.
- تقديم دراسات نظرية حديثة في علوم اللغة العربية والمنطق اللغوي العربي وتشجيع الدراسات والبحوث الأكاديمية المتقدمة في الجامعات والمراكز العلمية المتخصصة في العلوم اللغوية. وهنا يمكن الإشارة إلى ما أنجز في بريطانيا مثلاً في مجال اللغة الإنجليزية والحاسوبيات اللغوية وتأسيس مدونة اللغة الإنجليزية الذي ضمن استمرارية التطوير اللغوي ومراقبة ما يدخل من جديد لعالم الكلام والأدب الإنجليزي.
- تقديم دراسات حديثة ومعمقة في الشعر العربي منذُ بداياته المعروفة وصولاً إلى الشعر العربي الحديث.
- تقديم دراسات علمية حديثة في شرح وتفسير القرآن الكريم بالاستناد إلى النتائج التي تظهر من تطوير نظام مدونة اللغة العربية.
- وضع الأُسس الصحيحة واللازمة لإصدار المعجم التاريخي للغة العربية والذي بدأ العمل به منذ الأربعينيات من القرن الماضي والذي لم ينجز لحد الآن. وهذا المعجم يؤرخ للكلمة منذُ بداية ظهورها وتطور استعمالها وبدائلها في مختلف العصور التي مرت بها. وهذا بدوره سيؤدي إلى قراءة صحيحة ونقدية للتراث العربي كاملاً.
- نشر كتب بأنماط واستعمالات الفعل والاسم والحرف والصفة في الجملة العربية، إذ يظهر فيها بوضوح استعمال الكلمة في مختلف الجمل الواردة فعلاً في النصوص في بنك اللغة العربية.
- رصد ما يدخل للاستعمال اللغوي اليومي من كلمات جديدة سواء مشتقة من أصل عربي أو قادمة من لغات أجنبية.
- توفير مادة للبحث والدراسة الأكاديمية تساعد طلبة الدراسات العليا والباحثين في مختلف مجالات المعرفة الإنسانية على العثور على مصادر علمية لبحوثهم من خلال دراسة المادة اللغوية الموجودة في المدونة المنشودة يمكن الوصول إلى طرق علمية دقيقة لتقييم نوعية المؤلفات ودرجة جودتها ومعرفة إمكانيات المؤّلف العلمية واللغوية ومدى تقدمه أو تراجعه في المستوى اللغوي للكتابة خلال فترة زمنية معينة.
- إيجاد مصادر كُلّ كلمة ومتى قيلت وفي أي موضع وتحقيق أصالتها اللغوية وعرضها ضمن الحقبة التاريخية التي تم استعمالها.
- تعاني اللغة العربية كثيراً من ظاهرة اللبس اللغوي نتيجة غياب عملية تشكيل الحروف، ويمكن من خلال المدونة العربية تحليل حالات اللبس المختلفة المعجمية والصرفية والنحوية والدلالية.
- الاستفادة من المدونة اللغوية في توحيد وتوصيف المصطلحات العلمية العربية مما يسهل التأليف في مجالات العلوم وجعلها متوفرة لطلبة المدارس والجامعات.
- البحث عن أوجه الشبه والاختلاف بين اللغة العربية واللغة الإنجليزية نظراً لتطور واتساع مدونات اللغة الإنجليزية ولكونها اللغة الأكثر شيوعاً في مختلف مجالات العلوم والاقتصاد والمجتمع والصناعة والمال وغيرها من مناحي الحياة. وسيكون بالإمكان استعمال مدونة اللغة العربية لتحديد الأبعاد المحورية للإحصاء اللغوي العربي ومقارنته مع اللغة الإنجليزية.
- تحقيق المخطوطات العربية القديمة بصورة حديثة استناداً إلى مادة المد ونة اللغوية مما يسهل دخول عالم المخطوطات العربية القديمة إلى حياتنا اليومية المعاصرة بطريقة سهلة وميسرة وما يمكن أن يساهم هذا الأمر في تعميق معرفتنا بفكر وتاريخ أمتنا ومدى ثراء الفكر العربي والإسلامي لكون اللغة العربية هي لغة دلالية وصفية مجازية بلاغية، ونتيجة لتشابك صفاتها تلك فسيكون بالإمكان الاستفادة من مادة المدونة العربية المنشودة في تحليل وتصنيف العلاقات الدلالية والبلاغية التي تربط بين الكلمات العربية في السياق اللغوي.
- فهرسة النصوص العربية بالاعتماد على الأسلوب الصرفي من خلال استخدام المعالج الصرفي المتعدد الأطوار الذي سيكون نتيجة حتمية للمدونة اللغوية.
القارئ الضوئي للنصوص العربية
تحتل قضية تحويل نصوص عشرات الآلاف من المخطوطات والكتب والمؤلفات العربية القديمة منها والحديثة إلى نصوص محفوظة على قرص أجهزة الحاسوب أهمية كبيرة. ليس من أجل تحديثها وتنقيحها وإخراجها وطبعها طباعة حديثة وحسب، ولكن من أجل توفيرها للبحث والدراسة أيضاً وجعلها في متناول مراكز البحوث والجامعات وطلبة الدراسات العليا في مختلف تخصصات المعرفة حتى الأجنبية منها. من هنا فإن نظام القارئ الضوئي للنصوص العربية هو جزء لا يتجزأ من نظام متكامل قد يشمل مثلاً نظاماً للترجمة الآلية، حيث يمكن تصور النظام الشامل يتحول فيه النص العربي من صفحات الكتاب أو المخطوطة إلى نص إنجليزي على صفحات كتاب آخر، يمر بمراحل التصوير والقراءة الضوئية والترجمة الآلية ثم التصحيح والتنقيح والطباعة.
إن توّفر نظام متقدم للقراءة الضوئية سيساعد كثيراً على قيام المكتبة العربية الإلكترونية، وبذلك يصبح التراث العربي المكتوب على مدى يزيد على 15 قرناً في متناول الناس بشكل نصوص إليكترونية، يتيسر نقلها واستخدامها لأغراض شتى. لا يقف بوجه هذه المهمة الكبيرة اليوم غير عدم توفر نظام كفء لقراءة تلك النصوص ونقلها من صفحات الكتب إلى أقراص الحاسوب. فهذه النصوص بحاجة
لنظام إليكتروني يمكننا أولاً من تحويل صفحة النص الورقية إلى صورة، ثم قراءة النص المصور وتحويله إلى نص إليكتروني محفوظ على قرص الحاسوب.
إن تطوير نظام القراءة الضوئية للنصوص العربية يجب أن يتجاوز مشاكل البرمجيات التجارية المتوفرة في الأسواق، التي تفتقر إلى الدقة المطلوبة في قراءة الخطوط العربية المتعددة والخطوط اليدوية المختلفة التي كتبت فيها أمهات المخطوطات العربية. المطلوب هو نظام للقراءة قادر على “تعّلم” نوع الخط تماشياً مع قراءة نص الكتاب حتى نهايته. أي أن النظام يجب أن “يتعلم” باستمرار حتى عند الانتقال من عبارة إلى أخرى حتى نهاية نص الكتاب أو المخطوطة. لا فائدة كبيرة ترجى من برنامج أدخلت فيه بعض أشكال الخط العربي المعروفة لقراءة نصوص قديمة أو مخطوطات يدوية.
الترجمة الآلية من العربية إلى الإنجليزية
منذ البدايات الأولى لإنتاج نظام الترجمة العربية الآلية من اللغة الإنجليزية إلى العربية قبل عقدين من الزمان تقريباً وضعت شركة (أي تي أي) لنفسها هدفاً مستقبلياً هو إنتاج نظام الترجمة المكمل، ألا وهو الترجمة الآلية من اللغة العربية إلى اللغة الإنجليزية. لا يخفى علينا أن الترجمة الآلية ومنذ نشأتها الأولى تعتمد بالأساس على عمل الإنسان مع الآلة، وليس على الخبرة والمعرفة والعقل الإنساني لإنتاج النصوص المترجمة، كما دأب البشر على مدى التأريخ. الترجمة الآلية، ومهما تعمق تدخل الإنسان في وضعها ومهما استخدمت فيها من نظريات اللغة والمنطق اللغوي وأحدث البرمجيات، تبقى في النهاية إنتاج آلة جامدة وليس إنتاج عقل بشري مبدع، وبالتالي لا نتوقع أن يكون النص الآلي المترجم من الإبداع اللغوي ما يشبه أو يقترب من إبداع العقل البشري. وينطبق هذا الأمر بشكل خاص على النصوص الأدبية ذات الصياغات اللغوية والشعرية والنظم الأدبي الرفيع التي ينفرد بها عقل الإنسان المفّكر، ولا يمكن للآلة منها مهما وضع الإنسان بصمات أصابعه وعقله عليها.
ولكن في الترجمة الآلية الهدف الأساسي هو ليس النوعية والإبداع الأدبي بقدر ما هو كمية النص المترجم، فالنوعية تأتي بمرور الزمن وبالخبرة والتطوير وترجمة النصوص المختلفة، بالضبط كما تحصل الخبرة لدى المترجم الإنسان. فعمل الآلة، وهذا ينطبق على كل آلة اخترعها وصنعها البشر، هو لتسهيل عمل شاق يرهق الإنسان واختصاره إلى أدنى حد ممكن. فكان اختراع العجلة على سبيل المثال هو أول عمل بشري عظيم مكن الإنسان من التنقل ونقل أثقل حاجياته عبر مسافات طويلة بيسر وسهولة. وكلما أحسن الإنسان وطور استخدام العجلة وصنع الأجهزة والمعدات التي تستخدم العجلة وأضفى عليها الإبداع والجمال كلما تمّتع أكثر بفوائدها وخّفف من الإرهاق عليه. وها نحن نرى أحدث أنواع السيارات والناقلات وغيرها التي تستخدم نفس فكرة وشكل العجلة التي صنعت في وادي الرافدين قبل آلاف السنوات، ولكن مضافاً إليها إبداع الإنسان وخبرته عبر عشرات السنوات الأمر الذي يضع بين أيدينا أجهزة جميلة وسريعة ومتقنة تستخدم العجلات.
وعودة إلى الترجمة الآلية نقول وضعت أنظمة الترجمة الآلية بالأساس ومنذ أيامها الأولى لحل مشكلة الكميات الهائلة من النصوص المطلوب ترجمتها والتي خرجت عن إمكانية المترجم الإنسان ذو القابلية المحدودة على الترجمة. فالمترجم الإنسان قد يترجم خمس أو ست آلاف كلمة في اليوم، ولكن حاسوب اليوم يمكن أن ينتج أضعاف هذه الكمية في ثوان! قد يقول البعض أن نوعية الترجمة الآلية أقل من نوعية ترجمة الإنسان، وهذا أمر لا يمكن نكرانه ولكن الترجمة الآلية لعشرات الآلاف من الكلمات في ثوان ثم صرف بضعة ساعات على تنقيحها هو اختصار هائل للوقت وإنتاج غزير تحت أية مقاييس.
نتوقع أن تركز الترجمة الآلية من اللغة العربية إلى اللغة الإنجليزية بالدرجة الأولى على النصوص الأدبية (وخصوصاً الشعر والقصة) والنصوص التاريخية والدينية واللغوية وما شاكلها مما أبدع به الكتاب باللغة العربية عبر عصور حضارات العرب المختلفة. وهذا لا يقلل بالطبع من شأن العلوم العربية التي وصلت أعلى المستويات في زمانها، حتى أن اللغة العربية تعتبر واحدة من ثلاث لغات فقط، إضافة إلى اليونانية والإنجليزية التي كتبت بها العلوم. ولكن بسبب انحسار الحضارة العربية منذ أكثر من خمس قرون ونهوض الحضارة الغربية على أنقاضها وانتشار اللغة الإنجليزية كلغة للعلم على المستوى العالمي جعل علماء العرب يكتبون وينشرون مؤلفاتهم العلمية باللغة الإنجليزية ونشرها عبر الصحافة العلمية العالمية باللغة الإنجليزية.
الترجمة الآلية العربية إلى اللغة الإنجليزية تستجيب أيضاً لحاجيات مجتمعنا العربي الذي تشابكت فيه الاهتمامات والمصالح الغربية والعالمية مع الاهتمامات والمصالح العربية، وأصبح نقل النص العربي إلى اللغة الإنجليزية من ضروريات هذا العصر والمستقبل، وهو إلى جانب ذلك أيضاً دليل على الرغبة الجامحة لدى الكاتب العادي أو المفكر المبدع الذي يكتب باللغة العربية للنشر على المستوى العالمي خصوصاً في عصر جعلت فيه شبكة الإنترنت العالمية الرجل الذي يعيش في الصين جار للرجل الذي يعيش في دولة عربية. لدى شركة (أي تي أي) الخطط لإنتاج نظام للترجمة الآلية من اللغة العربية إلى الإنجليزية وقد بدأت بالفعل في تطوير ووضع القواميس تمهيداً لإنتاج أول نسخة من النظام العام القادم إن شاء الله. وكما هو الحال مع الترجمة الآلية من الإنجليزية إلى العربية، فإن خبرة الشركة في مجال أنظمة الترجمة ستكون عاملاً مهماً مساعداً على وضع نظام متقدم للترجمة الآلية من اللغة العربية إلى اللغة الإنجليزية.
نظام التحّقق من أصلية النصوص العربية
بدخول العالم عصر النشر الإلكتروني على شبكة الإنترنت وتوّفر آلاف الملايين من صفحات النصوص التي يمكن نسخها واستخدامها للأغراض الشخصية ازدادت سهولة التزوير والنقل والسرقات الثقافية التي قد تصل لحد الكتب الكاملة. ومن الملفت للنظر أن سرقات النصوص ليست حكراً على متصفح الشبكة العادي ولكّنها تشمل أيضاً بعض المثقفين والدارسين وحتى جهات حكومية كما حصل على سبيل المثال مع وثيقة الحكومة البريطانية حول أسلحة الدمار الشامل العراقية التي صدرت عام 2002 وتبين فيما بعد أن بعض النصوص فيها مسروقة من أطروحة دراسية جامعية منشورة على الإنترنت.
إن خطورة قضية السرقات الثقافية عبر شبكة الإنترنت تتطلب من دور النشر المحترمة وأية جهة مسؤولة عن نشر الكتب والمجلات والصحف استخدام نظم إلكترونية قادرة على فحص النصوص المقدمة إليها والتأكد من أصالتها وعدم سرقتها. وفي جوهرها لا تختلف هذه العملية عن عملية التأكد من سلامة عمليات البيع والشراء عبر شبكة الإنترنت حيث يتم التأكد من سلامة المعلومات الشخصية المدخلة عند استخدام البطاقات المصرفية كبطاقات الائتمان. ولكن في حالة النصوص الثقافية يتعلق الأمر بتأكيد أصالة عشرات ولربما مئات الصفحات أو أكثر وليس بمعلومات شخصية لا تزيد عن عدة سطور. وليس هناك أفضل من النظم الإلكترونية وخصوصاً في عصر أجهزة الحاسوب السريعة جداً وذات القدرات التخزينية والذاكرة الواسعة والتي تقارن النص المقدم إليها مع كميات هائلة من النصوص المحفوظة محلياً على أجهزة النظام وأيضاً بواسطة البحث والمقارنة مع النصوص المنشورة على شبكة الإنترنت، منها يمكن لـ (نظام التحّقق من أصلية النصوص) أن يتحّقق بالفعل من أن النص المقدم هو نص أصلي أو مسروق من مادة منشورة على الإنترنت كلياً أو جزئياً. عملية التحّقق تتم ببساطة بمقارنة كلّ النص المقدم كلمة كلمة أو مقارنة مقاطع نصية عشوائية منه مع النصوص المنشورة على الإنترنت أو المحفوظة على قرص الحاسوب، والنتيجة عادة ما تكون حاسمة. وقد يعترض البعض على أن النظام لن يكون قادراً على التحّقق من أن النص مسروق من مادة غير منشورة على الإنترنت، وهو اعتراض مقبول إلى حد ما إلا أن النشر عبر شبكة الإنترنت سواء للنصوص القديمة أو الحديثة التي تنشر كل يوم أصبح أمراً شائعاً.
وإضافة إلى عملية التحّقق الحرفي لأصلية النص فان (نظام التحّقق من أصلية النصوص) يمكن أن يتحّقق من النص أيضاً بمقارنة أسلوب الكاتب ولغة ومستوى النص الثقافي بمقارنتها مع نصوص أخرى لنفس الكاتب ليخرج بنتيجة أن النص المقدم هو نص أصلي لنفس الكاتب أم لا.
نظام تقييم نوعية النصوص العربية
صاحب انتشار أجهزة الحاسوب الشخصية وأنظمة الكتابة الإلكترونية والنشر المكتبي قفزة كبيرة في عدد الكّتاب الهواة وكذلك المحترفين وخصوصاً على صفحات شبكة الإنترنت العالمية. وعند الاطلاع على ما يكتب نرى أن نوعية المواد المنشورة تكون في بعض الأحيان من السوء بحيث لا يمكن اعتبارها نصاً صالحاً للقراءة أو النشر خارج صفحات الإنترنت المفتوحة أمام الجميع.
جرت العادة أن يكتب الكاتب لكي يقرأه الآخرون، أي أّننا نقصد من وراء الكتابة أن نطلع الناس على أفكارنا كي نزودهم بما نعرفه من علم ومعرفة أو نمّتعهم أو حتى نؤّثر فيهم. ولا يمكن أن تعود النصوص سيئة النوعية سواء لغةً أو أسلوباً أو محتوى بأية فائدة أو متعة أو تأثير على القارئ كائن من كان. من هنا نقول هذا الكتاب من أمهات الكتب وهذا الكاتب من أبرز الكّتاب أو المثقفين أو الأدباء أو الفقهاء أو اللغويين ونقصد بذلك أن ما يكتبه ذلك الكاتب يتمتع بنوعية أدبية وثقافية ولغوية وفكرية عالية تشدنا عند القراءة وتنفعنا بالمعلومة وتثير فينا الرغبة في التزود بالمعرفة. وهكذا نختار الكاتب والكتاب كي يصبح خير جليس لنا ومن مصادر معرفتنا وثروة أدبية وفكرية تستحق الاقتناء والعودة لها والتندر بما يرد فيها من أفكار أو قصص في مجالسنا والتفاخر بمعرفتنا بما فيها من علم وأدب ومعرفة.
على ضوء ما ذكرنا أعلاه سنحاول هنا وضع أسس علمية لتقييم نوعية النصوص بواسطة نظام إلكتروني دقيق (نظام تقييم نوعية النصوص العربية) يعطي نتائج محايدة يمكن أن تساهم في تحسين أداء الكاتب الجديد وتنبيه الكاتب المحترف لعدم الوقوع في مشاكل التكرار أو الترديد الممل للقارئ. باختصار ينشد هذا النظام الإلكتروني الجديد إلى المساهمة في رفع قيمة ونوعية المادة المكتوبة إلى مصاف أمهات ما كتب في السابق ويكتب في الحاضر، وهي من المصادر التي استخدمت في وضع الأسس التي يستند إليها (نظام تقييم نوعية النصوص العربية) المقدم هنا.
ظهرت فكرة تقييم نوعية النصوص العربية من خطة وضع (المدونة العربية) التي هي سجل هائل لما كتب باللغة العربية لمدة 15 قرناً منذ فترة ما قبل الإسلام وحتى يومنا هذا. وتضم هذا المدونة كلّ ما يعتبر من أمهات مصادر العلم والمعرفة والثقافة المكتوبة باللغة العربية مقسمة على مختلف مراحل الحضارة العربية الإسلامية. ويسمح وجود هذه المدونة التي تضم ما يزيد على 10 آلاف مليون كلمة عربية فرصاً واسعة أمام الباحثين والمتخصصين وحتى الطلبة والدارسين للنظر عن كثب في محتوياتها المتوفرة في مكان واحد مستخدمين أحدث آليات البحث الإلكترونية. ومن النتائج المتوقعة لوضع (المدونة العربية) إعادة النظر في البنية التحتية للغة العربية وتحديث طرق تعليمها ووضع القواميس والمعاجم العربية بطرق حديثة تيسرها حتى لصغار طلاب المدارس الابتدائية. ومنها أيضاً بالطبع موضوعنا هنا ألا وهو وضع نظام علمي إلكتروني (لتقييم نوعية النصوص العربية).
أسس تقييم النصوص
- الالتزام بقواعد اللغة العربية الصحيحة:
لا يخفى على أي قارئ أن التزام النص المكتوب بقواعد الكتابة العربية الصحيحة يرفع من قيمة النص الأدبية والثقافية. فإن كان النص مليئاً بالأخطاء، سواء المطبعية أو تلك التي تعكس جهل الكاتب بقواعد اللغة العربية المعروفة سيجعل من الصعب قراءة ذلك النص بل وحتى رفضه ورفض كاتبه على أساس سوء الكتابة وعدم صلاحية النص للقراءة.
- استخدام الكلمات الفريدة وتجّنب التكرار:
كما أن تكرار نفس الكلمات والعبارات خصوصاً الشائعة خلال النص يزعج القارئ ويفقده الرغبة في الاستمرار بالقراءة. فكلما استخدم الكاتب عبارات أو مفردات لغوية مختلفة أو فريدة في النص لوصف حدث ما أو التعبير عن فكرة ما كّلما شد اهتمام القارئ وشوقه وأبقى على رغبته في القراءة.
- الاستشهاد بالمصادر الأساسية:
وفي مجال ما يسمى بكتب الحقل أي الكتب والمصادر المتخصصة بحقل علمي معين كاللغة أو التاريخ أو الطب أو الفلسفة وغيرها من التخصصات العلمية والأدبية يكون استشهاد الكاتب بالمصادر الأساسية المعروفة في الحقل من نقاط القوة التي تهم القارئ المتخصص وتزيد ثقته بالمعلومات الواردة في النص.