Picture of حامد السحلي
Re: إنشاء أكبر ذاكرة ترجمة عربية على الإنترنت
by حامد السحلي - Thursday, 27 May 2010, 02:01 PM
 
السلام عليكم
وشكرا للأخ حسن والأخت ياسمين كما أكرر شكري للأخ وليد
قبل الخوض في موضوع ذاكرة الترجمة دعوني ألخص رؤية عامة لآليات وأهداف المعالجة الآلية للغات الطبيعية حاليا
هناك قول شائع أن معالجة آلية شبه إنسانية للغة وهي هدف الأبحاث والبرمجيات يمكن أن تتحقق بأحد حالتين:
إما نمذجة شاملة للآليات اللغوية الطبيعية أي الآليات التي يفكر بها الإنسان وهذا عمل بالغ الصعوبة لأنه يتطلب خبرات عميقة وواسعة في اللسانيات وعلم النفس اللغوي والبرمجة وهو جهد إنساني لا تساعد الآلة به كثيرا..
الحالة الثانية هي تراكم كميات هائلة من النصوص المفهرسة والمصنفة والمقَارنة بحيث تغطي كافة الاحتمالات اللغوية وهذا يتطلب أيضا سرعة معالجة هائلة وهذه الفكرة هي أساس فكرة المكانز ورغم أن جزءا من محتوى المكانز خاطئ أو غير دقيق إلا أن الحجم الهائل لها يتيح تجاوز هذه الأخطاء وهو ما تقترب منه خدمات الترجمة الآلية ذات المكانز الهائلة كغوغل في اللغات شديدة التقارب كالإنكليزية والألمانية والهولندية أو الفرنسية والبرتغالية والإسبانية

في اللغة العربية ما يزال أكبر مكنز أحادي اللغة دون البليوني حرف وهو غير مفهرس أما أكبر مكنز مع فهرسة بسيطة فلعله مكنز منى دياب في كولومبيا الذي يضم أقل من 300 مليون محرف أما كمكنز كامل الفهرسة والتصنيف فلا يوجد سوى مكنز القرآن الذي لم يكتمل والذي يعود الفضل به بداية للأسف لجامعة حيفا أي قريبا من 700 ألف محرف مقارنة بمكانز مصنفة للغة الإنكليزية تقترب من بليون محرف

هذا الجهد أي إنشاء مكانز شاملة لا يمكن أن يتحقق فرديا ولا حتى مؤسسيا فهو إما حكومي أو موزع أي تراكم جهود وهذا هو الحال فجميع المكانز الشاملة هي تراكم جهود المئات وربما الآلاف وهي كلها تقريبا مجانية حرة لا يملكها أحد إلا في عالمنا العربي
فالاضطراب القانوني سمح لشركات أن تستغل شيئا من الحاجة والجهل ويكفي أن تقارن اتفاقية ترخيص أي موقع ضخم كمكتوب بمواقع جهد جماعي مماثلة كوورد بريس أو ياهو جيوسيتيز لتدرك الفرق فالجهد الجماعي في عالمنا العربي ملك للشركة التي أتاحت إنشاءه بينما كل ما يمكن لووردبريس دون كوم أن يفعله هو حجب الخدمة ولكنه أبدا لا يملك المحتوى بل يستضيفه ويملكه أصحابه

ولهذا أنا لا أؤيد الأخت ياسمين بالقول إن المصادر الحرة غير معروفة الخبايا غير صحيح أبدا فهناك آليات ونظم قانونية تطورت تجعل المحتوى حرا للأبد وبالغ الوضوح إلا أن يتمالأ الجميع أي جميع من لهم وصول على إسقاط هذه الحرية وهو ما لا يتصور حدوثه
طبعا الحرية ليست قولا فقط فسورس فورغ مثلا هو أكبر حاضنة للبرمجيات المفتوحة عالميا وقد قامت منذ فترة بحجب مواطني سبع دول بموجب القانون الأمريكي ولكن محتوى سورس فورغ موجود ولكنه غير متاح للجميع على عدة مرايا غير أمريكية لعل أشهرها المرآتين الألمانية واليابانية وهذا أمر بالغ الأهمية يؤكد عليه مجتمع المصادر المفتوحة ألا يكون لجهة واحدة هيمنة على المصادر المفتوحة رغم أنها قد تكون المزود الوحيد عالميا ولكن هناك عشرات الآلاف ممن يحتفظون بنسخ بحسب أهمية المحتوى فنواة لينكس قد يصل عدد من يملكون نسخا كاملة عنها منذ بدايتها وحتى اللحظة إلى مئات الآلاف نأتي إلى الجهد الجماعي الحساس وهو الذي يتحكم بثقافتنا وبالتالي حريتنا على المدى البعيد أي المكانز اللغوية والترجمية (متعددة اللغات) فهذه يجب أن نشدد على إنشائها بنفس نمط الحرية التي أنشأت به المكانز المماثلة في الغرب لكيلا يستطيع أحد أن يتحكم بها وبالتالي وكأنه امتلك جهود الآلاف من العرب بالمجان
وهذا الأمر ليس صعبا ويتطلب فقط ترخيصا مفتوحا واضحا وإتاحة هذه البيانات للنسخ الاحتياطي أولا بأول وهذا لن يجرد الخدمة التي يقدمها الحاضن من قيمتها ولكنه يتيح الأمان وبالتالي التعاون من المترجمين العرب الذين يرغبون بالتطوع.. ألا يتيح هذا للبعض نسخ الجهد ومنافسته بلى ولكن عندما يكون الجهد متميزا لن يكون هناك جدوى من المنافسة خصوصا إن كان العمول مفتوحا على التشارك فالجميع قادر على نسخ ويكيبيديا ولا يتطلب إعداد نسخة أكثر من يومي عمل ولكن هل هناك نسخة؟
ما الحاجة لذلك فأنت لا تستطيع تحويل المحتوى إلى مملوك رغم أنه يمكنك نسخه ولكن لا يمكنك أبدا الإضافة إليه والنشر بدون أن يخضع نشرك لنفس الترخيص الذي يمكن بسهولة مثلا أن يمنع الاستخدام لغايات تجارية
كنت قد أكدت في عدة مرات سابقة أن هذه الخطوات حتمية فالترجمة الآلية أمر قادم حتما ولكن من الذي سيقود العمل وبالتالي يحدد معايير الصح والخطأ واللغة التي سيتم اعتمادها..
غوغل مثلا تجمع ذاكرة ترجمة في خدمة الترجمة الفورية التي تقدمها وقد دعمتها بآلية للرومنة وآلية للتشكيل هما من أسوإ ما يهدد العربية.. والذاكرة التي تجمعها لا ترقى لكونها ترجمة حقيقية ولغتها تكاد تكون عامية ولكن قوة غوغل وانتشاره الهائل سيجعلان هذه الآلية على سوئها تصبح مصدرا للمعلومة بعد فترة ما لم يكن هناك بديل نصنعه نحن وفق رؤيتنا للغتنا كما يجب أن تكون

هل يمكن للآلة أن تحل محل المترجم؟
عربية القرآن (عصر الاحتجاج) في مواجهة الفصحى الحديثة

أعتذر عن الإطالة وللحديث بقية