ملخص الرسالة باللغة العربية
لقد أعطت نظم الترجمة المبنية على الترجمة الإحصائية نتائج جيدة بين اللغات التي تمتاز بتقارب في طريقة الصرف والقواعد النحوية مثل اللغة الانجليزية والفرنسية. هذه النظم مازالت تحتاج إلى تحسين عندما يتم استخدامها للترجمة بين اللغات المختلف ، بشكل كبير، في طريقة الصرف و البناء اللغوي ، خاصة بين اللغات الفقيرة بالتصريفات واللغات الغنية بالتصريفات كالانجليزية والعربية. هذه الرسالة تناقش طريقة مقترحة للإثراء اللغوي لنظم الترجمة الإحصائية المعتمدة على المقاطع. هذه الطريقة تم تطبيقها للترجمة من اللغة الانجليزية إلى اللغة العربية لكنها تعتبر طريقة مستقلة عن اللغة فيمكن استخدامها لتحسين الترجمة بين أي لغتين.
هذه الرسالة تعرض نظام ترجمة آلي من اللغة الانجليزية للغة العربية باستخدام أحدث نظم الترجمة الإحصائية المفتوحة المصدر “موسى”. وتضيف هذه الرسالة وسيلة لإثراء نظم الترجمة الإحصائية عن طريق تعزيز قدراتها ومفرداتها بمفردات خارج الجمل المتوازية التي استخدمت في مرحلة تدريبها. تم تقييم الطريقة المقترحة ومقارنة النتائج مع خمس نظم ترجمة آلية متاحة على الانترنت وكانت نتائج الترجمة للعربية أفضل خاصة في قواعد مطابقة الاسم من ناحية التذكير والتأنيث والعدد مع الفعل والصفة.
أظهرت نتائج التجارب على نظام الترجمة الذي يستخدم طريقة الإثراء اللغوي تحسنا في النص المترجم للعربية مقارنة مع النظام الأساسي الذي لم يستخدم هذه الطريقة. كما أعطى “التقييم الآلي لجودة الترجمة” باستخدام مقياس “بلو” ومقياس “إن آي إس تي” ارتفاعا كان حده الأدنى بنسبة 13% مقارنة بالنظام الأساسي. كذلك تم تسجيل تحسن في مطابقة الاسم في التذكير والتأنيث والمفرد والجمع والمثنى والعدد مع بقية مكونات الجملة كالأفعال والصفات عنها في النظام الأساسي.
رابط للإطلاع على الورقة البحثية المنشورة
Waleed Oransa, Mohamed Kouta and Mohamed Sakre. “Injected Linguistic Tags to Improve Phrase Based SMT”. In t he 2nd International Conference on Computer and Automation Engineering , ICCAE, Singapore, 2010.
http://www.ieeexplore.ieee.org/search/freesrchabstract.jsp?tp=&arnumber=5451681&queryText%3DOransa%26openedRefinements%3D*%26searchField%3DSearch+All
لقد أعطت نظم الترجمة المبنية على الترجمة الإحصائية نتائج جيدة بين اللغات التي تمتاز بتقارب في طريقة الصرف والقواعد النحوية مثل اللغة الانجليزية والفرنسية. هذه النظم مازالت تحتاج إلى تحسين عندما يتم استخدامها للترجمة بين اللغات المختلف ، بشكل كبير، في طريقة الصرف و البناء اللغوي ، خاصة بين اللغات الفقيرة بالتصريفات واللغات الغنية بالتصريفات كالانجليزية والعربية. هذه الرسالة تناقش طريقة مقترحة للإثراء اللغوي لنظم الترجمة الإحصائية المعتمدة على المقاطع. هذه الطريقة تم تطبيقها للترجمة من اللغة الانجليزية إلى اللغة العربية لكنها تعتبر طريقة مستقلة عن اللغة فيمكن استخدامها لتحسين الترجمة بين أي لغتين.
هذه الرسالة تعرض نظام ترجمة آلي من اللغة الانجليزية للغة العربية باستخدام أحدث نظم الترجمة الإحصائية المفتوحة المصدر “موسى”. وتضيف هذه الرسالة وسيلة لإثراء نظم الترجمة الإحصائية عن طريق تعزيز قدراتها ومفرداتها بمفردات خارج الجمل المتوازية التي استخدمت في مرحلة تدريبها. تم تقييم الطريقة المقترحة ومقارنة النتائج مع خمس نظم ترجمة آلية متاحة على الانترنت وكانت نتائج الترجمة للعربية أفضل خاصة في قواعد مطابقة الاسم من ناحية التذكير والتأنيث والعدد مع الفعل والصفة.
أظهرت نتائج التجارب على نظام الترجمة الذي يستخدم طريقة الإثراء اللغوي تحسنا في النص المترجم للعربية مقارنة مع النظام الأساسي الذي لم يستخدم هذه الطريقة. كما أعطى “التقييم الآلي لجودة الترجمة” باستخدام مقياس “بلو” ومقياس “إن آي إس تي” ارتفاعا كان حده الأدنى بنسبة 13% مقارنة بالنظام الأساسي. كذلك تم تسجيل تحسن في مطابقة الاسم في التذكير والتأنيث والمفرد والجمع والمثنى والعدد مع بقية مكونات الجملة كالأفعال والصفات عنها في النظام الأساسي.
رابط للإطلاع على الورقة البحثية المنشورة
Waleed Oransa, Mohamed Kouta and Mohamed Sakre. “Injected Linguistic Tags to Improve Phrase Based SMT”. In t he 2nd International Conference on Computer and Automation Engineering , ICCAE, Singapore, 2010.
http://www.ieeexplore.ieee.org/search/freesrchabstract.jsp?tp=&arnumber=5451681&queryText%3DOransa%26openedRefinements%3D*%26searchField%3DSearch+All