Picture of حامد السحلي
التحليل الصرفي في غوغل
by حامد السحلي - Tuesday, 25 May 2010, 12:43 PM
 
السلام عليكم

غوغل ليس محركا يعتمد تحليلا صرفيا حتى على مستوى الإنكليزية
بل هو محرك إحصائي يعتمد على دراسات إحصائية تتضمن المحارف والمقاطع والكلمات وحتى العبارات
وبما أن هناك مسحا أشمل للإنكليزية على مستوى بناها اللغوية الجزئية
كما أنها أي اللغة لا تعتمد تصريفا بنيويا أي اشتقاقيا بل يغلب عليها أسلوب اللواحق والبادئات لهذا تستفيد من أسلوب خوارزميات البحث بحيث يظهر كما لو أن المحرك يقوم بتحليل صرفي والأمر ليس كذلك

أما في العربية فهناك عدة عوائق تجعل استفادة اللغة من خوارزميات البحث الإحصائي هذه أضعف
فالعربية لا تتبع نمطا موحدا لبناء الجملة فالجملة العربية حرة يمكن كتابتها بجميع التنسيقات بينما هناك نمط سائد في الإنكليزية ومعظم أبناء اليونانية واللاتينية وهو فاعل فعل مفعول به
النظام التأثيلي في العربية بنيوي ولا يمكن إخضاعه لأسلوب الللواحق والبادئات كما في اللغات الأوربية لهذا لا ينجح الأسلوب الإحصائي في ربط الكلمات العربية
المحتوى العربي ناقص فالعرب لا يكتبون الحركات وهذا يجعل هذا المحتوى شديد التشويش بالنسبة لأي معالجة آلية فـ ضَرَبَ و ضَرْبٌ وضُرِبَ جميعها تبدو لمحرك البحث كلمة واحدة

يبقى سؤال لا أستطيع الجزم به
هل النسبة إلى ربوة رَبَويّ صحيحة؟


2010/5/25
هذه هي الرسالة:

الأستاذ الفاضل حامد

عندي سؤال بخصوص محرك البحث قوقل

لماذا حين أبحث فيه عن كلمة رَبْوِيّ من ربوة

يظهر لي نتائج متعلقة بالربا ؟

الظاهر أنه لا يميز .. فما الخلل ؟
وهل هناك تقنيات مستعملة في التحليل لتجاوز مثل هذه الأخطاء ؟

أرجو إبلاغي بها مشكورا