التشابه الدلالي بين الجمل العربية من خلال تقنية ( BERTبيرت) الإلكترونية: دراسة تقييمية حاسوبية

نوع المستند : البحوث والدِّراسات.

المؤلف

المتطلبات الجامعية – جامعة مصر للعلوم والتکنولوجيا.

المستخلص

يهدف البحث إلى تقييم وتقويم أداة قياس تشابه الجمل (Sentence similarity) الملحقة بـ(BERT) المعدة من (Google)، التي يعتمد عليها بشكل كبير في البحوث المهتمة بمعالجة اللُّغات الطَّبيعيَّة، خاصة في تحسين مخرجات التَّرجمة الآليَّة[ ]، وذلك من خلال تتبع دقة مخرجاتها ودراسة تلك المخرجات، ثم ترجمة النتائج إلى إحصاءات توضح مدى دقة تعامل هذه الأداة المهمة مع اللُّغة.

وللوصول للهدف المنشود من البحث، تم الاعتماد على مدونة متوازية بين اللغة العربية واللغة الإنجليزية، ثم ترجمة عينة عشوائية من المدونة باللغة الإنجليزية على (Google Translate)[ ]، ثم محاذاة نتائج الترجمة مع المدونة باللغة العربية، ثم إدخال أزواج الجمل المتحاذية (Patterns) باللغة العربية إلى (BERT)؛ لقياس مدى التشابه الدلالي بينها من خلال الأداة (Sentence similarity).

وأمكن البحثُ من خلال التطبيق العملي وتحليل مخرجات (BERT)، التوصل إلى مواضع الخلل التي تعيق عمل الأداة مع اللغة العربية، مقارنًا تلك النتائج بتعامل الأداة نفسها مع اللغة الإنجليزية، وكانت النتيجة في صالح اللغة الإنجليزية؛ حيث بلغت نسبة كفاءة الأداة معها حوالي (65%)، في مقابل (40%) مع اللُّغة العربيَّة.

وقد وضع البحث مقترحًا يسهم إلى تحسين مخرجات تعامل (BERT) مع اللغة العربية، مستندًا في ذلك على نتائج تحليل عينة الدراسة، والوقوف على أبرز الأخطاء التي لم تستطع الأداة تخطيها، مما قلل من كفاءتها.

الكلمات الرئيسية

الموضوعات الرئيسية