تابعنا
الرئيسية / مقالات


مشاركة المقال عبر



الترجمة الآلية الإحصائية -التي تفوق ترجمة جوجل- مبنيَّة على فكرة أنه اذا أطعمت الحاسوب (مع ذاكرته الضخمة ومساحة لا وجود لها لأجل منطق بديهي و سريع) معلومات كافية على شكل نصوص متوازية في لغتين فهو سيكون قادر على أن يكتشف و يشكِّل الأنماط الإحصائية بينهم. الجانب الآخر من هذا الاتجاه هو أن النظام يتعلم بنفسه ولا يحتاج معالجة إنسانية شديدة كالترجمات الآلية المنغلقة المبنية على القواعد. فبعد إعطاء الأمر كل ما عليك فعله هو مواصلة إطعام المواد للآلة لكي تستطيع بناء الكوربس (أساس الجسم أو المكنز) كنبتة أودري الثانية من فيلم محل الرعب الصغير. (الكوربس هي عبارة عن جسم يحتوي على نصوص متوازية من لغتين أو أكثر كروزيتا ستون أو حجر رشيد ولكنها أكبر بكثير من ناحية الحجم؛ فإن كانت فوق 30 مليون كلمة متوازية فتعتبر كوربس تدريبية جيدة).

فطريقة عمل الآلة لهذا هو بتشبيك مليون نص متوازي أو جُمل في لغتين و تقسيمهم في مجموعتين أو ثلاث من الكلمات الصغيرة يطلق عليها بـ(n-grams). بعدما يكتمل سيستطيع النظام تمييز الأنماط بين النصين المتوازيين ويضع قوانين الترجمة على أساس الترتيب الذي تظهر فيه الـ(n-grams) في كلا النهايتين. و لفعل ذلك سيأخذ الحاسوب كل نماذجه من الكوربس الخاصة به من دون إرشاد نحوي فهو لا يحتاج إليها. فكل ما يراه هو خليط من الحروف الإنجليزية مترابطة مع خليط من الحروف الفرنسية متعلقة مع ثاني أقرب خليط من الكلمات. يربط عقل الإنسان طبقات من المعاني لكل جملة – تتعرف الآلة فقط على أوتار من الأوامر.

ولكن كنظرية الغَشتَلت والتي تقوم بتعليمها مدرسة للأفكار من الثقافة النظرية: من الممكن أن تفهم الكل بفحص أجزاءه فقط. يملك الاتجاه الإحصائي مشاكل، و شرح جيمس فالوز لمجلة أتلانتيك مشكلة واحدة أساسية وهي إطعام ترجمة جوجل نفسها من الصحن الذي تبصق فيه -الإنترنت-:

“الترجمة المحوسبة أفضل من لا شيء، ولكن الأفضل هي أنها تقريبية جدًّا، جربها بنفسك: اذهب إلى الموقع الصيني يوميات الناس؛ اقتبس رابط لأي قصة وضعه في موقع ترجمة جوجل؛ ولترى مدى قرابة النتيجة للغة الإنجليزية. وبالكاد ستفهم المغزى من القصة. و إضافةً لذلك، بما أن هذه النسخ المتقابلة تجسد مستوى نظام الحوسبة الحالي، فبكل معنى لا يوجد أي أمل لأي تطور”

هذه هي المشكلة. كلما زاد انتشار هذه الترجمة التلقائية إلى مواقع العالم، كلما قلَّت نسبة الترجمة الجيدة التي يمكن من الحواسيب التعلم منها. من ناحية هندسية، نسبة الإشارة إلى التشويش تصبح أسوء… فهذا هوالحاسوب – يعادل العالم بالإهمال و فرط الاستعمال للمضادات الحيوية التي تُحدث مصاعب جديدة للبكتيريا المقاومة للمخدرات.

بشكل ملوَّن أكثر ولكن مساوي لمستوى الضرر، ضع بعين الاعتبار أيضا أن مشكلة التقرب من نصوص جديدة بعُكَّازات النصوص القديمة هو أنَّ تراكيب التفكير القديم ستفسد المحتوى. على سبيل المثال، جنَّست اللغة الألمانية الأسماء بما فيها ألقاب الوظائف. مهندس ذكر سيكون (Ingenieur) ومهندسة أنثى ستكون (Ingenieurin). مشكلة الكوربرا (جمع أجسام) للنصوص مسبقة الوجود هي أنها حقًّا قديمة.

قالت ناتالي كيلي نائبة “رئيس سمارتلنق” شركة لإدارة الترجمة ومنشأة للحوسبة السحابية: “إضافة إلى أن الضمائر الذكرية ممثَّلة بشكل كلي في التاريخ لأغلب اللغات و الثقافات، تميل الترجمة الآلية بتجسيد التفضيل الذكوري في التاريخ” هذا يعني أن الترجمة الآلية الإحصائية تمحو المهندسين الإناث و الممرضات الذكورعندما تتحرك بقوة.

حاليًا، تعتمد الترجمة الآلية على التحليل. ولكن اللغات الطبيعية حتى على مستويات رسمية اعتيادية غير قابلة للتحليل. يعتمد شكل معاني الكلمات الخاصة بهم على الوقت و السياق و الترنيم لأن البشر نفسهم غير متناغمين في استخدام اللغة.

وتبعها في ذلك حتى الآن، تُظهر الترجمة الآلية نتيجة أفضل في الكتابة العلمية و التقنية أي شي يتعلَّق بالمعادلات. أينما ينحرف استخدام اللغة عن الإعتيادي حين تكون أكثر رواجًا أو ابداعًا الترجمة الآلية ستهتز. هذا يؤثر على المفاهيم التي تملك جذور ثقافية قوية. رفع باحثوا جامعة كاليفورنيا في لوس أنجليس (UCLA) الأعلام الحمراء هذا الصيف لجذب الاهتمام على حقيقة أن الكثير من الأدوية الصينية التقليدية ضائعة في الترجمة، لأن الكثير من مفاهيمها لا تملك تطابق مع اللغة الإنجليزية؛ فهم ملتزمين بفهم ثقافة اللغة الصينية والتي لايمكن اكتسابها من غير الانغماس داخل الثقافة.

لنفرض بأن الترجمة الآلية في طريقها لإنتاج مستندات نصية صوتيه دلاليَّة صحيحة سنكون بحاجة ليد الإنسان كما لا تنتهي ترجمة المحتوى بمستند نصي حقيقي.

بأبسط مستوى، هناك تضاؤل وازدياد للنص – تأخذ لغات مختلفة مساحة سطر بكميات مختلفة – كلمات طويلة أو قصيرة أو ببساطة أعداد مختلفة منها – لتوصيل نفس المحتوى. تصل أسطر اللغة الألمانية إلى أكثر من 30 بالمئة أطول من أسطر اللغة الإنجليزية و التي تساوي جدِّيًّأ عندما يُعاد رمي تصميم تلقائيًّا بدون اهتمام من المصمم. ويجدر بالذكر أن زيادة ثخونة الحروف الإستهلالية في اللغة الألمانية تؤثِّرعلى لون النص. وهناك أيضًا علامتا الإقتباس واللتان تأتيان في قوس قزح من التطبيقات والأشكال الثقافية. و أثناء حديثنا الترقيمي فكّر أيضا بالهتاف العكسي و علامات الإستفهام في كتابة اللغة الإسبانية.

وهذا فقط في الترجمة بين اللغات باستخدام الحروف اللاتينية. غالبًا يكون من الصعب موازنة لغات الرسم التفكيري (Ideograph) كاللغة الصينية المبسطة للون مُوحَّد بسبب الرموز الغير متوازنة. على أي حال سيحتاجون الكثير من المساعدة السّخية (مسافة بين السطور) لتبقى مقروءة بسبب العدد العالي لجرة القلم (عدد الخطوط التي تركِّب الحرف) في الحرف الواحد والتي تشبه كثيرًا مكعبات مقاطع اللغة الكورية. وبالنسبة لاتجاه القراءة، يُقرأ نُسُق التاتيقاكي للغة اليابانية من اليمين إلى اليسار كاللغة العربية، إضافةً إلى أنها لا تتصل ولكن لديها طرق أخرى لحل مشاكل المحاذاة. تقوم محاذاة كاشيدا بإطالة الحروف (بدلًا من المساحة البيضاء بينهم) لتعوِّض لون النص.

باختصار، يتغيَّر تمثيل النص و معناه مع اللغة كما تفعل الإيماءات عندما تُنطَق. لضبط نص مُتَرجم على نحو ملائم ستكون بحاجة لمحرك ترجمة خاص به. أو بشكل واقعي أكثر مراقب إخراج طباعي منظوم.

 


شاركنا

جميع الحقوق محفوظة للمصادر الأصلية للمواد المنشورة

ونرحب بتلقي اسهامتكم والإنضمام إلى فريق التحرير والترجمة بالمجلة