از زمان ورود ترجمه ماشین به صنعت ترجمه حرفه ای ، سؤالاتی درمورد اینکه چه تأثیری در محصول نهایی خدمات ترجمه تحویل یافته خواهد داشت ، وجود داشته است. در بیشتر تاریخ MT ، بسیاری از مترجمان ادعا می کردند که در حالی که کار تولید ترجمه با استفاده از فرآیند MT (PEMT) که پس از ویرایش انجام شده سریعتر است ، محصول نهایی چندان مناسب نبود. تحقیقات نشان می دهد که این امر از منظر زبانی کاملاً صحیح بوده است ، اما بسیاری از ما نیز می دانیم که PEMT کاملاً با محتوای فنی خصوصاً با اصطلاحات و سازگاری حتی در روزهای SMT و RBMT با موفقیت کار کرده است.

با تکثیر سیستم های NMT ، ما در یک نقطه عطف هستیم و من گمان می کنم که شاهد سیستم های NMT بیشتری خواهیم بود که در واقع به عنوان تولید خروجی مفیدی است که به طور واضح باعث افزایش بهره وری مترجم می شود ، به خصوص در مورد خروجی سیستم های ساخته شده توسط متخصصان. همچنين احتمالاً NMT در كيفيت خروجي تاثيري خواهد گذاشت و احتمالاً تفاوت آن نيز كمتر برجسته خواهد بود. این منظور از توسعه دهندگان است که ادعای دستیابی به برابری انسانی را مطرح می کنند. اگر مترجمان ذیصلاح انسانی نتوانند بگویند بخشهایی که آنها بررسی می کنند از MT یا نه ، ما می توانیم ادعای محدودی برای دستیابی به برابری انسانی داشته باشیم. این بدان معنی نیست که این برای هر جمله جدید ارسالی به این سیستم صادق است.

ما همچنین باید درک کنیم که MT بیشترین ارزش را برای سناریوهای استفاده فراهم می کند که در آن شما حجم زیادی از مطالب (میلیون ها نفر به جای هزاران کلمه) ، زمان چرخش کوتاه و بودجه محدود وجود دارد. MT به طور فزاینده ای در سناریوهایی استفاده می شود که ویرایش کمی یا بعد از آن انجام نشده است ، و با توجه به بسیاری از تخمین های آگاهانه ، ما در حال حاضر با یک تریلیون کلمه در روز در حال عبور از موتورهای MT هستیم. اگرچه پس از ویرایش ممکن است مورد توجه مهمی در سناریوهای استفاده از بومی سازی باشد ، این احتمالاً بیش از 2٪ از کل استفاده MT نیست.

استفاده از Enterprise MT به سرعت در حال جابجایی به مرحله ای است که یک منبع IT در سطح سازمانی است. شرکت مدرن جهانی باید میلیون ها کلمه را به صورت امن و خصوصی ترجمه کند و نیاز به ادغام عمیق در ارتباطات انتقادی ، همکاری و ایجاد نرم افزار و مدیریت محتوا داشته باشد.

تحقیقات ارائه شده توسط آنتونیو تورال در زیر تأثیر ویرایش پس از ویرایش بر روی خروجی نهایی را در چندین ترکیب مختلف زبان و سیستم های MT نشان می دهد.

==============

این خلاصه ای از مقاله “پس از ویرایشگر: ترجمه ای تشدید شده” از آنتونیو تورال است ، که در MT Summit 2019 ارائه شد ، در آنجا جایزه بهترین مقاله را کسب کرد.

مقدمه

ویرایش پس از ویرایش (PE) در صنعت ترجمه به طور گسترده ای مورد استفاده قرار می گیرد ، به این دلیل که منجر به بهره وری بیشتر از ترجمه بی رویه انسان (HT) می شود. اما ، در مورد ترجمه نتیجه چیست؟ آیا ترجمه های PE به اندازه HT خوب هستند؟ چندین تحقیق پژوهشی در دهه گذشته به این موضوع نگاه کرده اند و به نظر می رسد اجماع وجود دارد: PE به اندازه HT یا حتی بهتر است (Koponen، 2016).

بسیاری از این مطالعات با شمارش تعداد خطاها در آن ، کیفیت ترجمه ها را اندازه گیری می کنند. با توجه به اینکه بیشتر از تعداد خطاها کیفیت بیشتری دارند ، در عوض از خودمان این سؤال را می پرسیم: آیا تفاوت هایی بین ترجمه های تولید شده با PE vs HT وجود دارد؟ به عبارت دیگر ، آیا خروجی نهایی ایجاد شده از طریق PE و HT دارای صفات متفاوتی است؟

مطالعات قبلی از وجود ترجمه (ترجمه) پرده برداری کرده اند ، یعنی این واقعیت که HT ها و متون اصلی ویژگی های مختلفی از خود نشان می دهند. این خصوصیات را می توان در کنار به اصطلاح جهانی ترجمه (Baker، 1993) و قوانین اساسی ترجمه (Toury، 2012) ، یعنی ساده سازی ، عادی سازی ، اکتشاف و دخالت گروه بندی کرد. در طول این خط فکری ، ما با هدف رویارویی با PE و HT با استفاده از مجموعه ای از تحلیل های محاسباتی که با کلیات ترجمه جهانی و قوانین ترجمه ، از وجود ویرایش های بعد از ویرایش (یعنی واقعیتی که PE و HT ها ویژگی های مختلفی را به نمایش می گذارند) پرده برداری می کنیم. .

داده ها

ما در آزمایشات خود از سه مجموعه داده استفاده می کنیم: Taraxü (Avramidis et al.، 2014)، IWSLT (Cettolo et al.، 2015؛ Mauro et al.، 2016) و Microsoft “Parity Human” (حسن و همکاران ، 2018). این مجموعه داده ها پنج جهت مختلف ترجمه را در بر می گیرد و به ما اجازه می دهد تا تأثیر سیستم های ترجمه ماشین (MT) از سال 2011 ، 2015-16 و 2018 را بر روی PE حاصل از آن ارزیابی کنیم.

تجزیه و تحلیل
تنوع واژگانی

ما تنوع واژگانی یک ترجمه (HT ، PE یا MT) را با محاسبه نسبت نوع-نشان آن ارزیابی می کنیم:

به عبارت دیگر ، با توجه به دو ترجمه به همان اندازه طولانی (تعداد کلمات) ، واژگان با واژگان بزرگتر (تعداد بیشتر کلمات منحصر به فرد) TTR بالاتری دارند ، بنابراین از نظر واژگانی غنی تر یا از نظر واژگان بیشتر هستند.

شکل زیر نتایج مربوط به مجموعه داده های مایکروسافت را برای جهت چینی به انگلیسی نشان می دهد (zh-en ، نتایج سایر مجموعه های داده ها روند مشابه را دنبال می کند و می توانید در مقاله مشاهده کنید). HT دارای بالاترین وجه واژگانی و به دنبال آن PE است ، در حالی که کمترین مقدار i

ترجمه مقاله

tinyurlrebrandlybitly