Մեքենայական թարգմանություն. նոր իրականությու՞ն, թե՞ մարտահրավեր

2023-06-30 1612

Երբևէ կպատկերացնեի՞ք, որ մի օր արհեստական բանականությունը կներթափացնի մեր կյանք և կգրավի իր դիրքը գրեթե բոլոր հնարավոր և անհնարին թվացող ոլորտներում։ Կա՞ արդյոք մի ոլորտ, որը կարողացել է վրիպել արհեստական բանականության նետած գնդակներից:

Այսօր կյանքի շատ ոլորտներ ավտոմատացված են, իսկ ամենուր ռոբոտներին հանդիպելը, նրանց կողմից սպասարկվելը և նրանց հետ խոսելը շուտով ևս սովորական կդառնա։ Քիչ չեն այնպիսի մասնագիտությունները, որոնք իրենց տեղը զիջել են մեքենաներին, քանի որ մեքենան աշխատանքը կատարում է ճշգրիտ, մի քանի անգամ ավելի արագ և էժան։ Ահա թե ինչպես է արհեստական ինտելեկտը (AI) գրավել թե՛ մեր կյանքը, թե՛ աշխատանքային տիրույթը։

Թարգմանության մեծ ու բազմաշերտ ոլորտը ևս չի կարողացել անմասն մնալ մերօրյա փոփոխությունների փոթորկից: Ժամանակակից թարգմանության դարաշրջանում ի հայտ եկած նոր պարադիգմը՝ տեխնոլոգիական գործիքները, զբաղեցնում են իրենց ուրույն տեղը հասարակության մեջ ընդհանրապես և թարգմանության մեջ՝ մասնավորապես։ Այնուհանդերձ, այս նոր պարադիգմը ստիպում է մեզ վերագնահատել թարգմանչի տեղն ու դերը:

Մեքենայական թարգմանությունը արհեստական ինտելեկտի դրսևորումներից մեկն է, որն ակնթարթորեն փոխակերպում է տեքստը մի բնական լեզվից մյուսին: Հատկապես վերջին շրջանում մեքենայական թարգմանության շարունակական բարելավումները ստվերում են իրական թարգմանչի անխոջ ու բարդ աշխատանքը: Արդեն իսկ կան մտավախություններ, որ ոչ հեռու ապագայում մեքենայական թարգմանությունը կկարողանա ամբողջությամբ փոխարինել թարգմանչին, և գուցե կենդանի թարգմանիչները ստիպված լինեն վերապրոֆիլավորվել։ Բայց արդյո՞ք մեքենան կարող է լիովին վերարտադրել բնագիրը՝ ամուր կառչելով հեղինակի մտքերից, հույզերից ու զգացմունքներից: Արդյո՞ք մեքենան կարող է ապահովել ընթերցող-հեղինակ անքակտելի կապը, ներթափանցել բնագրի տողերի խորքը, հենքում անխախտ պահելով բնագրի միտքը և թիրախ լեզվի ընթերցողի սրտում հյուսել միևնույն նոտաների փունջը, որ հեղինակը կուզեր շշնջալ նրա ականջին՝ վերջինիս մայրենի լեզվով:

Մեքենայական թարգմանությունը որակավորելու համար նախ և առաջ պետք է հասկանալ, թե ինչ համակարգով է գործում այն:

Հիմնված լինելով վիճակագրության՝ ալգորիթմների շղթայի վրա, մեքենան բառացիրորեն կապ չունի ոչ կոնտեքստի և ոչ էլ առավել ևս լեզվի ու մշակույթի հետ, այդ իսկ պատճառով շատ հաճախ մենք բախվում ենք ծիծաղելի թարգմանությունների։ Համակարգը թիրախավորում է աղբյուր լեզվի օրինաչափությունները, բաժանում յուրաքանչյուր նախադասություն առանձին բառերի կամ արտահայտությունների, ալգորիթմների միջոցով հաշվարկում դրանց թարգմանությունը թիրախ լեզվում (որոնք արդեն իսկ թարգմանվել են մարդկային թարգմանիչների կողմից և հայտնվել են օնլայն տիրույթում) և առաջարկում է ամենահաճախ հանդիպող թարգմանությունը:

Ամեն ինչ այնքան հեշտ չէ, ինչպես թվում է։ Համակարգում ընդգրկված որոշ լեզուներ, օրինակ հայերենը, չունեն բավականաչափ տվյալների բազա: Նման դեպքերում անհրաժեշտ է ևս մեկ երրորդ լեզվի միջնորդություն, իսկ 99.9% դեպքերում դա անգլերենն է: Երբեմն էլ չորրորդ լեզու է պետք ընդգրկել գործընթացում։ Օրինակ, եթե ցանկանում եք թարգմանել արտահայտությունը կատալոներենից դեպի մեկ այլ լեզու, ապա տեքստը կթարգմանվի սկզբում իսպաներեն, ապա՝ անգլերեն, իսկ հետո այն լեզվով, որը դուք ցանկացել եք: Պատճառն այն է, որ կատալոներենը Իսպանիայի պետական լեզուներից մեկն է, հետևաբար զուգակցված տեքստեր համացանցում շատ կան։ Սա բարդ գործընթաց է, որը բացատրում է, թե ինչու Google Translate-ը արդարացնում է իրեն որոշ լեզուներում, բայց հազիվ է գլուխ հանում այլ լեզուներից: Ալգորիթմները հիմնված են ինտերնետում գոյություն ունեցող նյութերի քանակի և որակի վրա: Եթե նույնիսկ օրինակների վրա չհիմնվենք, միայն այս տվյալները իմանալով կարելի է արդեն պատկերացնել, թե որքան ինֆորմացիա է կորում, փոփոխվում ու խեղաթյուրվում աղբյուրից թիրախ լեզու անցնելիս և դեռ ավելին՝ միջնորդավորված թարգմանության պարագայում։ Սա մեզ հիշեցնում է մեր մանկության խաղերից մեկը՝ փչացած հեռախոսը, երբ չգիտես ինչպես «խնձոր» բառը մինչև մեզ էր հասնում, այնքան էր ձևափոխվում, որ վերջում դառնում էր «աթոռ»։

Բացի այս բոլոր փաստերից, պետք է չմոռանալ, որ մարդիկ մշակութային էակներ են, ինչը նշանակում է, որ մեզանից յուրաքանչյուրը կիսում է միատեսակ մշակույթ, մտահորիզոն, պատկերացում, ապրելակերպ և այլն, որը տարբերվում է թե՛ ազգից ազգ, թե՛ սերնդից սերունդ: Մշակութային տարբերությունները՝ յուրահատուկ արտահայտություններ, բառակապակցություններ, ժարգոն, ասացվածքներ, նույնպես տարբերվում են մշակույթից մշակույթ: Սխալ թարգմանված արտահայտությունները կարող են վիրավորական հնչել կամ նույնիսկ անհեթեթ թվալ, և եթե իրական թարգմանիչը ծանոթ է մշակույթին և լեզվակրին, ապա գիտի, թե ինչպես «ծռել» լեզուն՝ տեղացիներին սիրաշահելու համար:

Դիտարկենք մի քանի օրինակներ, որոնք վերցված են Ռեյ Բրեդեբերիի «Ֆարենհայթ 451°» գրքից։ Մեքենայական թարգմանության բացերը ի ցույց դնելու համար կհամեմատենք Google Translate-ի թարգմանվածքը իրական թարգմանչի՝ Լուսինե Հարոյանի կատարած աշխատանքի հետ։

Ստորև ներկայացված են 3 նախադասություններ, որոնք պարունակում են «parlor» (սրահ, առանձնատան հյուրասենյակ) բառը: Իրական թարգմանիչը բառը տարբեր հատվածներում տարբեր կերպ է թարգմանում՝ կախված իրավիճակից և համատեքստից։ Մինչդեռ մեքենան բոլոր դեպքերի համար տվել է «parlor» բառի նույն թարգմանությունը։

ա)

“I rarely watch the 'parlor walls' or go to races or Fun Parks”.

«Ես հազվադեպ եմ դիտում «սրահի պատերը» կամ գնում մրցավազքի կամ զվարճանքի զբոսայգի»:

«Ես հազվադեպ եմ հեռուստանովելներ դիտում և գրեթե չեմ լինում զբոսայգիներում, չեմ սիրում պտուտարշավ կարուսելներ նստել»։

 

Ինչպես համատեքստից հասկանալի է դառնում, «parlor walls» բառակապակցությունը վերաբերում է «հեռուստասերիալներին», ահա թե ինչու թարգմանիչը տվել է «հեռուստանովելներ դիտել» տարբերակը, մինչդեռ մեքենան թարգմանել է «սրահի պատեր» (ուղիղ թարգմանություն), քանի որ GT-ում ամենահաճախ հանդիպող համարժեք թարգմանությունը «սրահ» բառն է։

 

բ)

"Will you turn the parlor off?" he asked. "That's my family."

«Կանջատե՞ք սրահը»։ Նա հարցրեց. «Դա իմ ընտանիքն է»:

«Հեռուստասենյակի պատերը կանջատե՞ս,- խնդրեց Մոնթագը։ Նրանք իմ ընտանիքն են»։

 

Երկրորդ աղյուսակում տեսնում ենք, որ թարգմանիչը գերադասել է թիրախ լեզվում կիրառել մասնավորեցման մեթոդը, թարգմանելով «parlor» բառը որպես «հեռուստասենյակի պատեր»։ Մինչդեռ GT-ն այն դարձյալ թարգմանել է «սրահ»։

 

գ)

The parlor "aunts" began to laugh at the parlor "uncles."

Սրահի «մորաքույրները» սկսեցին ծիծաղել սրահի «հորեղբայրների» վրա։

Հեռուստասենյակի «մորաքույրները» ծիծաղում էին հեռուստասենյակի «հորեղբայրների վրա»։

 

Երրորդ աղյուսակում տեսնում ենք, որ իրական թարգմանիչը տվել է պարզապես «հեռուստասենյակ» տարբերակը: Եթե վստահենք մեքենայի թարգմանությանը և կիրառենք «սրահ» տարբերակը ապա կբախվենք նորաբանության խեղաթյուրման խնդրին: Խոսենք փաստերով․ վեպը գրվել է 1950-ականներին, իսկ այդ ժամանակների համար ունենալ պատի ամբողջ ծավալով ձգվող հեռուստացույց ֆանտաստիկայի ժանրից կարող էր լինել: Ահա թե ինչու է պետք շեշտել նորաբանության կիրառությունը, հակառակ պարագայում՝ «սրահ» թարգմանելը պարզեցնում է հեղինակի միտքը և լղոզում վերջինիս շեշտադրումները:

Երեք նախադասություններում «սրահ» բառն օգտագործվում է տարբեր իմաստներով, և թարգմանչի պարտականությունն է համարժեքը գտնել ԹԼ-ում՝ միաժամանակ չշեղվելով համատեքստից: Ինչ վերաբերում է GT-ին, այն չկարողացավ լուծել խնդիրը և տրամադրեց նույն թարգմանությունը բոլոր երեքի համար էլ: Ալգորիթմները թիրախավորել են սրահ բառը որպես ամենահաճախ գործածվող բառ և մատուցել են մեզ:

Դիտարկենք ևս մեկ օրինակ:

 

The Hound half rose in its kennel and looked at him with greenblue neon light flickering in its suddenly activated eyebulbs.

The Hound կեսը վեր կացավ իր բուծարանում և նայեց նրան կանաչ կապույտ նեոնային լույսով, որը թրթռում էր իր հանկարծակի ակտիվացած ակունքներում:

Մեխանիկական շունը բնի մեջ կիսով չափ կանգնեց ոտքերի վրա ու նայեց նրան. հանկարծակի կենդանացած նրա բիբերում կապտականաչավուն նեոնային կայծեր ցոլացին:

 

Տվյալ օրինակում ունենք նորաբանության երկու կիրառություն՝ «hound» և «eyebulb», որոնցից առաջինը գործածվել է մեխանիկական շուն իմաստով, իսկ երկրորդը` աչքեր, բայց այստեղ կարևոր է թիրախ լեզվում ընտրել այնպիսի համարժեք, որը միևնույն ժամանակ կարտահայտի և՛ աչքեր իմաստը, և՛ կընդգծի դրանց արհեստածին լինելը: «Hound»-ը թիրախ լեզվում մնացել է չթարգմանված, քանի որ մեքենայի ունեցած տվյալների բազայում այդ բառի հայերեն համարժեքը չի գտնվել։ Մեքենան ձախողվել է թե՛ մեկի, թե՛ մյուսի համարժեք կոնտեքստային թարգմանության հարցում, որը զարմանալի չէ և ևս մեկ անգամ փաստում է, որ թարգմանությունը, որը հենված է ալգորիթմների ու հաշվարկների վրա, չի կարող հավատարիմ մնալ բնագրին և վերարտադրել այն թիրախ լեզվում:

Մեկ այլ հատկանշական դիտարկում է «kennel» բառի թարգմանությունը: Եթե ներբեռնեք բառը համակարգում, առաջին իմաստը, որին հանդիպում ենք, «բուծարան»-ն է, բայց հաջորդիվ կարող եք տեսնել այլ իմաստներ ևս, որոնց շարքում է նաև «շան բուն» բառակապակցությունը: Հետևություն․ մեքենան չի հասկանում, թե որ համատեքստում ինչ թարգմանություն տրամադրել: Չնայած այն բանին, որ իր բազայում ունի տվյալ բառի հայերեն համարժեքը, միևնույն է նա չի հասկանում կոնտեքստը, թե ըստ իրավիճակի որ տարբերակն է պետք կիրառել:

Այսպիսով, նման օրինակների կարելի է շատ հանդիպել, քննարկել՝ բավական երկար: Մեկ այլ խնդրահարույց թեմա է մշակութային տարրերի, ասացվածքների, արտահայտությունների թարգմանությունը, որին բախվում ենք հատկապես գրական թարգմանություններ կատարելիս:

Այո, արհեստական բանականության նետած մարտահրավերները այլևս չեն զարմացնում մեզ, բայց պետք է հասկանալ, որ դրանք մեր ձեռքերում են և պետք է օգտագործենք ի շահ մեզ և մեր ոլորտի: Ինչ մնում է թարգմանության ոլորտին, ապա կարելի է ընկերանալ մեքենայի հետ, դարձնել այն գործիք, համատեղել թարգմանչի պրոֆեսիոնալիզմի, գիտելիքի և խորաթափանցության հետ և առանց մտավախության, որ մի օր կարթնանանք մեկ այլ իրականության մեջ, որտեղ Շեքսպիրի «Համլետը» կթարգմանվի մեքենայի կողմից շատ ավելի լավ, քան բանական էակի՝ թարգմանչի կողմից: Չէ՞ որ թարգանիչը կարող է լողալ հեղինակի մտքի անհուն օվկիանոսում, որսալ նրա մտքերը և հանելով ափ՝ մատուցել այն թիրախ լեզվի ընթերցողին:

Հեղինակ՝ © Գոհար Ավոյան

Դիտեք ավելին Վերլուծություններ բաժնում

մեկնաբանություններ