në shtëpi » 3 Si të mblidhni » Përkthimi i parë me makinë. Mundësitë e përdorimit të përkthimit me makinë në punën e një përkthyesi në fushën profesionale

Përkthimi i parë me makinë. Mundësitë e përdorimit të përkthimit me makinë në punën e një përkthyesi në fushën profesionale

Aktualisht, ekzistojnë tre lloje të sistemeve të përkthimit me makinë:

Sistemet e bazuara në rregulla gramatikore (Përkthimi me makinë i bazuar në rregulla, RBMT);

Sistemet statistikore (Statistical Machine Translation, SMT);

Sisteme hibride;

Sistemet e bazuara në rregulla gramatikore analizojnë tekstin që përdoret në procesin e përkthimit. Përkthimi kryhet në bazë të fjalorëve të integruar për një çift të caktuar gjuhësor, si dhe gramatikave që mbulojnë modele semantike, morfologjike, sintaksore të të dyja gjuhëve. Bazuar në të gjitha këto të dhëna teksti origjinal në mënyrë sekuenciale, fjali për fjali, shndërrohet në tekst në gjuhën e kërkuar. Parimi themelor i funksionimit të sistemeve të tilla është lidhja midis strukturave të teksteve burimore dhe të synuara.

Sistemet e bazuara në rregullat gramatikore shpesh ndahen në tre nëngrupe të tjera - sisteme përkthimi fjalë për fjalë, sisteme transferimi dhe sisteme ndërgjuhësore.

Përparësitë e sistemeve të bazuara në rregulla gramatikore janë saktësia gramatikore dhe sintaksore, stabiliteti i rezultatit dhe aftësia për t'u përshtatur për një fushë specifike lëndore. Disavantazhet e sistemeve të bazuara në rregullat gramatikore përfshijnë nevojën për të krijuar, mirëmbajtur dhe përditësuar bazat e të dhënave gjuhësore, kompleksitetin e krijimit të një sistemi të tillë, si dhe koston e tij të lartë.

Sistemet statistikore përdorin analizën statistikore në punën e tyre. Një korpus teksti dygjuhësh (që përmban nje numer i madh i teksti në gjuhën burimore dhe përkthimi i tij "manual" në gjuhën e kërkuar), pas së cilës sistemi analizon statistikat e korrespondencave ndërgjuhësore, strukturat sintaksore, etj. Sistemi është vetë-mësues - kur zgjedh një opsion përkthimi, ai mbështetet në më parë statistika të marra. Sa më i madh të jetë fjalori brenda një çifti gjuhësor dhe sa më saktë të jetë përpiluar, aq më i mirë është rezultati i përkthimit statistikor me makinë. Me çdo tekst të ri të përkthyer, cilësia e përkthimeve të mëvonshme përmirësohet.

Sistemet statistikore vendosen shpejt dhe shtohen lehtësisht zona të reja përkthimi. Ndër mangësitë më domethënëse janë prania e gabimeve të shumta gramatikore dhe paqëndrueshmëria e përkthimit.

Sistemet hibride kombinojnë qasjet e përshkruara më parë. Pritet që sistemet hibride të përkthimit të makinës të kombinojnë të gjitha avantazhet e sistemeve statistikore dhe të bazuara në rregulla.

1.3 Klasifikimi i sistemeve të përkthimit me makinë

Sistemet e përkthimit me makinë janë programe që kryejnë përkthim plotësisht të automatizuar. Kriteri kryesor i programit është cilësia e përkthimit. Për më tepër, pika të rëndësishme për përdoruesin janë komoditeti i ndërfaqes, lehtësia e integrimit të programit me mjete të tjera të përpunimit të dokumenteve, zgjedhja e temave dhe një mjet për rimbushjen e fjalorit. Me ardhjen e internetit, shitësit kryesorë të përkthimit të makinerive përfshinë ndërfaqet e uebit në produktet e tyre, ndërkohë që siguruan integrimin e tyre me softuer të tjerë dhe e-mail, duke lejuar përdorimin e motorëve MT për përkthimin e faqeve të internetit, korrespondencën elektronike dhe sesionet e bisedave në internet. .

Anëtarët e rinj të Forumit të Gjuhëve të Huaja të CompuServe shpesh pyesin nëse dikush mund të rekomandojë një program të mirë përkthimi me makinë me një çmim të arsyeshëm.

Përgjigja për këtë pyetje është pa ndryshim "jo". Në varësi të personit që përgjigjet, përgjigja mund të përmbajë dy argumente kryesore: ose që makinat nuk mund të përkthejnë, ose që përkthimi me makinë është shumë i shtrenjtë.

Të dyja këto argumente janë të vlefshme në një masë të caktuar. Sidoqoftë, përgjigja nuk është aq e thjeshtë. Kur studioni problemin e përkthimit makinerik (MT), është e nevojshme të merren parasysh veçmas nënseksionet e ndryshme të këtij problemi. Ndarja e mëposhtme bazohet në leksionet e Larry Childs të dhëna në Konferencën Ndërkombëtare të Komunikimit Teknik të vitit 1990:

Përkthim plotësisht automatik;

Përkthim i automatizuar me makinë me pjesëmarrje njerëzore;

Përkthimi kryhet nga një person që përdor një kompjuter.

Përkthim plotësisht i automatizuar me makinë. Ky lloj përkthimi me makinë është ajo që mendojnë shumica e njerëzve kur flasin për përkthimin me makinë. Kuptimi këtu është i thjeshtë: teksti në një gjuhë futet në kompjuter, ky tekst përpunohet dhe kompjuteri shfaq të njëjtin tekst në një gjuhë tjetër. Për fat të keq, zbatimi i këtij lloji të përkthimit automatik përballet me disa pengesa që ende duhen kapërcyer.

Problemi kryesor është kompleksiteti i vetë gjuhës. Merrni, për shembull, kuptimet e fjalës "mund". Përveç kuptimit themelor të një foljeje ndihmëse modale, fjala "mund" ka disa kuptime formale dhe zhargone si emër: "mund", "banjo", "burg". Për më tepër, ekziston një kuptim arkaik i kësaj fjale - "të njohësh ose të kuptosh". Duke supozuar se gjuha e daljes ka një fjalë të veçantë për secilin prej këtyre kuptimeve, si mund t'i dallojë një kompjuter midis tyre?

Siç rezulton, është bërë njëfarë progresi në zhvillimin e programeve të përkthimit që dallojnë kuptimin bazuar në kontekst. Studimet më të fundit mbështeten më shumë në teoritë e probabilitetit kur analizojnë tekste. Megjithatë, përkthimi plotësisht i automatizuar me makinë i teksteve me lëndë të gjerë është ende një detyrë e pamundur.

Përkthim i automatizuar me makinë me pjesëmarrje njerëzore. Ky lloj përkthimi me makinë tani është plotësisht i realizueshëm. Kur flasim për përkthimin me makinë me ndihmën e njeriut, zakonisht nënkuptojmë redaktimin e teksteve para dhe pasi ato të përpunohen nga një kompjuter. Përkthyesit njerëzorë ndryshojnë tekstet në mënyrë që ato të jenë të kuptueshme për makinat. Pasi kompjuteri të ketë bërë përkthimin, njerëzit përsëri redaktojnë përkthimin e përafërt me makinë, duke e bërë tekstin në gjuhën e daljes të saktë. Përveç kësaj procedure funksionimi, ekzistojnë sisteme MT që gjatë përkthimit kërkojnë praninë e vazhdueshme të një përkthyesi njerëzor për të ndihmuar kompjuterin të përkthejë struktura veçanërisht komplekse ose të paqarta.

Përkthimi makine i asistuar nga njeriu është i zbatueshëm në një masë më të madhe për tekstet me një fjalor të kufizuar dhe me lëndë të kufizuar.

Efektiviteti i kostos së përdorimit të përkthimit makinerik të asistuar nga njeriu është ende një çështje e diskutueshme. Vetë programet zakonisht janë mjaft të shtrenjta dhe disa prej tyre kërkojnë pajisje speciale për t'u ekzekutuar. Redaktimi para dhe pas kërkon një kurbë mësimi dhe nuk është një punë e këndshme. Krijimi dhe mirëmbajtja e bazave të të dhënave të fjalëve është një proces që kërkon punë intensive dhe shpesh kërkon aftësi të veçanta. Megjithatë, për një organizatë që përkthen vëllime të mëdha teksti në një fushë lëndore të përcaktuar mirë, përkthimi me makinë i ndihmuar nga njeriu mund të jetë një alternativë mjaft ekonomike ndaj përkthimit tradicional njerëzor.

Përkthimi kryhet nga një person që përdor një kompjuter. Në këtë qasje, përkthyesi njerëzor vendoset në qendër të procesit të përkthimit, ndërsa programi kompjuterik konsiderohet si një mjet që e bën procesin e përkthimit më efikas dhe përkthimin të saktë. Këto janë të zakonshme fjalorë elektronikë, të cilat ofrojnë përkthimin e fjalës së kërkuar, duke vendosur përgjegjësinë mbi personin për zgjedhjen e opsionit të dëshiruar dhe kuptimin e tekstit të përkthyer. Fjalorë të tillë lehtësojnë shumë procesin e përkthimit, por kërkojnë që përdoruesi të ketë një njohuri të caktuar të gjuhës dhe të shpenzojë kohë për zbatimin e saj. E megjithatë vetë procesi i përkthimit është dukshëm më i shpejtë dhe më i lehtë.

Ndër sistemet që ndihmojnë një përkthyes në punën e tij, vendin më të rëndësishëm e zënë të ashtuquajturat sisteme Translation Memory (TM) janë një mjet ndërveprues për grumbullimin në një bazë të dhënash çifte të segmenteve tekstuale ekuivalente në gjuhën origjinale. përkthimi me mundësinë e kërkimit dhe redaktimit të tyre të mëvonshëm. Këto produkte softuerike nuk synojnë të përdorin teknologji informacioni shumë inteligjente, por, përkundrazi, bazohen në përdorimin e potencialit krijues të përkthyesit. Në procesin e punës, vetë përkthyesi krijon një bazë të dhënash (ose e merr atë nga përkthyes të tjerë ose nga klienti) dhe sa më shumë njësi të përmbajë, aq më i madh është kthimi nga përdorimi i tij.

Këtu është një listë e sistemeve më të famshme TM:

Transit nga kompania zvicerane Star,

Trados (SHBA),

Menaxher përkthimi nga IBM,

Eurolang Optimizer nga kompania franceze LANT,

DejaVu nga ATRIL (SHBA),

WordFisher (Hungari).

Sistemet TM bëjnë të mundur eliminimin e përkthimit të përsëritur të fragmenteve identike të tekstit. Përkthimi i një segmenti kryhet nga përkthyesi vetëm një herë, dhe më pas çdo segment pasues kontrollohet për një përputhje (të plotë ose të paqartë) me bazën e të dhënave dhe nëse gjendet një segment identik ose i ngjashëm, ai ofrohet si opsion përkthimi. .

Aktualisht, zhvillimet janë duke u zhvilluar për të përmirësuar sistemet TM. Për shembull, bërthama e sistemit Transit të Starit zbatohet bazuar në teknologjinë e rrjetit nervor.

Pavarësisht gamës së gjerë të sistemeve TM, ato ndajnë disa karakteristika të përbashkëta:

Funksioni i shtrirjes. Një nga avantazhet e sistemeve TM është aftësia për të përdorur materiale të përkthyera tashmë për një temë të caktuar. Baza e të dhënave TM mund të merret duke krahasuar segment pas segmenti të skedarëve origjinal dhe të përkthimit.

Disponueshmëria e filtrave të importit dhe eksportit. Kjo veçori siguron përputhshmërinë e sistemeve TM me një sërë përpunuesish teksti dhe sistemesh botuese dhe i jep përkthyesit pavarësi relative nga klienti.

Një mekanizëm për kërkimin e ndeshjeve të paqarta ose të plota. Është ky mekanizëm që përfaqëson avantazhin kryesor të sistemeve TM. Nëse gjatë përkthimit të një teksti, sistemi has në një segment që është identik ose i afërt me atë të përkthyer më parë, atëherë segmenti tashmë i përkthyer i ofrohet përkthyesit si opsion për përkthimin e segmentit aktual, i cili mund të korrigjohet. Shkalla e përputhjes së paqartë përcaktohet nga përdoruesi.

Mbështetje për fjalorët tematikë. Kjo veçori e ndihmon përkthyesin t'i përmbahet fjalorit. Si rregull, nëse një fjalë ose frazë nga një fjalor tematik shfaqet në një segment të përkthyer, ajo theksohet me ngjyra dhe sugjerohet përkthimi i saj, i cili mund të futet automatikisht në tekstin e përkthyer.

Mjete për kërkimin e fragmenteve të tekstit. Ky mjet është shumë i përshtatshëm kur redaktoni përkthime. Nëse gjatë procesit të punës është gjetur një opsion më i suksesshëm përkthimi për ndonjë fragment teksti, atëherë ky fragment mund të gjendet në të gjitha segmentet TM, pas së cilës ndryshimet e nevojshme bëhen në mënyrë sekuenciale në segmentet TM.

Sigurisht, si kushdo software Sistemet TM kanë avantazhet dhe disavantazhet e tyre, dhe shtrirjen e tyre të aplikimit. Megjithatë, në lidhje me sistemet TM, disavantazhi kryesor është kostoja e tyre e lartë.

Është veçanërisht i përshtatshëm për të përdorur sistemet TM kur përkthen dokumente të tilla si manualet e përdoruesit, udhëzimet e përdorimit, dokumentacioni i projektimit dhe biznesit, katalogët e produkteve dhe dokumentacione të tjera të ngjashme me një numër të madh ndeshjesh.

Përmbledhja e artikullit

Me ardhjen e shkrimit, njerëzit morën mjet i fuqishëm për ruajtjen e njohurive dhe për komunikimin. Shkrimet e para që na kanë ardhur në muret e tempujve dhe varreve tregojnë për bëmat e mbretërve dhe gjeneralëve që kanë ndodhur shumë shekuj më parë. Përveç kësaj, njerëzit regjistruan rezultatet aktivitet ekonomik, me qellim tregtimin me sukses, mbledhjen e taksave etj.

Për të lehtësuar komunikimi me shkrim Fjalorët e parë u krijuan midis popujve. Një nga këta fjalorë është shkruar nga priftërinjtë sumerianë në pllaka balte. Çdo tabletë u nda në dy pjesë të barabarta. Në njërën anë, shkruhej një fjalë sumere, dhe nga ana tjetër, një fjalë me kuptim të ngjashëm në një gjuhë tjetër, ndonjëherë me një shpjegim të shkurtër. Prej asaj kohe e deri më sot, struktura e fjalorëve ka mbetur pothuajse e pandryshuar.

Me ardhjen e kompjuterit personal, filluan të krijohen fjalorë elektronikë, duke e bërë më të lehtë gjetjen e fjalës së duhur dhe duke ofruar shumë funksione të reja të dobishme (shprehja e fjalës, kërkimi i sinonimeve, etj.).

Teknologjia e përkthimit me makinë është përmirësuar gradualisht. Dhe nëse cilësia dhe shpejtësia e përkthimit të sistemeve të para linte shumë për të dëshiruar, tani një kompjuter mund të përkthejë vërtet në mënyrë koherente tekstin nga një gjuhë në tjetrën. Dhe sistemet më moderne me cilësi të pranueshme përkthejnë 1 faqe tekst në 1 sekondë.

Kush ka nevojë për përkthim me makinë dhe pse?

Kohët e fundit, mundësitë dhe perspektivat e teknologjive të përkthimit makinerik (MT) janë diskutuar në mënyrë aktive. Të dy përkthyes profesionistë dhe prodhues të sistemit MT marrin pjesë në diskutime. Le të përpiqemi të vlerësojmë aftësitë e MP, bazuar në përvojën e përdorimit të sistemeve reale.

Për të qenë të drejtë, duhet theksuar se në të ardhmen e parashikueshme, teknologjia e makinerive nuk do të jetë në gjendje të zëvendësojë plotësisht përkthyesin njerëzor. Për sa i përket cilësisë së përkthimit, programet MP nuk mund të konkurrojnë me njerëzit. Sidoqoftë, me ndihmën e programeve të tilla ju mund të rrisni ndjeshëm efikasitetin e punës së një përkthyesi.

Bazuar në përshkrimin formal të gjuhëve, programi analizon tekstin në një gjuhë dhe më pas sintetizon një frazë në një tjetër. Algoritmet e analizës dhe sintezës, si rregull, janë mjaft komplekse dhe kontrollohen nga informacioni i fjalorit të caktuar për njësitë leksikore në fjalorët e sistemit si për gjuhën e tekstit burimor ashtu edhe për gjuhën e përkthimit të tij.

Ku përdoren sistemet MP? Së pari, programet e përkthimit mund të përdoren për të përkthyer shpejt tekstin për të kuptuar kuptimin e tij. Sigurisht, cilësia e përkthimit me makinë nuk mund të krahasohet me përkthimin e bërë nga një person, por përdoruesi merr një përgjigje "këtu dhe tani". Përveç kësaj, me ndihmën e sistemeve MP, ju mund të lexoni informacionin e postuar në faqet e huaja të internetit, si dhe të kuptoni tekstin e një letre të dërguar të shkruar në frëngjisht, gjermanisht, japonisht ose në një gjuhë tjetër.

Përveç kësaj, sistemet MT mund të përdoren për të zgjidhur problemet profesionale të përkthimit dhe për të rritur ndjeshëm efikasitetin e punës. Le të krahasojmë të dyja metodat - tradicionale dhe makinerike. Përkthimi tradicional zakonisht përfshin disa faza: përkthimi, redaktimi, faqosja, korrigjimi. Për të përshpejtuar përkthimin, si rregull, disa përkthyes e kryejnë përkthimin. Si rezultat, lind problemi i terminologjisë së unifikuar dhe një stili të unifikuar përkthimi, gjë që rrit koston e redaktimit editorial. Përveç kësaj, duhet të shpenzohen përpjekje të konsiderueshme për rishikimin e dokumentit.

Çfarë përfitimesh ofron përdorimi i sistemeve MP dhe ku është më i përshtatshëm? Sistemet MP, duke përdorur një bazë të përbashkët fjalori për përkthim, minimizojnë ndjeshëm kostot e mbajtjes së një terminologjie uniforme dhe, rrjedhimisht, të redaktimit editorial. Në këtë rast, redaktori teknik merr nga sistemi MP një përkthim të bërë në të njëjtin stil. Kështu, përdorimi i sistemeve të përkthimit me makinë është më efektiv për organizimin e procesit teknologjik të përkthimit të grupeve të mëdha të dokumenteve të ngjashme në një kohë të shkurtër, duke siguruar uniformitetin e terminologjisë dhe stilit në të gjithë grupin e dokumenteve.

Mundësia e përdorimit të një sistemi MP përcaktohet nga aftësia e tij për t'u përshtatur me përkthimin e dokumenteve tema të ndryshme. Cilësia e përkthimit që rezulton varet kryesisht nga cilësimet. Krahas fjalorit të përgjithshëm leksikor, duhet të përdoren fjalorë të specializuar që pasqyrojnë si lëndën e përkthimit, ashtu edhe specifikat e dokumenteve të veçanta. Përveç kësaj, cilësia e përkthimeve varet nga aftësia e përkthyesit për të krijuar fjalorët e tij të personalizuar, të cilët duhet të përfshijnë terminologji specifike për këtë dokumentacion, si dhe fraza/shprehje (mikro-segmente) të shpeshta, përkthimi i të cilave nuk mund të jetë formale. Një mjedis i tillë garanton cilësinë në të cilën përdorimi i MT bëhet efektiv për zgjidhjen e problemeve "industriale" të përkthimit.

Për të vlerësuar efektivitetin e përdorimit të sistemeve MP, PROMT i ofroi qendrës së përkthimit LONIIS sistemin e saj të Zyrës së Përkthimit PROMT 2000. Eksperimenti tregoi se përdorimi i MP mund të zvogëlojë kohën totale të përfundimit të projektit me afërsisht 2 herë.

Duhet të theksohet se ka një sërë kufizimesh në përdorimin e sistemeve MP. Nuk ka kuptim të përktheni tekste letrare, fjalë të urta dhe thënie duke përdorur një program përkthyesi. Tekstet e vogla me tema të ndryshme përkthehen më mirë gjithashtu në mënyrën tradicionale.

Zyra e Përkthimit PROMT 2000

Zyra e Përkthimit PROMT 2000 (më tej referuar si PROMT), me çmim 300 dollarë, është një grup mjetesh profesionale që ofrojnë përkthim nga gjuhët kryesore evropiane në rusisht dhe anasjelltas. Me ndihmën e tij, ju jo vetëm që mund të përktheni, por edhe të redaktoni përkthimin dhe të punoni me fjalorë të të gjitha fushave gjuhësore në të njëjtën kohë.

PROMT përfshin koleksionet e mëposhtme të fjalorëve:

  • "Industria e lehtë" (180 dollarë);
  • "Industria e rëndë" (180 dollarë);
  • Tregti (99 dollarë);
  • Shkencë (120 dollarë);
  • "Technique" (199 dollarë).

Për të siguruar përkthim me cilësi të lartë, sistemi PROMT ofron mundësinë për të konfiguruar përkthimin e një teksti specifik - duke lidhur fjalorë të specializuar lëndor, të ofruar veçmas, si dhe duke krijuar fjalorët tuaj të personalizuar. Një mjet i përshtatshëm për konfigurimin e sistemit është gjithashtu aftësia për të zgjedhur subjektin e dokumentit: cilët fjalorë të lidhen, cilat fjalë të lihen pa përkthim dhe si të përpunohen ndërtime të veçanta si adresa e emailit, data dhe ora.

Sistemi PROMT përfshin modulet e mëposhtme:

  • PROMT - mjedis profesional për përkthim;
  • Redaktori i fjalorit - një mjet për rimbushjen dhe redaktimin e fjalorëve të sistemeve të përkthimit të makinës të familjes PROMT;
  • PROMT Electronic Dictionary është një fjalor elektronik që i ofron përdoruesit akses të gjerë në informacionin leksikor dhe gramatikor të mbledhur në fjalorë të specializuar të familjes PROMT. Mund të përdoret për çdo punë me tekste (për shembull, për të marrë shpejt informacion në lidhje me ekuivalentët e përkthimit të një fjale ose fraze të caktuar);
  • WebView është një shfletues që ju lejon të merrni përkthim të njëkohshëm të faqeve HTML kur lundroni në internet. WebView përmban dy dritare për shfaqjen e faqeve HTML: në krye shfaq faqen origjinale të marrë nga Interneti, në fund shfaq përkthimin e saj, duke ruajtur lidhjet, fotot, objektet e futura, etj. Ju mund të ndiqni lidhjet si në dritaren e sipërme që përmban tekstin burimor ashtu edhe në dritaren e poshtme që përmban përkthimin;
  • SmarTool është një mjet që zbaton funksionet e përkthimit në aplikacionet Microsoft Office 97 (Word, Excel) dhe Microsoft Office 2000 (Word, Excel, PowerPoint, FrontPage, Outlook). Menyja e përkthimit dhe shiriti i veglave janë të integruara në të gjitha aplikacionet kryesore të Microsoft Office 2000 dhe Microsoft Office 97, gjë që ju lejon të merrni një përkthim të një dokumenti të hapur direkt në këto aplikacione;
  • QTrans është një program i krijuar për përkthimin e shpejtë të tekstit të paformatuar. Me ndihmën e tij ju mund të përktheni lehtësisht dhe shpejt tekstin, një skedar teksti ose një clipboard (Clipboard). Për të përmirësuar cilësinë e përkthimit, mund të zgjidhni një temë të përshtatshme, të lidhni fjalorë të specializuar dhe të rezervoni fjalë;
  • Clipboard Translator është një program i krijuar për të përkthyer shpejt tekstin e kopjuar më parë në kujtesën e fragmenteve. Teksti mund të kopjohet nga çdo aplikacion Windows (Help, Notepad, Word, Word Perfect, PageMaker, etj.);
  • "Integrator" është një mjet për të hyrë në të gjitha aplikacionet e paketës.

Përkthimi i një dokumenti në sistemin PROMT

Etiketa shënon paragrafin aktual të tekstit burimor dhe përkthimin e këtij paragrafi (aktual është ai në të cilin ky moment kursori është i instaluar).

Të gjitha dokumentet me të cilat funksionon programi PROMT shfaqen në dritaret e dokumenteve. Mund të hapen disa dokumente në të njëjtën kohë - secili në dritaren e vet (Fig. 4,).

Përkthimi i përfunduar mund të sqarohet duke përdorur fjalorë elektronikë të zhvilluar nga kompani të tjera (nëse janë të instaluar në kompjuterin tuaj, sigurisht). Mund të përdoren fjalorë elektronikë:

  • Lingvo 6.0 (programi ABBYY);
  • “Context 3.0” (program nga kompania Informatik);
  • "MultiLex 1.0, 2.0, 3.0" (programi i kompanisë "MediaLingua");
  • PROMT Electronic Dictionary 1.0 (program nga PROMT).

Gjatë përkthimit, sistemi PROMT nuk përdor fjalorë elektronikë nga prodhues të tjerë. Prandaj, nëse një fjalë nuk është në fjalorët e sistemit PROMT ose nuk jeni të kënaqur me përkthimin e një fjale ose fraze, mund të telefononi fjalorin elektronik dhe ta përdorni si referencë.

Shfletuesi WebView përfshihet në paketën për përkthimin e dokumenteve HTML.

Sekuenca e veprimeve gjatë kryerjes së një përkthimi

  1. Hapni skedarin me tekstin burimor ose krijoni një dokument të ri (teksti i ri mund të shtypet drejtpërdrejt në dritaren PROMT).
  2. Kontrolloni ndarjen e tekstit në paragrafë (pas përkthimit, formatimi i paragrafit do të mbetet i njëjtë).
  3. Kontrolloni drejtshkrimin dhe modifikoni tekstin burimor nëse është e nevojshme.
  4. Zgjidhni një shabllon teme të përshtatshëm për përkthimin e një teksti të caktuar (një shabllon teme për një drejtim të caktuar përkthimi është një grup fjalorësh dhe një listë fjalësh të rezervuara; është instaluar për të përmirësuar cilësinë e përkthimit).
  5. Specifikoni subjektin e dokumentit duke përshtatur përbërësit e tij:
    • lidhni fjalorë që do të përdoren gjatë përkthimit të tekstit. Nëse nuk lidhet asnjë fjalor, për përkthim do të përdoret vetëm fjalori i përgjithshëm leksikor;
    • fjalë rezervë që në tekstin e përkthimit duhet të mbeten në gjuhën burimore;
    • lidhni paraprocesorin nëse dëshironi të anuloni përkthimin e strukturave të caktuara, të tilla si adresat e postës elektronike, emrat e skedarëve, dhe gjithashtu zgjidhni formën e paraqitjes së datës dhe orës në tekstin e përkthimit;
    • Shënoni paragrafët që nuk kërkojnë përkthim.
  6. Përkthejeni tekstin (të gjithë dokumentin menjëherë ose paragraf për paragraf).
  7. Futni fjalë të panjohura në fjalorin tuaj të personalizuar nëse dëshironi që ato të përkthehen më vonë.
  8. Përdorni një fjalor elektronik për të sqaruar kuptimet e fjalëve.
  9. Ruani rezultatet e përkthimit.

Kërkesat e sistemit

  • Kompjuter i pajtueshëm me IBM PC me procesor P166 ose më të lartë;
  • 32 MB RAM;
  • afërsisht 160 MB hapësirë ​​në hard disk (për një sistem me të gjithë komponentët);
  • SVGA ose përshtatës video me rezolucion më të mirë;
  • lexues CD-ROM (për instalim);
  • miun ose pajisjen e përputhshme;
  • OS: Windows 98 (versioni rus ose versioni pan-evropian me mbështetjen e gjuhës ruse dhe cilësimet rajonale ruse), ose Windows NT 4.0 SP3 (ose më i lartë) me mbështetje për gjuhën ruse dhe cilësimet rajonale ruse, ose Windows 2000 Professional (me mbështetje për gjuhën ruse dhe Cilësimet rajonale ruse);
  • Microsoft Internet Explorer 5.x (përfshirë në dorëzim).
  • Kompjuter i pajtueshëm me IBM PC me procesor PII-300 ose më të lartë;
  • 64 MB RAM

Përkthimi i një dokumenti në sistemin Socrates Personal

Dritarja kryesore e programit është paraqitur në Fig. 6.

Kur e nisni për herë të parë, dritarja kryesore e programit hapet si parazgjedhje në skedën "Përkthyes". Përkthimi i tekstit të shtypur në dritaren e programit: duke shtypur tekstin në dritaren e sipërme të skedës "Përkthyes" dhe duke klikuar butonin "Përkthe" në shiritin e veglave ose në menynë "Përkthim", do të merrni një përkthim të tekstit në dritarja e poshtme e skedës.

Për të përdorur fjalorin (Fig. 7), thjesht klikoni në skedën përkatëse. Përveç kësaj, dritarja e fjalorit mund të thirret duke përdorur çelësat e nxehtë.

Duke përdorur një fjalor, mund të merrni përkthimin e fjalës që kërkoni në mënyrat e mëposhtme:

  • Shkruani fjalën në fushën e hyrjes që ndodhet në dritaren e sipërme djathtas të fjalorit. Lundrimi nëpër bazën e të dhënave të fjalorit kryhet me futjen e shkronjave, derisa të arrihet përputhja maksimale e mundshme;
  • ngjisni një fjalë në fushën e hyrjes nga clipboard. Në këtë rast, do të bëhet një kalim i shpejtë te fjala që përputhet më shumë me atë të futur;
  • zgjidhni një fjalë të përkthyer më parë nga dritarja e historisë së fushës së hyrjes, pas së cilës do të bëhet një kalim i shpejtë te fjala që ka përputhjen maksimale të mundshme me atë të futur;
  • Zgjidhni një fjalë në një aplikacion tjetër dhe, duke mbajtur të shtypur tastin Shift, kliko me të djathtën mbi përzgjedhjen. Përkthimi i fjalës së zgjedhur do të shfaqet në një dritare pop-up;
  • përdorni një kombinim të tastit të nxehtë pasi të keni vendosur fjalën e kërkuar në kujtesën e fragmenteve.

Përktheni fjalë ose tekst nga aplikacione të tjera

Sistemi Socrates Personal 4.0 ofron mundësinë për të punuar me një përkthyes dhe fjalor në aplikacione të tjera pa i lënë ato. Përkthimi kryhet në një dritare pop-up.

Për të marrë një përkthim të tekstit nga një aplikacion tjetër (për shembull, një redaktues teksti), duhet të zgjidhni tekstin që do të përkthehet dhe, duke mbajtur të shtypur tastin Shift, kliko me të djathtën mbi përzgjedhjen. Do të shfaqet një dritare pop-up që përmban përkthimin e fragmentit të zgjedhur.

Për të marrë një përkthim të një fjale nga një aplikacion tjetër, duhet të zgjidhni fjalën që ju intereson dhe, duke mbajtur të shtypur tastin Shift, kliko me të djathtën mbi përzgjedhjen. Dritarja pop-up që rezulton do të përmbajë përkthimin e fjalës së theksuar.

Nëse është e nevojshme, nga kjo dritare mund të shkoni direkt në skedën "Fjalori" duke përdorur lidhjen e lidhjes së dritares që shfaqet.

Kërkesat e sistemit

Konfigurimi minimal i kompjuterit:

  • Kompjuter i pajtueshëm me IBM PC me procesor Pentium 90 ose më të lartë;
  • Sistemi operativ Windows 98/Me ose Windows NT/2000;
  • 32 MB RAM;
  • 16 MB hapësirë ​​të lirë në hard disk.

Rezultatet e testit për PROMT Translation Office 2000 dhe Socrates Personal 4.0

Për të krahasuar cilësinë dhe shpejtësinë e përkthimit të dy sistemeve, u zgjodhën disa fragmente tekstesh në rusisht dhe anglisht: fraza individuale, lajme nga kompanitë, pasazhe nga Bibla, Ligjet e Murfit, tekste teknike, mjekësore, ligjore. Vlerësimet u dhanë në një shkallë prej 10 pikësh. Pas kësaj, u bë një krahasim i rezultateve të përkthimit nga anglishtja në rusisht dhe anasjelltas (Tabela 1).

Duhet të theksohet se PROMT Translation Office 2000 dhe Socrates Personal 4.0 janë produkte të krijuara për të zgjidhur detyra të ndryshme. Zyra e Përkthimit PROMT 2000 është sistemi profesional MP, me ndihmën e të cilit është shumë më efikase përkthimi i vëllimeve të mëdha të informacionit. Për më tepër, sistemi PROMT zbaton saktë rregullat gramatikore të një gjuhe të caktuar. Prandaj, cilësia e përkthimit është shumë e lartë. Disavantazhet e sistemit PROMT janë kërkesat e larta për burimet e harduerit dhe koha e konsiderueshme e përkthimit kur lidhni disa fjalorë shtesë.

"Socrates Personal 4.0" është një sistem automatik përkthimi që ju ndihmon të merrni shpejt dhe me lehtësi një përkthim të një fraze ose termi të paqartë. Qëllimi i tij kryesor është të jetë gjithmonë pranë.

Përkthimi i një letre ose fraze të shkurtër nga një tekst duke përdorur Socrates Personal 4.0 është shumë më i lehtë dhe më i shpejtë sesa përdorimi i sistemit PROMT. Sidoqoftë, për të përkthyer një sasi të madhe teksti, këshillohet të përdorni PROMT Translation Office 2000.

Lingvo 7.0

Lingvo 7.0 është një fjalor i fuqishëm profesional që është shumë miqësor për përdoruesit. Shtypni një çelës në çdo aplikacion të Windows - dhe përkthimi më i plotë i fjalës nga të gjithë fjalorët e lidhur me sistemin do të shfaqet në ekran. Komentet gramatikore për çdo fjalë, shqiptimi i fjalëve më të rëndësishme, kontrollimi i drejtshkrimit, aftësia për të krijuar fjalorët tuaj - e gjithë kjo ofrohet nga ABBYY Lingvo 7.0 (Fig. 9). Lingvo 7.0 përmban më shumë se 1.2 milion fjalë dhe fraza në 18 fjalorë të përgjithshëm dhe të specializuar.

Kur fillon Lingvo, dritarja kryesore shfaqet në ekran (Fig. 10). Në linjën e hyrjes përdoruesi mund të shkruajë fjala e duhur. Ndërsa shkruani, programi do të kërkojë fjalën më të përshtatshme. Duke shtypur tastin enter ose ikonën "Përkthe tekstin", përdoruesi do të shohë një dritare karte që përmban hyrjen në fjalor të fjalës së zgjedhur (të gjetur gjatë kërkimit) (Fig. 11).

Nëse jeni duke lexuar seksionin e ndihmës të një programi, duke punuar me një redaktues teksti, shfletues ose ndonjë aplikacion tjetër të Windows, zgjidhni një fjalë ose disa fjalë në tekst dhe shtypni Ctrl+Ins+Ins. Ose thjesht tërhiqeni dhe lëshojeni fjalën në rreshtin e hyrjes. Kjo do të aktivizojë dritaren kryesore të Lingvo dhe do të hapë një kartë me përkthimin e fjalës së zgjedhur. Nëse ka shumë karta të tilla, dritarja "Përkthim" do të shfaqet që përmban fjalë dhe fraza nga kërkesa.

Për të futur një përkthim në tekstin e redaktuar, zgjidhni përkthimin në kartë dhe shtypni Ctrl+Ins. Kaloni në dritaren e redaktuesit të tekstit dhe kryeni operacionin "Paste". Ju gjithashtu mund ta tërhiqni përkthimin në dritaren e redaktuesit të tekstit.

Kur përktheni nga anglishtja në rusisht, nuk është gjithmonë e qartë nëse kemi të bëjmë me fjalë që mund të përkthehen në mënyrë të pavarur, apo me një frazë që përkthehet në tërësi. Funksioni "Përkthe tekstin nga vargu" ndihmon në zgjidhjen e këtij problemi, duke ju lejuar të gjeni fraza të qëndrueshme në fragmentin e përkthyer, për të cilin ka hyrje të veçanta në fjalor. Mund të përpiqeni të gjeni fragmentet e mbetura të papërkthyera në shembuj duke përdorur funksionin e kërkimit të tekstit të plotë, duke vendosur opsionet e nevojshme (dhe/ose, duke marrë parasysh renditjen ose jo, etj.)

Kur përktheni nga rusishtja në anglisht, theksimi i kombinimeve dhe strukturave gramatikore nuk është i vështirë, dhe nëse këto kombinime nuk janë në fjalor, mund të ktheheni menjëherë në funksionin e kërkimit të tekstit të plotë. Rezultatet e kërkimit ju lejojnë të vlerësoni se si shprehja që ju intereson përkthehet në shembuj realë.

Karakteristikat kryesore të Lingvo:

  • përkthimi i 1.2 milion fjalëve dhe frazave;
  • 18 fjalorë të përgjithshëm dhe të specializuar (2 mjekësor dhe 2 fjalor juridik në Lingvo 7.0 - e re);
  • fjalor modern;
  • thirrja e fjalorit nga çdo aplikacion Windows;
  • sistem i përsosur kërkimi;
  • 5 mijë fjalë angleze u shprehën nga një spikeri nga Oksfordi;
  • aftësia për të krijuar fjalorët tuaj të personalizuar;
  • 23 fjalorë falas të përdoruesve në http://www.lingvo.ru/;
  • interpretime dhe shpjegime të hollësishme të përdorimit të fjalëve;
  • teknologji moderne gjuhësore;
  • versione të reja të përditësuara të fjalorëve të përgjithshëm dhe të specializuar.

Kërkesat e sistemit

Konfigurimi minimal i kompjuterit:

  • Kompjuter i pajtueshëm me IBM PC me procesor Pentium 133 ose më të lartë;
  • sistemi operativ Windows 95/98/Me, Windows 2000/Windows NT 4.0 (SP3 ose më i lartë);
  • 16 MB RAM për Windows 95/98/Me, 32 MB RAM për Windows 2000/Windows NT 4.0;
  • nga 85 në 265 MB hapësirë ​​të lirë në hard disk;
  • Disk drive 3,5” dhe CD-ROM drive, mouse;
  • Microsoft Internet Explorer 5.0 dhe më i lartë (shpërndarja ABBYY Lingvo 7.0 përfshin Microsoft Internet Explorer 5.5 - instalimi i tij do të kërkojë 27 deri në 80 MB shtesë);
  • kartë zanore e pajtueshme me sistemin operativ; kufje ose altoparlantë (rekomandohen).

Konteksti 4.0

"Context 4.0" është një sistem fjalorësh elektronikë, i cili përfshin një guaskë të zhvilluar softuerësh dhe një grup të gjerë fjalorësh - si p.sh. fjalor i përgjithshëm, dhe të specializuara. Pronë unike"Konteksti" - duke marrë parasysh morfologjinë e gjuhëve të mbështetura. Falë kësaj, Konteksti përkthen fjalë dhe fraza në çdo formë gramatikore. Fjalorët anglisht-rusisht dhe rusisht-anglisht janë të përfaqësuar plotësisht në Kontekst. Biblioteka e kontekstit të versionit të ri është zgjeruar për të përfshirë fjalorë anglisht-frëngjisht, anglisht-gjermanisht, anglisht-spanjisht, anglisht-italisht, anglisht-portugeze, anglisht-serbisht dhe anglisht-kroatisht.

Fjalorët e kontekstit janë të dyanshëm. Programi përkthehet nga një gjuhë në tjetrën dhe kthehet pa ndonjë cilësim të veçantë. Kërkimi i përkthimit mund të kryhet si në të gjithë fjalorët e përfshirë në komplet, ashtu edhe në fjalor specifik. Në të njëjtën kohë, grupi i fjalorëve aktivë (që marrin pjesë në kërkim), si dhe rendi i kërkimit për ta, mund të ndryshohet lehtësisht.

Ju mund të punoni me "Kontekst" duke shtypur një fjalë ose frazë me interes për përdoruesin në një fushë të veçantë të hyrjes (Fig. 12).

Është i përshtatshëm për të punuar me "Context" nga aplikacionet Windows. Përkthimi kryhet duke përdorur metodën tërhiq dhe lësho ose nëpërmjet kujtesës së fragmenteve. Në cilësimet, mund të specifikoni një çelës kyç ose të aktivizoni opsionin për të filluar përkthimin kur vendosni tekst në kujtesën e fragmenteve.

Për përdoruesit që punojnë në redaktuesin MS Word, është zbatuar aftësia për të thirrur "Kontekst" nga vetë redaktori. Për ta bërë këtë, klikoni në ikonën "Context" që ndodhet në shiritin e veglave MS Word dhe përdoruesi nuk ka nevojë të zgjedhë një fjalë ose frazë në tekst. "Kontekst" do të përkthejë fjalën në të cilën ndodhet kursori dhe në të njëjtën kohë do të kontrollojë disa fjalë djathtas dhe majtas për të parë nëse ato janë pjesë e frazës.

“Konteksti” plotësohet me fjalorë me kërkesë të përdoruesit. Nëse përdoruesi ka blerë një guaskë dhe disa fjalorë, ai mund të blejë çdo fjalor tjetër që i nevojitet.

Versioni i 4-të i Context ka një sërë veçorish interesante që nuk ishin të pranishme në versionet e mëparshme. Për shembull, fjalori kërkon fraza të pjesshme. Në këtë rast, të gjitha frazat koeficienti i relevancës së të cilave në lidhje me vargun e kërkimit është më i madh se një vlerë e caktuar pragu shfaqen në dritaren e përkthimit (Fig. 13,).

Ekziston një funksion i ri i telefonimit të shpejtë (Typing i shpejtë). Kur fut një fjalë, përdoruesi merr sugjerime për fjalë të ngjashme nga fjalori aktual, duke marrë parasysh karakteret e futura tashmë (Fig. 15). Më pas përdoruesi mund të zgjedhë nga lista ose të vazhdojë të telefonojë vetë.

Për të lejuar fjalorët të punojnë së bashku në gjuhë të ndryshme, së bashku me zbulimin automatik, është shtuar një funksion i përzgjedhjes së gjuhës (Fig. 16).

Versioni i ri ka aftësinë për të shtuar dhe modifikuar hyrjet e fjalorit, gjë që e bën sistemin e fjalorit më fleksibël. Në versionin e mëparshëm të Context, u zbatua aftësia për të punuar me fjalorin e përdoruesit. Versioni i ri i programit Context ju lejon të krijoni disa fjalorë dhe t'i modifikoni ato. Fjalorët e përdoruesve, fjalorët standardë dhe fjalorët e përdoruesve janë të barabartë në sistemin e fjalorëve të kontekstit. Formati i hyrjes së fjalorit të përdoruesit është i afërt me formatin e fjalorit standard, domethënë me formatin e zakonshëm të librit. Artikulli mund të përfshijë si fjalë ashtu edhe shprehje dhe shembuj të përdorimit të fjalëve në përbërje vendos shprehje dhe interpretimet (

MultiLex 3.5

"MultiLex 3.5" është një fjalor elektronik, i cili përfshin versione elektronike të të njohurve fjalorë të shtypur. Një shumëllojshmëri fjalorësh anglisht-rusisht dhe rusisht-anglisht prodhohen në guaskën "MultiLex 3.5 English" (Fjalori i ri anglisht-rusisht nga V.K. Muller, anglisht-rusisht/rusisht Fjalor anglisht O.S. Akhmanova, Fjalori rusisht-anglisht, bot. A.I. Smirnitsky). Është planifikuar nxjerrja e koleksioneve teknike, mjeko-biologjike, ekonomiko-juridike e të tjera.

"MultiLex 3.5 English" lejon përdoruesin të zgjedhë gradualisht për vete grupin optimal të fjalorëve që do të funksionojnë së bashku.

Karakteristikat e fjalorit MultiLex:

  • komoditeti dhe lehtësia e përdorimit;
  • shprehja e një numri të madh hyrjesh fjalori;
  • akses i shpejtë në artikuj të rëndësishëm: duke përdorur faqeshënuesit, mund të shënoni shënimet e fjalorit që janë të rëndësishme për ju dhe më pas t'i qaseni drejtpërdrejt;
  • Funksioni "thirrje e shpejtë" - kur shkruani një fjalë, shfaqet një listë fjalësh të ngjashme, nga e cila përdoruesi mund të zgjedhë një fjalë për përkthim pa shtypur të gjithë fjalën;
  • përkthimi i një fjale ose fraze dhe transferimi i rezultateve të përkthimit në një aplikacion Windows nëpërmjet kujtesës së fragmenteve ose zvarrit dhe lësho;
  • shënime hyrëse: kur punoni në bashkëpunim, është e rëndësishme të ruani terminologjinë uniforme. Këtu vjen në shpëtim mekanizmi i shënimeve - ju mund të shkruani shënimet tuaja për çdo hyrje në fjalor;
  • fjalori i përdoruesit.

Dritarja "MultiLex" përmban një kornizë dritareje, një shirit menuje, nën të cilin ka një panel fjalori, një shirit veglash dhe një shirit kërkimi. Nën shiritin e kërkimit është zona aktuale e punës e dritares MultiLexa.

Zona e punës është e ndarë vertikalisht në dy pjesë: paneli i titullit të artikullit (majtas) dhe paneli i tekstit të hyrjes së fjalorit (djathtas). Kufiri midis paneleve mund të zhvendoset majtas dhe djathtas.

Paneli i majtë përmban një listë me titujt e artikujve të atij fjalori, i cili shfaqet në panelin e fjalorit duke përdorur një ikonë në formën e një libri të hapur (përdoret për të parë titujt e hyrjeve të fjalorit). Paneli i djathtë tregon gjithmonë hyrjen e fjalorit që korrespondon me titullin e theksuar në panelin e djathtë. Një hyrje në fjalor fillon me një titull, e ndjekur nga transkriptimi i tij. Më pas, tregohet pjesa e të folurit, jepen përkthime të mundshme, shpjegime dhe shembuj.

Paneli i fjalorit ju lejon të zgjidhni fjalorin e dëshiruar. Çdo fjalor ka ikonën e tij, e cila merr tre gjendje të ndryshme: libër i mbyllur, libër gjysmë i hapur ose libër i hapur. Forma e ikonave tregon se cili fjalor është aktualisht i hapur dhe në cilët fjalorë kërkimi i fundit ka gjetur diçka.

Nëse ikona e fjalorit përshkruan një libër të hapur (fletore) - ky fjalor tani është i hapur, një libër gjysmë i hapur (fletore) - ky fjalor nuk është aktualisht i hapur, por përmban informacione të rëndësishme për kërkesën tuaj dhe nëse ikona përshkruan një të mbyllur libër (fletore) - ky fjalor është i mbyllur dhe nuk përmban informacionin që ju nevojitet.

Në korrik 2001, u botua një version i ri i fjalorit "MultiLex 3.5 English Popular" (Fjalori anglisht-rusisht, rusisht-anglisht i fjalorit të përgjithshëm, redaktuar nga O.S. Akhmanova dhe E.A.M. Wilson). Ai përmban më shumë se 40 mijë hyrje në fjalor.

Versioni 3.5 ka një numër avantazhesh që nuk do t'i gjeni në versionin e mëparshëm:

  • mundësia e instalimit shtesë të fjalorëve. Duke blerë çdo fjalor anglisht (versioni jo më i ulët se 3.5), mund ta integroni lehtësisht në MultiLex-in tuaj. Është planifikuar nxjerrja e koleksioneve teknike, mjeko-biologjike, ekonomiko-juridike dhe të tjera;
  • përkthim pop-up. MultiLex 3.5 ofron mbështetje për përkthimin duke përdorur çelësat e nxehtë nga çdo aplikacion që mbështet Clipboard. Për ta bërë këtë, thjesht theksoni fjalën, shtypni tastin e funksionit përkatës (F10 si parazgjedhje) - dhe një dritare përkthimi do të shfaqet në ekran. Përkthimi në dritare është një hiperlidhje. Nëse keni nevojë për informacion më të plotë për fjalën që ju intereson, klikoni në butonin e majtë të miut për të thirrur "MultiLex" me opsione të gatshme përkthimi për fjalën e kërkuar. Dritarja kërcyese e përkthimit mund të instalohet në krye të të gjitha dritareve duke zgjedhur artikullin e duhur në menynë e kontekstit, i cili bëhet i disponueshëm duke klikuar me të djathtën në ikonën "MultiLex" (në të djathtë këndi i poshtëm ekran). Një funksion i ngjashëm kryhet nga butoni në anën e majtë të dritares "përkthimi pop-up". Duke përdorur këtë buton, ju mund të "gozhdoni" përkthimin që rezulton kudo në ekranin tuaj;
  • Kartë zanore e përputhshme me sistemin operativ, kufjet ose altoparlantët (rekomandohet).

Përmbledhje

Si përfundim, disa fjalë për përvojën personale në përdorimin e sistemeve dhe fjalorëve të përkthimit me makinë.

Tre vjet më parë, përdora një sistem përkthimi me makinë për të përgatitur një raport për një punëdhënës perëndimor. Disa njerëz që ishin të përfshirë në programimin në det të hapur shkruan një program për marrësin e lundrimit. Fatkeqësisht, pak nga grupi flisnin mjaftueshëm anglisht për të përshkruar rezultatet e punës së tyre në gjuhën e klientit. Në këtë drejtim, kishte nevojë për përkthimin e raporteve të përpiluara në Rusisht. Pikërisht atëherë më lindi ideja të provoja sistemin e përkthimit me makinë Stylus (versionet e para të sistemeve PROMT quheshin në këtë mënyrë). Kjo përpjekje doli të ishte shumë e suksesshme: e përktheva dokumentin 140 faqesh tre herë më shpejt se sa ishte planifikuar. Sigurisht, përkthimi i realizuar nga programi nuk ishte i përsosur. Më është dashur ta modifikoj shumë dhe për një kohë të gjatë. Por fitimi është i dukshëm.

Që atëherë, kur përkthej tekste me më shumë se 10 faqe, përdor gjithmonë sisteme të përkthimit me makinë.

Këtë histori ia tregova mikut tim sipërmarrës. Më pas filloi të shiste këpucë dhe vendosi lidhje me furnitorët gjermanë. Ai gjithashtu bleu një sistem të ngjashëm dhe ende korrespondon me sukses me gjermanët me e-mail (ai nuk di as anglisht dhe as gjermanisht). Pasi ka shkruar një letër në rusisht, ai e përkthen në gjermanisht dhe e dërgon, dhe përgjigjen e marrë e përkthen në Rusisht. Dhe të gjithë janë të lumtur. Si rezultat, miku im po hap dyqanin e tij të pestë të këpucëve në Moskë një ditë tjetër.

Me fjalorët elektronikë jam njohur edhe më herët, kur pata nevojë të lexoja libra dhe revista të huaja për disiplina teknike me fjalor specifik. Fjalorët elektronikë teknikë, fjalorë për telekomunikacionin dhe shkencën kompjuterike më lejuan të kursej shumë kohë dhe përpjekje. Faleminderit Lingvo!

Shpresojmë që historia ime rreth sistemeve dhe fjalorëve të rinj të përkthimit me makinë do t'ju ndihmojë të organizoni punën tuaj në mënyrë efektive dhe në fund të arrini sukses.

Redaktorët dëshirojnë të falënderojnë për ndihmën e tyre në përgatitjen e artikullit: Alexandra Andreeva, kompania PROMT; Andrey Sokolov, kompania informatike; Anastasia Savina, kompania ABBYY; Konstantin Konin dhe Natalya Talpa, kompania MediaLingua; Alexey Bukhanov, kompania Arsenal.

ComputerPress 9"2001

Veprimi i shndërrimit të tekstit në një gjuhë natyrore në tekst të barasvlershëm me përmbajtjen në një gjuhë tjetër, si dhe rezultati i një veprimi të tillë. Përkthimi modern me makinë ose automatik kryhet me ndihmën e një personi: një redaktues paraprak, i cili në një mënyrë ose në një tjetër përpunon paraprakisht tekstin që do të përkthehet, një ndërredaktor, që merr pjesë në procesin e përkthimit ose një postim. -redaktor, i cili korrigjon gabimet dhe lëshimet në tekstin e përkthyer nga makina.

Për të kryer përkthimin me makinë, futuni në kompjuter program të veçantë, i cili zbaton një algoritëm përkthimi, i cili kuptohet si një sekuencë në mënyrë të paqartë dhe rreptësisht veprime të caktuara sipër tekstit për të gjetur korrespondencën e përkthimit në një çift të caktuar gjuhësh L 1 – L 2 për një drejtim të caktuar përkthimi (nga një gjuhë specifike në tjetrën). Sistemi i përkthimit me makinë përfshin fjalorë dygjuhësh të pajisur me informacionin e nevojshëm gramatikor (morfologjik, sintaksor dhe semantik) për të siguruar transmetimin e korrespondencave të përkthimit ekuivalent, variant dhe transformues, si dhe mjete analize gramatikore algoritmike që zbatojnë ndonjë nga gramatikat formale të pranuara për automatik. përpunimi i tekstit. Ka gjithashtu sisteme të veçanta mjetet e përkthimit me makinë të krijuara për të përkthyer në tre ose më shumë gjuhë, por ato aktualisht janë eksperimentale.

Më e zakonshme është sekuenca e mëposhtme e operacioneve formale që ofrojnë analiza dhe sintezë në një sistem përkthimi me makinë:

1. Në fazën e parë, futet teksti dhe kërkohen format e fjalëve hyrëse (fjalë në një formë të caktuar gramatikore, për shembull, rasa dhanore shumësi) në fjalorin e hyrjes (fjalorin e gjuhës nga e cila është bërë përkthimi) me analizë morfologjike shoqëruese, gjatë së cilës vërtetohet përkatësia e një forme të dhënë fjalësh në një leksemë specifike (një fjalë si njësi e fjalorit). Në procesin e analizës, informacioni që lidhet me nivelet e tjera të organizimit të sistemit gjuhësor mund të merret edhe nga forma e një fjale.

2. Faza tjetër përfshin përkthimin e frazave idiomatike, njësi frazeologjike ose vulat e kësaj fusha lëndore(për shembull, në përkthimin anglisht-rusisht, fraza si në rast se, në përputhje me marrin një ekuivalent të vetëm dixhital dhe janë të përjashtuar nga analiza e mëtejshme gramatikore); përcaktimi i karakteristikave themelore gramatikore (morfologjike, sintaksore, semantike dhe leksikore) të elementeve të tekstit hyrës (për shembull, numri i emrave, koha e foljes, funksionet sintaksore të formave të fjalës në një tekst të caktuar, etj.), të prodhuara brenda gjuha e hyrjes; zgjidhja e homografisë (konvertimi i homonimit të formave të fjalëve - të themi, anglisht. rrumbullakët mund të jetë emër, mbiemër, ndajfolje, folje ose parafjalë); analiza leksikore dhe përkthimi i leksemave. Në mënyrë tipike, në këtë fazë, fjalët me një vlerë të vetme ndahen nga fjalët polisemike (që kanë më shumë se një ekuivalent përkthimi në gjuhën e synuar), pas së cilës fjalët me një vlerë të vetme përkthehen duke përdorur lista ekuivalentësh dhe për përkthim. fjalët polisemantike Përdoren të ashtuquajturit fjalorë kontekstualë, hyrjet e fjalorit të të cilëve janë algoritme për kërkimin e kontekstit për praninë/mungesën e përcaktuesve kontekstualë të kuptimit.

3. Analiza gramatikore përfundimtare, gjatë së cilës përcaktohet informacioni i nevojshëm gramatikor duke marrë parasysh të dhënat e gjuhës së synuar (për shembull, me emrat rusë si p.sh. sajë, gërshërët folja duhet të jetë në shumës, megjithëse origjinali mund të ketë edhe njëjës).

4. Sinteza e formave dhe fjalive të fjalëve dalëse në tërësi në gjuhën e synuar.

Në varësi të karakteristikave të morfologjisë, sintaksës dhe semantikës së një çifti të caktuar gjuhësor, si dhe drejtimit të përkthimit, algoritmi i përgjithshëm i përkthimit mund të përfshijë faza të tjera, si dhe modifikime të këtyre fazave ose rendit të shfaqjes së tyre, por variacione të këtij lloji në sistemet moderne janë zakonisht të parëndësishme. Analiza dhe sinteza mund të kryhen si frazë për frazë ashtu edhe për të gjithë tekstin e futur në kujtesën e kompjuterit; V rastin e fundit algoritmi i përkthimit parashikon përcaktimin e të ashtuquajturave lidhje anaforike (të tilla, për shembull, lidhja e një përemri me emrin që ai zëvendëson - të themi, përemri ato me fjalën përemrat në këtë shpjegim në kllapa).

Sistemet aktuale të përkthimit me makinë janë të përqendruara në çifte të veçanta gjuhësh (për shembull, frëngjisht dhe rusisht ose japonisht dhe anglisht) dhe, si rregull, përdorin përputhje përkthimi ose në një nivel sipërfaqësor ose në një nivel të ndërmjetëm midis gjuhëve hyrëse dhe dalëse. . Cilësia e përkthimit me makinë varet nga madhësia e fjalorit, sasia e informacionit të caktuar për njësitë leksikore, tërësia e përpilimit dhe testimit të funksionimit të algoritmeve të analizës dhe sintezës dhe efektiviteti i softuerit. Hardware dhe softuer modern lejojnë përdorimin e fjalorëve të mëdhenj që përmbajnë informacion të detajuar gramatikor. Informacioni mund të paraqitet si në formë deklarative (përshkruese) dhe procedurale (duke marrë parasysh nevojat e algoritmit).

Përkthimi modern me makinë duhet të dallohet nga përdorimi i kompjuterëve për të ndihmuar përkthyesit njerëzorë. Në rastin e fundit, nënkuptojmë një fjalor automatik që ndihmon një person të zgjedhë shpejt ekuivalentin e dëshiruar të përkthimit. Megjithëse në të dyja rastet kompjuteri punon së bashku me një person (përkthyes ose redaktor), përmbajtja e termit "përkthim me makinë" përfshin idenë se pjesa kryesore e punës së përkthimit dhe gjetjes së ekuivalentëve të përkthimit dhe korrespondencave të përkthimit kryhet nga vetë makinë, duke e lënë personin vetëm me kontrollin dhe korrigjimin e gabimeve, ndërsa një fjalor kompjuterik për të ndihmuar një person është një mjet thjesht ndihmës për gjetjen e shpejtë të përputhjeve të përkthimit; Megjithatë, në të njëjtën kohë, në fjalorë të tillë, disa funksione të qenësishme në sistemet e përkthimit makinerie mund të zbatohen në një masë të kufizuar.

Në praktikën e përkthimit dhe në teknologjinë e informacionit, ekzistojnë dy qasje kryesore për përkthimin me makinë. Nga njëra anë, rezultatet e përkthimit me makinë mund të përdoren për t'u njohur shkurtimisht me përmbajtjen e një dokumenti në një gjuhë të panjohur. Në këtë rast, ai mund të përdoret si informacion sinjali dhe nuk kërkon redaktim të kujdesshëm. Një qasje tjetër përfshin përdorimin e përkthimit me makinë në vend të përkthimit të rregullt njerëzor. Kjo përfshin redaktim dhe personalizim të kujdesshëm të sistemit të përkthimit për një fushë specifike lëndore. Plotësia e fjalorit, përqendrimi i tij në përmbajtjen dhe grupin e mjeteve gjuhësore të teksteve të përkthyera, efektiviteti i metodave për zgjidhjen e paqartësisë leksikore, efektiviteti i algoritmeve për nxjerrjen e informacionit gramatikor, gjetja e korrespondencave të përkthimit dhe algoritmeve të sintezës luajnë një rol këtu. Në praktikë, përkthimi i këtij lloji bëhet ekonomikisht fitimprurës nëse vëllimi i teksteve të përkthyera është mjaft i madh (të paktën disa dhjetëra mijëra faqe në vit), nëse tekstet janë mjaftueshëm homogjenë, fjalorët e sistemit janë të plotë dhe lejojnë zgjerim të mëtejshëm, dhe software i përshtatshëm për redaktim pas. Ky lloj sistemesh përkthimi me makinë përdoret në organizata, nevojat e të cilave për përkthime të shpejta dhe me cilësi të lartë janë mjaft të mëdha.

Baza teorike e periudhës fillestare (fundi i viteve 1940 - fillimi i viteve 1950) të punës për përkthimin me makinë ishte pikëpamja e gjuhës si një sistem kodi. Pionierët e MP ishin matematikanët dhe inxhinierët. Përshkrimet e eksperimenteve të tyre të para duke përdorur kompjuterë të rinj për të zgjidhur problemet kriptografike u botuan në SHBA në fund të viteve 1940. Data e lindjes së përkthimit me makinë si fushë kërkimore zakonisht konsiderohet të jetë marsi i vitit 1947; Pikërisht atëherë, specialisti i kriptografisë, Warren Weaver, në letrën e tij drejtuar Norbert Wiener, shtroi për herë të parë problemin e përkthimit me makinë, duke e krahasuar atë me problemin e deshifrimit.

I njëjti Weaver, pas një sërë diskutimesh, hartoi një memorandum në vitin 1949, në të cilin ai argumentoi teorikisht mundësinë themelore të krijimit të sistemeve të përkthimit me makinë. Së shpejti filloi financimi i kërkimit; Në vitin 1952 u mbajt konferenca e parë mbi përkthimin makinerie, e organizuar nga logjika dhe matematikani J. Bar-Hillel.

Përveç nevojave praktike të dukshme, një rol të rëndësishëm në zhvillimin e përkthimit të makinës luajti edhe fakti se testi i famshëm i inteligjencës ("Testi Turing"), i propozuar në vitin 1950 nga matematikani anglez A. Turing, në fakt zëvendësoi çështjen e nëse një makinë mund të mendojë me pyetjen nëse një makinë mund të komunikojë me një person në gjuhën natyrore në atë mënyrë që ai të mos jetë në gjendje ta dallojë atë nga një bashkëbisedues njerëzor. Kështu, për dekada, çështjet e përpunimit kompjuterik të mesazheve të gjuhës natyrore u bënë fokusi i kërkimit në kibernetikë (dhe më pas në inteligjence artificiale), dhe u krijua një bashkëpunim produktiv midis matematikanëve, programuesve dhe inxhinierëve kompjuterikë, nga njëra anë, dhe gjuhëtarëve, nga ana tjetër.

Në vitin 1954, rezultatet e para iu prezantuan publikut: IBM, së bashku me Universitetin Georgetown (SHBA), kryen me sukses eksperimentin e parë (i cili hyri në histori me emrin Georgetown), gjatë të cilit një sistem duke përdorur një fjalor prej 250 fjalësh. dhe një gramatikë prej 6 rregullash sintaksore përktheu 49 oferta të parazgjedhura. Gjithashtu në vitin 1954, eksperimenti i parë në përkthimin makinerie u krye në BRSS nga I.K. pjesa gjuhësore) dhe D.Yu. një ekip i udhëhequr nga Yu.A.Motorina. Pas kësaj filloi puna në shumë institute informative, organizata shkencore e arsimore në vend.

Ideja e përkthimit me makinë ka stimuluar zhvillimin e kërkimit në gjuhësinë teorike dhe të aplikuar në mbarë botën. U shfaqën teoritë e gramatikave formale, shumë vëmendje iu kushtua modelimit të gjuhës dhe aspekteve të saj individuale, veprimtarisë gjuhësore dhe mendore, çështjeve të formës gjuhësore dhe shpërndarjeve sasiore të dukurive gjuhësore. Janë shfaqur fusha të reja të shkencës gjuhësore - llogaritëse, matematikore, inxhinierike, statistikore, gjuhësia algoritmike dhe një sërë degësh të tjera të gjuhësisë së aplikuar dhe teorike. Gjatë viteve 1950, departamentet e gjuhësisë së aplikuar dhe të përkthimit makine u hapën në qendra arsimore në mbarë botën. Pra, në BRSS, departamente të tilla u krijuan në Moskë (MSU me emrin M.V. Lomonosov, Instituti Pedagogjik Shtetëror i Moskës me emrin M. Thorez - tani MSLU), në Minsk Instituti Shtetëror Pedagogjik i Gjuhëve të Huaja në Moskë, në Jerevan, Makhachkala, Universiteti i Leningradit , në universitetet e Kievit, Kharkovit, Novosibirsk, një sërë qytetesh të tjera. Hulumtimi dhe zhvillimi në përkthimin me makinë është bërë gjithashtu në Francë, Angli, SHBA, Kanada, Itali, Gjermani, Japoni, Holandë, Bullgari, Hungari dhe vende të tjera, si dhe në organizatat ndërkombëtare, nga ku vëllimi i transfertave gjuhë të ndryshme. Aktualisht, hulumtimi mbi MP po kryhet në vende të tilla si Malajzia, Arabia Saudite, Irani etj.

Kërkimi i përkthimit në makinë ka përjetuar si ngritjet ashtu edhe uljet gjatë historisë së tij pesëdhjetëvjeçare. Në fillim të viteve 1960, faza fillestare euforike në zhvillimin e MT mori fund, e cila u lehtësua shumë nga botimi i të ashtuquajturit "Black Book of Machine Translation" - një raport i Komitetit Ad Hoc për Gjuhësinë e Aplikuar ( ALPAC) i Akademisë Kombëtare të Shkencave të SHBA-së, i cili deklaroi pamundësinë e krijimit të së ardhmes së parashikueshme të sistemeve universale të përkthimit me makinë me cilësi të lartë. Pasoja e këtij publikimi ishte një ulje e financimit dhe një rënie e përgjithshme e interesit për problemet e deputetit, por nuk ndodhi një shkurtim i plotë i kërkimit, veçanërisht i kërkimit teorik.

Një rritje e re në kërkimin në fushën e veprimtarisë intelektuale filloi në vitet 1970 dhe u shoqërua me përparime të mëdha në fushën e modelimit kompjuterik të veprimtarisë intelektuale. Fusha përkatëse e kërkimit, e cila u ngrit disi më vonë se deputeti (data e lindjes së saj zakonisht konsiderohet të jetë 1956), u quajt inteligjence artificiale, dhe krijimi i sistemeve të përkthimit me makinë u konceptua në vitet 1970 si një nga detyrat e veçanta të kësaj fushe të re kërkimore.

Ekzistojnë dy stimuj kryesorë për zhvillimin e punës së përkthimit me makinë në botën moderne. E para është në fakt shkencore; ajo përcaktohet nga kompleksiteti dhe kompleksiteti i modelimit të përkthimit kompjuterik. Si një lloj aktiviteti gjuhësor, përkthimi prek të gjitha nivelet e gjuhës - që nga njohja e grafemave (dhe fonemave në përkthim të folurit gojor) përpara se të përcillni kuptimin e deklaratës dhe tekstit. Përveç kësaj, përkthimi karakterizohet Feedback dhe aftësia për të testuar menjëherë një hipotezë teorike në lidhje me strukturën e niveleve të caktuara gjuhësore dhe efektivitetin e algoritmeve të propozuara. Kjo veçori karakteristike e përkthimit në përgjithësi dhe e përkthimit me makinë në veçanti tërheq vëmendjen e teoricienëve, si rezultat i së cilës vazhdojnë të shfaqen teori të reja të automatizimit të përkthimit dhe formalizimit të të dhënave dhe proceseve gjuhësore.

Nxitja e dytë është sociale, dhe kjo për shkak të rritjes së rolit të vetë praktikës së përkthimit në botën moderne, si kusht i domosdoshëm për sigurimin e komunikimit ndërgjuhësor, vëllimi i të cilit po rritet çdo vit. Mënyra të tjera për të përballuar barrierat gjuhësore në rrugën e komunikimit - zhvillimit ose adoptimit gjuhë e vetme, si dhe mësimi i gjuhëve të huaja, nuk mund të krahasohet me përkthimin për nga efikasiteti. Nga ky këndvështrim, mund të argumentohet se përkthimi nuk ka alternativë, kështu që zhvillimi i sistemeve të përkthimit makinerik me cilësi të lartë dhe me performancë të lartë ndihmon në zgjidhjen e problemeve më të rëndësishme sociale dhe komunikuese.

Në rrjedhën e zhvillimit të ideve dhe krijimit të sistemeve industriale të përkthimit makinerik, u zhvilluan metoda për analiza automatike morfologjike për gjuhët kryesore evropiane, metoda për zbulimin automatik të strukturave sintaksore dhe u formuluan kërkesat për përbërësit semantikë të sistemeve. Si pjesë e bashkëpunimit efektiv ndërkombëtar dhe shkëmbimit të terminologjisë, janë krijuar fjalorë të mëdhenj automatikë me një larmi informacioni leksikor, banka të dhënash terminologjike për fusha të ndryshme tematike (për shembull, fjalori EURODICATOM dhe një sërë fjalorësh të tjerë, temat e të cilëve përcaktoheshin nga fakti se përkthimi praktik me makinë më së shpeshti merret me tekste shkencore dhe teknike). Rezultatet e punës në MP kontribuan në fillimin dhe zhvillimin e kërkimit dhe zhvillimit në fushën e automatizimit të marrjes së informacionit, analizës logjike të teksteve të gjuhës natyrore, sistemeve të ekspertëve, metodave të përfaqësimit të njohurive në sistemet kompjuterike etj.

Në BRSS, Qendra Gjithë Bashkimi për Përkthimin e Literaturës dhe Dokumentacionit Shkencor dhe Teknik (VTsP) u caktua në 1974 si organizata kryesore për përkthimin e makinës, e cila mori mbi vete koordinimin e punës në shkallë kombëtare. Nën kujdesin e tij një numër i madh ndërkombëtar konferenca shkencore(1975, 1979, 1983, 1985, 1989) mbi përkthimin makinerik dhe problemet e përkthimit shkencor dhe teknik. Në VCP, sistemet industriale të përkthimit me makinë u krijuan nga anglishtja në rusisht AMPAR (bazuar në kërkimin dhe zhvillimin nga ekipi i Yu.A. Motorin), nga gjermanishtja në rusisht NERPA, me frëngjisht në rusisht FRAP, fjalorë automatikë terminologjikë për të ndihmuar një përkthyes njerëzor. Sistemi AMPAR kohe e gjate ishte në operim industrial; Më pas, mbi bazën e tij u krijuan sisteme MP më efikase për kompjuterët personalë të familjes SPRINT. HCV gjithashtu zhvilloi një sistem të MP nga rusisht në anglisht ASPERA. Një kontribut i madh në zhvillimin e sistemeve industriale MP u dha nga grupi i gjithë Bashkimit i Leningradit "Statistikat e të folurit" nën udhëheqjen e R.G Piotrovsky, si dhe grupe specialistësh në gjuhësinë kompjuterike në Minsk (A.V. Zubov), Kishinau (V.A. Chizhakovsky. ), Makhachkala (A.I. Chaplya), Chimkent (K.B. Bektaev), Samarkand (Kh.A. Arzikulov), etj. Bazuar në kërkimin dhe qasjen shkencore-praktike të grupit të Statistikave të të folurit, ato u zhvilluan më pas dhe tani janë në përdorim komercial sistemet e përkthimit me makinë si Stylus, Socrat etj.

Aktualisht në Federata Ruse Disa punë vazhdojnë në një shkallë të vogël në sistemet MT bazuar në qasjen "tekst-kuptim-tekst", slogani jo gjithmonë i shprehur qartë i të cilit në kohën kur kjo qasje u justifikua në vitet 1960 ishte "përkthim me makinë pa përkthim, pa makina, pa algoritme” (shiko rishikimin e punimeve në këtë fushë nga L.N. Belyaeva dhe M.I. Otkupshchikova). Ideja e qasjes ishte që gjuhëtarit i kërkohet vetëm një përshkrim deklarativ i fakteve të gjuhës (d.m.th., një teori gjuhësore që megjithatë pretendon të jetë veçanërisht e saktë dhe e formalizuar), dhe algoritmet e përkthimit do të jenë përpiluar nga një programues dhe një matematikan. Si pjesë e këtyre studimeve, u morën rezultate të rëndësishme teorike dhe gjuhësore (në veçanti, teoria e të ashtuquajturës funksionet leksikore, e cila ka gjetur zbatim në leksikografi), megjithatë, qasja rezultoi e pamjaftueshme për krijimin e sistemeve praktike të këtij lloji. Të gjitha sistemet praktike, pa përjashtim, përdorin idenë e korrespondencës së përkthimit, d.m.th. ato bazohen në modelin "tekst-tekst" dhe zbatojnë një skemë të shkurtër përkthimi. Aftësitë e teknologjisë kompjuterike, të cilat janë rritur pa masë gjatë dekadave të fundit, dhe qasjet e reja programuese nuk mund të ndihmojnë në asnjë mënyrë për të zbatuar idetë e analizës dhe të analizës. sintezë, bazuar vetëm në prioritetin e identifikimit strukturë sintaksore e ndjekur nga një kalim në kuptim. Identifikimi i përmbajtjes së tekstit brenda ndërfaqes njeri-makinë mund të kryhet, si në çdo tjetër problemi i aplikuar, vetëm duke përdorur njohuri si deklarative ashtu edhe procedurale dhe me një mbështetje të konsiderueshme në fjalor. Ky këndvështrim vërtetohet, veçanërisht, në punimet e fundit të specialistit vendas në programim dhe inteligjencë artificiale A.S.

Operuar jashtë vendit linjë e tërë sistemet e përkthimit me makinë. Më i njohuri prej tyre është sistemi SYSTRAN, i zhvilluar dhe mirëmbajtur nga SYSTRAN Software Inc. dhe përdoret nga Shërbimi i Përkthimit të Makinerisë i Komisionit të Bashkimit Evropian. Shërbimi, i cili prodhon afërsisht 2.5 milionë faqe përkthimi në vit, përdor sistemin SYSTRAN për të përkthyer nga anglishtja në gjermanisht, frëngjisht, spanjisht, greqisht dhe italisht, dhe nga frëngjishtja në anglisht, spanjisht dhe italisht. Një numër sistemesh praktike nga Qendra Kërkimore e Grenoble (Francë), sistemi CULT (Hong Kong, tani Kina) dhe një sërë sistemesh të tjera janë në funksionim praktik. Tregu komercial i përkthimit me makinë ofron sisteme nga kompani të tilla si Logos Corp., Globalinc Inc., Toshiba Corp., CompuServe, etj., duke përfshirë kompaninë e Shën Petersburgut ProMT, e cila ka lëshuar një version të përmirësuar të sistemit të njohur Stylus me emrin PROMT 98.

Problemet e përkthimit makinerik pasqyrohen në konferencat ndërkombëtare të mbajtura rregullisht mbi gjuhësinë kompjuterike COLING, si dhe në konferencat ndërkombëtare për përkthimin makinerie MT SUMMIT.

Inovacionet teknike të viteve 1990 (një zgjerim i konsiderueshëm i aftësive të kompjuterëve personalë, shfaqja e skanerëve me cilësi të lartë dhe programeve efektive të njohjes së tekstit optik të arritshëm për përdoruesin masiv, si dhe zhvillimi i rrjetit global kompjuterik të internetit dhe mjeteve të aksesit atij) i dha një shtysë të re punës në MP dhe tërhoqi njerëz në këtë fushë, investime të reja të rëndësishme u kurorëzuan me rezultate serioze praktike - shfaqja e sistemeve mjaft efektive të përkthimit të makinës dhe fjalorëve kompjuterikë për të punuar në një kompjuter personal (përfshirë produkte. nga kompanitë vendase ProMT, Bit, Arsenal, pjesërisht të përmendura më lart); kombinimi i sistemeve MP me sistemet optike të njohjes së tekstit dhe kontrollit të drejtshkrimit; krijimin e mjeteve të veçanta MP për të punuar në internet, duke ofruar ose përkthimin e teksteve në serverët e kompanive përkatëse, ose përkthimin online të faqeve të internetit. Kombinuar me të kuptuarit e kufizimeve të MP dhe një formulim real të qëllimeve të përdorimit të tij (para së gjithash, këto janë qëllime informative dhe abstrakte, që përputhen mirë me ideologjinë bazë të internetit si një mjet "lundrimi në deti i informacionit”), e gjithë kjo na lejon të flasim për integrimin organik të sistemeve MP në procesin e përgjithshëm të formimit të shoqërisë globale të informacionit.

Efikasiteti sistem modern Deputeti në shkallë vendimtare varet nga përshtatja e tij e suksesshme me një nëngjuhë (ose mikronëngjuhë) specifike të një gjuhe natyrore, në një fjalor të caktuar dhe një grup të kufizuar mjetesh gramatikore karakteristike për tekstet në një fushë të caktuar lëndore, si dhe për disa lloje dokumentesh. Doktrina e nëngjuhëve nga pikëpamja e përkthimit të makinës u formulua për herë të parë nga N.D. Andreev (Universiteti i Leningradit) në 1967, megjithëse idetë për regjistrat e gjuhëve, stilet, zhanret e tekstit të shkruar, etj. ishin të njohura në gjuhësinë tradicionale. Një nëngjuhë, nga këndvështrimi i MT, përcaktohet kryesisht nga një grup i caktuar fillestar tekstesh, brenda të cilave fjalorët hyrës dhe dalës, shkalla e shpërndarjes dhe natyra e paqartësisë leksikore të leksemave, natyra dhe përhapja e ndërtimeve sintaksore. Përcaktohen metodat e përkthimit të tyre në një çift gjuhësor etj., roli që luajnë tekstet paralele dhe fjalorët e përputhshmërisë, me ndihmën e të cilëve mund të studiohet në mënyrë mjaft efektive përputhshmëria leksikore dhe shpërndarja e elementeve gjuhësore në të folur (diskursi, tekst). dhe përdoret në përpilimin e algoritmeve. Karakteristikat statistikore të nëngjuhëve ndihmojnë në organizimin e strukturës së algoritmeve përkatëse të analizës dhe sintezës. Fjalori i prodhimit, i fokusuar në nevojat e sintezës dhe transmetimit të llojeve kryesore të korrespondencave në një çift të caktuar gjuhësor, ofron një tekst dalës të pranueshëm. Në ndonjë prej specie moderne Përkthimi me makinë kërkon pjesëmarrjen e një redaktuesi njerëzor, komoditeti i të cilit sigurohet nga cilësia dhe besueshmëria e softuerit përkatës.

Perspektivat për zhvillimin e përkthimit makinerik shoqërohen me zhvillimin dhe thellimin e mëtejshëm të teorisë dhe praktikës së përkthimit, si në makinë ashtu edhe "njerëzore". Për zhvillimin e teorisë janë të rëndësishme rezultatet e gjuhësisë krahasuese, teoria e përgjithshme e përkthimit, teoria e korrespondencave të rregullta, metodat e paraqitjes së njohurive, optimizimi dhe përmirësimi i algoritmeve gjuhësore. Fjalorë të rinj dhe më efektivë me informacionin e nevojshëm të fjalorit, teori strikte të terminologjisë së fjalorit, teorisë dhe praktikës së punës me nëngjuhë do të ndihmojnë në përmirësimin e cilësisë së përkthimit njësitë leksikore. Gramatikat formale të fokusuara në përkthim do të bëjnë të mundur optimizimin e algoritmeve për gjetjen e korrespondencave të përkthimit në një situatë të caktuar komunikuese, e cila mund të përshkruhet brenda kornizës së teorive përkatëse të aplikuara të përfaqësimit të njohurive. Së fundi, aftësitë e reja programuese dhe kompjuterike do të kontribuojnë gjithashtu në përmirësimin dhe zhvillimin e mëtejshëm të teorisë dhe praktikës së përkthimit me makinë.

21 gusht 2016

Në vitin 1954, një kompjuter IBM 701 që zinte disa dhoma kishte një fjalor prej 250 fjalësh dhe disa rregulla të thjeshta për të përkthyer me saktësi 60 fraza nga rusishtja në anglisht. Kjo arritje (eksperimenti i famshëm i Georgetown) u mbulua gjerësisht në media dhe autoritetet amerikane besuan në një të ardhme të ndritur - përkthimin me makinë të teksteve të armikut në anglisht brenda dhjetë viteve.

Megjithatë, kjo nuk ndodhi. Dhe kjo është arsyeja pse ...

Le të shohim së pari historinë.

Historia e përkthimit me makinë daton në shekullin e 17-të, kur filozofë si Leibniz dhe Descartes sugjeruan ekzistencën e një kodi të caktuar që lidh fjalët. gjuhë të ndryshme. Të gjitha supozimet ishin hipotetike dhe askush nuk kishte arritur të krijonte një makinë përkthimi.


Aplikimet e para për patentë për një "makinë përkthimi" u depozituan në mesin e viteve 1930. Një aplikim u dorëzua nga shpikësi francez J. Artsrouni, i cili thjesht krijoi një fjalor automatik dygjuhësh në shirit të shtypur. Një tjetër u bë nga shkencëtari sovjetik Peter of Troyan, shpikja e të cilit ishte më e detajuar. Ai përfshinte një fjalor dygjuhësh dhe mënyra për të punuar me rolet gramatikore midis dy gjuhëve të bazuara në Esperanto. Ky sistem përbëhej nga tre faza: e para ishte si më poshtë - redaktori, një folës amtare, duhej të lidhte fjalët gjuha burimore(YA) në forma logjike në përputhje me funksionet sintaksore; në fazën e dytë, makina duhej të "përkthente" të gjitha këto forma në gjuhën e synuar (TL); dhe në fazën e tretë, një folës amtare i gjuhës së synuar redaktoi rezultatin që rezulton. Qarku i tij mbeti i panjohur deri në fund të viteve 50, kur u shfaqën kompjuterët.

Plani i parë për të krijuar makina përkthimi të bazuara në kompjuter u propozua nga Warren Weaver, një studiues në Fondacionin Rockefeller, në memorandumin e tij të korrikut 1949. Këto propozime bazoheshin në teorinë e informacionit, e cila fitoi sukses gjatë Luftës së Dytë Botërore në lidhje me kriptografinë dhe përhapjen e idesë së parimeve universale të gjuhëve natyrore.

Disa vite më vonë, aktivitetet kërkimore në lidhje me përkthimin me makinë filluan në të gjitha universitetet amerikane. Më 7 janar 1954, IBM, së bashku me Universitetin Georgetown (SHBA), kryen me sukses demonstrimin e parë sistemi i ri Përkthimi me makinë, i cili u zhvillua në Nju Jork në selinë e IBM. Rezultatet e demonstratës u raportuan në shtyp dhe tërhoqën interes të madh publik. Vetë sistemi ishte pak më shumë se një lodër për standardet e sotme, pasi përdori një fjalor prej 250 fjalësh dhe përkthente 49 fjali të parazgjedhura të lidhura me kimikatet nga rusishtja në anglisht. Megjithatë, demonstrimi stimuloi përhapjen e idesë se përkthimi me makinë ishte i pashmangshëm, dhe në veçanti tërheqja e fondeve për institucionet kërkimore jo vetëm në Shtetet e Bashkuara, por në mbarë botën.

Sistemet e hershme përdorën fjalorë të mëdhenj dygjuhësh dhe rregulla të programuara me dorë për të prodhuar fjalë në rendin e duhur. Në fund të fundit, kjo metodë u njoh si e kufizuar dhe zhvillimi shkencat gjuhësore, për shembull, gjuhësia gjeneruese ose gramatika transformuese, kishte për qëllim përmirësimin e cilësisë së përkthimit.

Në këtë kohë ata ishin duke instaluar OS. Forcat Ajrore të SHBA-së përdorën një program të zhvilluar nga IBM dhe Universiteti i Uashingtonit, ndërsa komisioni energji atomike Shtetet e Bashkuara dhe Euroatom në Itali përdorën një sistem të zhvilluar nga Universiteti Georgetown. Megjithëse cilësia e prodhimit ishte e ulët, sistemi ishte i popullarizuar në mesin e konsumatorëve për shkak të rritjes së shpejtësisë së përkthimit.

Le të kthehemi te eksperimenti i Xhorxhtaunit. Natyrisht, eksperimenti spektakli, përveç atij shkencor, kishte edhe anën politike. Testi sovjetik Bombë atomike në 1949 dhe lëshimi i Sputnik në 1957 i tregoi Shteteve të Bashkuara se BRSS nuk kishte ndërmend të dorëzohej në garën shkencore. Përveç kësaj, për të kuptuar se çfarë po ndodh në të vërtetë pas perde hekuri, nuk do të dëmtonte përkthim i shpejtë shumë dokumente publike dhe sekrete në anglisht. Projekti i përkthimit të makinës u ngrit në kryqëzimin e interesave të shkencëtarëve amerikanë, civilë dhe ushtarakë, të cilët donin të lexonin botime shkencore sovjetike dhe zyrtarë të inteligjencës. Autorët e projektit shpresonin që "rusishtja shkencore", me frazat e saj të thjeshta dhe fjalorin e qartë, do t'i lejonte kompjuterët të zotëronin një gjuhë të zakonshme ruse kaq komplekse dhe të ndryshueshme.

Rusët shkruajnë!

Deri në vitin 1948, 33 për qind u botuan në Rusisht literaturë shkencore. Gjuha gjermane përbënte 40 për qind në vitet e arta të shkencës “teutonike”. Në veçanti, nëse në 1913 tekstet ruse përbënin 2.5 përqind të botimeve të numëruara nga Shërbimi i Abstrakteve Kimike, atëherë në 1958 - 17 përqind, duke tejkaluar ndjeshëm gjermanishten (10 përqind) dhe frëngjisht (5 përqind). Tashmë në 1944, redaktori i botimit paralajmëroi lexuesit për nevojën për të mësuar rusisht.

Në fund të shekullit të 19-të, shkencëtarët dhe inxhinierët amerikanë mësuan të lexonin gjermanisht. Por kush do ta mendonte se në vetëm pesë vjet luftë, gjermanishtja do të shkonte në periferi dhe ju do të duhet të zotëroni simbolet misterioze cirilike! Në vitin 1953, nga 400 mijë shkencëtarë dhe inxhinierë të anketuar, vetëm 400 njerëz lexonin rrjedhshëm rusisht.


Një nga letrat me grusht me një frazë në rusisht

Situata u ndërlikua më shumë për shkak të politikave të Stalinit. Duke luftuar "përkuljen drejt Perëndimit" dhe rrjedhjen e informacionit, në 1947 të gjitha revistat shkencore në gjuhë të huaja u mbyllën në BRSS (Comptes rendus i Akademisë së Shkencave të BRSS, Acta Physicochimica dhe Journal of Physics of BRSS). Për më tepër, ata ndaluan së botuari përmbajtjen e revistës dhe përmbledhjet e artikujve në gjuhë të huaja - dhe tani shkencëtarët perëndimorë që nuk dinin rusisht as nuk mund të kuptonin se çfarë i kushtoheshin botimeve të reja.

Që nga fundi i viteve 1940, dhe veçanërisht pas fillimit të Sputnik-ut Sovjetik, Kongresi Amerikan ka ndarë dhjetëra miliona dollarë për arsimin në gjuhën ruse. Për të thjeshtuar detyrën, vetë studiuesit parashtruan konceptin e rusishtes "shkencore" ose "teknike", larg gjuhës së pakuptueshme të Pushkinit dhe Dostojevskit. Fjalori ndërkombëtar, bollëku i formulave, gramatikë e thjeshtë duhet ta kishte bërë mësimin sa më të lehtë. Por nuk pati përparim të rëndësishëm në zotërimin e rusishtes. Ja ku amerikanët e kthyen vëmendjen e tyre Teknologjitë më të reja- makinat informatike.


Makinat, në shpëtim!

Pionieri i përkthimit me makinë, në mënyrë paradoksale, ishte një njeri larg gjuhësisë strukturore dhe teknologjisë kompjuterike - përkthyesi personal i gjeneralit Eisenhower, Leon Dostert. Ai lindi në vitin 1904 në Francë. Gjatë Luftës së Parë Botërore, gjatë viteve të pushtimit gjerman, Leoni mësoi shpejt gjermanisht dhe u soll në punë si përkthyes. E njëjta gjë ndodhi kur vendlindja e tij Longwy u pushtua nga amerikanët: duke vlerësuar talentin e përkthyesit të ri, oficerët paguanin shkollimin e tij në SHBA. Në vitin 1939, ai ishte tashmë profesor i frëngjishtes në Universitetin Georgetown. Pas humbjes së Francës në 1940, Doster pranoi nënshtetësinë amerikane dhe shërbeu gjatë luftës në stafin e Eisenhower, duke u ngritur në gradën e kolonelit.

Në vitin 1945, Doster, në Gjykatën Ushtarake Ndërkombëtare në Nuremberg, në fakt shpiku përkthimin e njëkohshëm - pasi përkthimi i njëpasnjëshëm do të zgjaste në mënyrë të papranueshme procesin tashmë të gjatë. Atij i lindi ideja për të mbyllur përkthyesit në një “akuarium” dhe për të transmetuar fjalime për secilin prej pjesëmarrësve në proces individualisht, përmes kufjeve. Të gjitha pajisjet u prezantuan falas nga miku i Dosterit, Thomas Watson, presidenti i ardhshëm i IBM. Pasi organizoi një sistem të ngjashëm në OKB, Doster u kthye në universitet si president i Institutit të ri të Gjuhëve dhe Gjuhësisë.

Nuk është për t'u habitur që ky poliglot, fati i të cilit u ndryshua rrënjësisht nga dy luftëra botërore, donte të parandalonte një të tretën. Duke folur në 1951 në faqet e ARMOR, një revistë forcat e blinduara SHBA, Doster ishte skeptik për efektivitetin luftarak të bllokut të NATO-s - pikërisht për shkak të paaftësisë së ushtarëve shumëgjuhësh të vendeve pjesëmarrëse për të kuptuar njëri-tjetrin.

Leon Doster

Shpëtimi erdhi nga një drejtim i papritur. Edhe gjatë viteve të luftës, makinat e numërimit të letrave me grushta makineritë IBM u përdorën jo vetëm për llogaritjen e trajektoreve të predhave dhe zgjidhjen e problemeve logjistike, por edhe në kriptografi. Kjo është ajo që i dha Warren Weaver, një bashkëpunëtor në Fondacionin Rockefeller, idenë e përkthimit me makinë. Në vitin 1947, ai i shkroi një letër babait të kibernetikës, Norbert Wiener: “Problemi i përkthimit mund të zgjidhet si një problem i kriptografisë. Kur shoh një artikull në rusisht, them me vete: "Në të vërtetë është shkruar në anglisht, por është i koduar me karaktere të çuditshme që po deshifroj". Wiener, i cili flet disa gjuhë, e hodhi poshtë projektin, duke vënë në dukje një problem ende të pazgjidhur - fjalët në gjuhët natyrore, ndryshe nga numrat, kanë shumë kuptime të paqarta dhe të paqarta për t'u përkthyer mekanikisht.

Por Weaver mori mjaft para nga Fondacioni për të vazhduar promovimin e ideve të tij. Në vitin 1952, ai sponsorizoi konferencën e parë për përkthimin me makinë, ku u shprehën problemet kryesore teknike dhe filozofike të këtij projekti. Doster gjithashtu mori pjesë në simpozium - dhe shpejt kuptoi se që përkthimi me makinë të jetë i suksesshëm, është e nevojshme të mos debatohet për problemet themelore, por të ndërtohet një pajisje që do t'i provojë të gjithëve realizueshmërinë e kësaj ideje.

Makina e Doster-it mbështetej në gjashtë operacione bazë ("rregulla") dhe, për rrjedhojë, mund të përkthente fjali vetëm aty ku ato zbatoheshin. Secila nga 250 fjalët në leksik ishte e koduar me dy numra që përcaktuan një pemë vendimi binar. Kompjuteri zgjodhi midis renditjes së drejtpërdrejtë dhe të tërthortë të fjalëve, si dhe një nga dy kuptimet e fjalorit. Megjithë mjetet e kufizuara, rezultatet ishin mbresëlënëse: frazat ruse me shkronja latine u futën në makinë (në letra të grushta), dhe pas rreth dhjetë minutash u shfaq rezultati:

KRAXMAL VIRABATIVAYETSYA MYEKHANYICHYESKYIM PUTYEM YIZ KARTOFYELYA
Niseshteja prodhohet me metoda mekanike nga patatet

VYELYICHYINA UGLYA OPRYEDYELYAYETSYA OTNOSHYENYIYEM DLYINI DUGI K RADYIUSU
Madhësia e këndit përcaktohet nga lidhja e gjatësisë së harkut me rrezen

MI PYERYEDAYEM MISLYI POSRYEDSTVOM RYECHYI
Ne i transmetojmë mendimet me anë të të folurit

Pse paratë nga CIA janë të rrezikshme?

Suksesi i bujshëm i demonstratës së vitit 1954 tërhoqi vëmendjen e Marinës, CIA-s dhe agjencive të tjera të ngjashme në projektet e Doster. Por forcat e sigurisë nuk nxituan të derdhnin para. Këtu BRSS dha ndihmë të papritur. Babai i kibernetikës sovjetike, Alexei Lyapunov, tërhoqi vëmendjen te artikulli rreth eksperimentit të Georgetown dhe së shpejti krijoi një grup kërkimor në Institutin Matematik. Ai u pasua nga Dmitry Panov nga Instituti i Matematikës së Precize dhe Shkencave Kompjuterike, dhe deri në vitin 1958, 79 institucione të ndryshme u angazhuan në përkthimin me makinë.

Doster dhe kolegët e tij, duke theksuar nevojën për të "kapur hapin me BRSS", më në fund morën fonde bujare - njëqind mijë dollarë në vit. Çështja u ndihmua edhe nga fakti se shoku i vjetër i linjës së parë të Dosterit, Allen Dulles, drejtoi CIA-n në vitin 1956. Departamentit i mungonin analistë rusisht-folës për të përpunuar informacionin rreth BRSS dhe Doster e siguroi Dulles se makinat e tij së shpejti do të vinin në shpëtim. Gjatë viteve 1956-1958, grupi Georgetown mori rreth një milion e treqind mijë dollarë nga CIA (10 milionë me kursin e këmbimit 2016). Asnjë ekip i vetëm shkencor i asaj kohe, përveç fizikantëve bërthamorë, nuk mund të ëndërronte as shuma të tilla. Pothuajse tetë mijë terma të kimisë organike u përkthyen në kode në kartat me grushta. Doster gjithashtu nënshkroi një kontratë transferimi Dokumentet sovjetike mbi energjinë bërthamore.

Doster dhe Watson (djathtas) gjatë Eksperimentit të Xhorxhtaunit

Megjithatë, nga mesi i viteve 1960, retë u mblodhën mbi projektin. Filozofi Yehoshua Bar-Hillel, eksperti i parë i vendit për përkthimin me makinë, arriti në përfundimin se do të ishte e pamundur edhe në të ardhmen. Kompjuteri, sipas shembull i famshëm Bar-Hillela, nuk e kupton ndryshimin midis frazave Kutia në stilolaps (kutia në kuti) dhe stilolapsi është në kuti (stilolapsi në kuti) - vetëm një person e kupton në mënyrë intuitive kur stilolaps do të thotë "shollë loje" dhe kur do të thotë "stilolaps".

Në vitin 1963, Doster arriti të shmangë sulmet nga kongresmenët që mbajtën seanca dëgjimore të posaçme për çështjen e përkthimit automatik. Por në vitin 1964, Komiteti për Gjuhësinë e Aplikuar të Akademisë Kombëtare të Shkencave të SHBA deklaroi një "mungesë progresi" - nuk kishte asnjë gjurmë të ndonjë përkthimi me makinë të artikujve realë, jo të përshtatur nga rusishtja në anglisht. CIA gjithashtu ndaloi financimin (pa shpjegim).

Makina - në pension

Në fakt, ishte suksesi mahnitës i eksperimentit të Georgetown që gërmoi varrin e projektit. Frazat e para ishin shumë të mira, dhe përkthimet e teksteve më komplekse doli të ishin të pasakta, të ngathëta ose plotësisht të pakuptueshme pa redaktime shtesë.

Sipas Gordin, gabimi fatal i Dosterit ishte që nuk u kushtoi vëmendje konsumatorëve të përkthimeve me makinë. Ai u fokusua ekskluzivisht në agjencitë qeveritare, të cilat mund të ndalonin financimin në çdo kohë (gjë që e bënë).

Sidoqoftë, problemi i "sekreteve të shkencës sovjetike" u zgjidh përfundimisht në SHBA, dhe në një mënyrë mjaft ekonomike. Botuesit privatë kanë krijuar një seri revistash (për shembull, Journal of General Chemistry of the BRSS), ku artikuj nga revistat sovjetike janë përkthyer plotësisht. Në fillim, këto botime gjetën një audiencë mirënjohëse midis amerikanëve që nuk donin të mësonin rusisht, por pas nja dy vitesh pjesa e luanit të tirazhit shkoi te specialistët e huaj. Shkencëtarët nga Franca, Japonia, India apo Brazili, të cilët donin të dinin se çfarë po hulumtohej dhe shpikhej në BRSS, nuk mësuan rusisht, por blenë revista abstrakte amerikane. Kështu, përparimi revolucionar i shkencës dhe teknologjisë sovjetike ndihmoi në vendosjen e anglishtes si monopol gjuhë ndërkombëtare shkencëtarët.

Publikimi i raportit pati një ndikim më të madh në kërkimin e përkthimit me makinë në Shtetet e Bashkuara dhe në një masë shumë më të vogël në BRSS dhe Britaninë e Madhe. Të paktën në Shtetet e Bashkuara, ky lloj kërkimi u ndal për një dekadë të tërë. Në Kanada, Francë dhe Gjermani, kërkimet vazhduan ende. Në SHBA, përjashtimet kryesore ishin themeluesit e kompanive Systran (Peter Thoma)

Nëse në vitet '60 theksi vihej në çifte dhe inpute të caktuara gjuhësore, atëherë në vitet '70 kërkesa u bë kosto e ulët për sisteme të afta për të përkthyer një sërë tekstesh teknike dhe tregtare. Kërkesa është nxitur nga rritja e globalizimit dhe kërkesa për përkthim në Kanada, Evropë dhe Japoni.

Vitet 80 fillimi i viteve 90

Deri në vitet 1980, shumëllojshmëria dhe numri i programeve të përkthimit me makinë u rrit. U përdorën sisteme përkthimi të bazuara në teknologjinë kompjuterike universale si Metali.

Si rezultat i disponueshmërisë në rritje të mikrokompjuterëve, është shfaqur një treg për programet e përkthimit në makinë me kosto të ulët. Shumë kompani në Evropë, Japoni dhe SHBA kanë përfituar nga kjo mundësi. Sistemet u prezantuan në treg në Kinë, Evropën Lindore, Kore dhe BRSS.

Në vitet 1980, pati një entuziazëm të madh për përkthimin me makinë në Japoni. Me ardhjen e kompjuterëve të gjeneratës së pestë, Japonia planifikoi të hidhej më lart se kushdo tjetër në fushën e teknologjisë dhe programimit, një projekt që lidhej me krijimin e programeve për përkthim nga/në anglisht ishte me interes për shumë kompani (Fujitsu, Toshiba, NTT, Brother, Catena, Matsushita, Mitsubishi, Sharp, Sanyo, Hitachi, NEC, Panasonic, Kodensha, Nova, Oki).

Kërkimet në vitet 1980 bazoheshin në përkthimin e njësive gjuhësore duke përdorur analizën morfologjike, sintaksore dhe semantike.

Produktet e para komerciale të përkthimit me makinë që gjetën përdorim praktik në Rusi u shfaqën në mesin e viteve '80. Ato u zbatuan në kompjuterë personalë dhe ishin sisteme të drejtpërdrejta përkthimi, aftësitë e të cilave bazoheshin në fjalorë të mëdhenj (në krahasim me sistemet e para), dhe jo në aftësinë për të analizuar dhe sintetizuar tekste.

Produktet moderne të përkthimit me makinë komerciale ofrohen nga kompanitë vendase:

- Vista Technologies dhe Adventis, të formuara në 1991 nga një ekip zhvilluesish të shkëputur nga VINITI;
- PROMT, e formuar në vitin 1991;
- "Media Lingua".

Për shembull, fjalorët Retrans Vista ruajnë miliona koncepte, të cilat përfshijnë jo vetëm stalla tradicionale njësi frazeologjike, por, mbi të gjitha, fraza të përdorura në të folurit e përditshëm. Përveç kësaj, ekziston një program analize konceptuale që nxjerr automatikisht fraza të reja nga teksti dhe i përfshin ato në fjalor. Fjalorët kryesorë të sistemit Retrans Vista përmbajnë terma dhe njësi frazeologjike në shkencat natyrore dhe teknike, ekonomi, biznes dhe politikë. Vëllimi i fjalorit politematik të makinës është rreth 3.4 milion fjalë (1.8 milion në pjesën ruso-anglisht, 1.6 milion në anglisht-rusisht), dhe 20% e tyre janë fjalë, dhe 80% janë fraza të qëndrueshme me një "gjatësi" mesatare prej 2.2 fjalësh.

Fundi i viteve 1980 pa një rritje në numrin e metodave të përdorura në përkthimin me makinë. Sistemi i zhvilluar nga IBM bazohej në një metodë statistikore. Grupet e tjera kanë përdorur metoda të bazuara në numer i madh shembuj të përkthimeve, kjo teknikë quhet përkthim makineri i bazuar në shembuj. Karakteristika përcaktuese e të dyja qasjeve ishte mungesa e rregullave semantike dhe sintaksore dhe mbështetja në manipulimin e korpuseve të tekstit.

Në vitet '90, pas suksesit të programeve të njohjes dhe sintezës së të folurit dhe me zhvillimin e Verbmobil, filluan zhvillimet në përkthimin e të folurit.

Si rezultat i ardhjes së kompjuterëve me kosto të ulët dhe më të fuqishëm, kërkesa për programe të përkthimit me makinë është rritur. Ishte në fillim të viteve '90 që përkthimi filloi të kryhej jo nga kompjuterë të rëndë, por nga kompjuterë personalë dhe terminale të ekranit. Një nga kompanitë që dominonte tregun e PC në atë kohë ishte Systran.

Hulumtimet e fundit

Përkthimi me makinë ka pësuar ndryshime të rëndësishme gjatë viteve të fundit. Aktualisht, një sasi e madhe kërkimesh po kryhen në fushën e përkthimit statistikor të makinës dhe përkthimit me makinë bazuar në shembuj të përkthimit. Sot, pak kompani përdorin përkthimin statistikor me makinë për qëllime komerciale, për shembull, Microsoft (përdor programin e vet të përkthimit statistikor me makinë për të përkthyer artikujt e bazës së të dhënave). Ka pasur një interes të ri për hibridizimin, me studiuesit që kombinojnë njohuritë sintaksore dhe morfologjike (d.m.th. gjuhësore) në sistemet statistikore me rregullat ekzistuese.

burimet

Kontsevoy Daniil Sergeevich,
Institucioni arsimor privat i arsimit të lartë "Akademia e Drejtësisë Omsk", Omsk

Një përkthyes në fushën e komunikimeve profesionale është një person që flet në mënyrë aktive gjuhe e huaj sferën profesionale, të aftë për të ndërtuar në mënyrë logjike të saktë, të arsyeshme dhe të qartë të folurit me gojë dhe me shkrim në gjuhë të huaj, dhe më e rëndësishmja, të zotërojë teknikën e përdorimit të sistemeve të përkthimit me makinë, sepse as profesionistët nuk mund të bëjnë pa iu drejtuar përkthyesve elektronikë.

Përkthimi me makinë - ekzekutuar në një kompjuter ose në një tjetër Pajisje elektronike procesi i konvertimit të tekstit nga një gjuhë në tekst ekuivalent në përmbajtje nga një gjuhë tjetër, si dhe rezultati i një veprimi të tillë. Meqenëse nuk ka përkthyes elektronikë plotësisht të automatizuar të aftë për të përkthyer saktë dhe saktë një tekst, një përkthyes specialist duhet ta përgatisë këtë tekst ose të korrigjojë gabimet dhe lëshimet tashmë në tekstin e përpunuar me makinë.

Ekzistojnë katër forma të organizimit të ndërveprimit midis një kompjuteri dhe një personi gjatë kryerjes së përkthimit me makinë:

  • redaktimi paraprak: një person përgatit tekstin për përpunim kompjuterik (duke thjeshtuar kuptimin e tekstit, duke eliminuar leximet e paqarta, duke shënuar tekstin), pas së cilës kryhet përkthimi me makinë;
  • ndër-redaktimi: një person ndërhyn drejtpërdrejt në funksionimin e sistemit të përkthimit, duke zgjidhur çështje problematike;
  • pas redaktimit: i gjithë teksti burimor i nënshtrohet përpunimit në makinë dhe një person korrigjon rezultatin duke redaktuar tekstin e përkthyer;
  • sistem i përzier.

Përkthyesit elektronikë modernë janë të aftë të prodhojnë një përkthim adekuat perceptualisht të frazave dhe fjalive individuale, ata shërbejnë për të lehtësuar punën e një përkthyesi njerëzor, për ta çliruar atë nga puna rutinë e kërkimit të kuptimeve të fjalëve dhe frazave të caktuara në fjalor.

Për të zotëruar sistemet e përkthimit me makinë, është e nevojshme të paktën të keni një kuptim të përgjithshëm të teknologjive të përkthimit elektronik. Ka disa prej tyre në përkthimin makinerik:

1) Përkthim i drejtpërdrejtë me makinë

Përkthimi i drejtpërdrejtë me makinë është qasja më e vjetër e përkthimit me makinë. Me këtë metodë përkthimi, teksti në gjuhën burimore nuk i nënshtrohet analizës strukturore përtej morfologjisë. Ky përkthim përdor një numër të madh fjalorësh dhe është fjalë për fjalë, me përjashtim të rregullimeve të vogla gramatikore, për shembull në lidhje me renditjen e fjalëve dhe morfologjinë. Sistemi i përkthimit të drejtpërdrejtë është krijuar për çifte të veçanta gjuhësore. Leksiku është një depo informacioni për specifikat e fjalëve. Këto sisteme varen nga cilësia e përgatitjes së fjalorit, analiza morfologjike dhe softueri i përpunimit të tekstit. Një shembull i një sistemi të përkthimit të drejtpërdrejtë është Systran.

2) Përkthimi me makinë i bazuar në rregulla përdor një sasi të madhe rregullash gjuhësore dhe fjalorë dygjuhësh për çdo çift gjuhësor. Llojet e përkthimit makinerik të bazuar në rregulla përfshijnë parimin e Interlingua dhe Transferimin e përkthimit me makinë.

  • Përkthimi me makinë interlingua

Në përkthimin makinerik bazuar në parimin e Interlingua, përkthimi kryhet nëpërmjet një modeli të ndërmjetëm (semantik) të tekstit të gjuhës burimore. Interlingua është një model i pavarur nga gjuha nga i cili mund të gjenerohen përkthime në çdo gjuhë. Parimi i Interlingua lejon mundësinë e transformimit të tekstit në gjuhën burimore në një model të përbashkët për disa gjuhë.

  • Transferimi i përkthimit me makinë bazohet në idenë e Interlingua duke përdorur analizën krahasuese të dy gjuhëve. Tre faza këtë proces: analiza, transferimi dhe gjenerimi. Së pari, teksti në gjuhën burimore përkthehet në një model abstrakt ose të ndërmjetëm të gjuhës burimore, i cili më pas shndërrohet në një model të gjuhës së synuar, në mënyrë që përfundimisht të formohet në tekst në gjuha e synuar. Ky parim është më i thjeshtë se interlingu, por është më e vështirë të shmanget paqartësia.

3) Përkthimi me makinë në korpuset e tekstit

Qasja e korpusit në përkthimin me makinë përdor një koleksion (korpus) tekstesh paralele dygjuhëshe. Avantazhi kryesor i sistemeve të përkthimit makinerik të bazuar në korpus është vetë-akordimi i tyre, d.m.th. ata janë në gjendje të mbajnë mend terminologjinë, madje edhe stilin e frazave nga tekstet e përkthimeve të mëparshme. Përkthimi statistikor me makinë dhe përkthimi i bazuar në shembuj janë variante të qasjes së korpusit.

  • Përkthimi statistikor me makinë

Ky është një lloj përkthimi i tekstit me makinë i bazuar në krahasimin e vëllimeve të mëdha të çifteve gjuhësore. Kjo qasje e përkthimit përdor modele përkthimi statistikor. Një nga qasjet e përdorura është teorema e Bayes. Ndërtimi i modeleve statistikore të përkthimit është një proces mjaft i shpejtë, por teknologjia mbështetet shumë në disponueshmërinë e një korpusi teksti shumëgjuhësh. Një minimum prej 2 milionë fjalësh kërkohen për çdo fushë individuale nëse flasim për gjuhën në tërësi. Përkthimi statistikor me makinë kërkon pajisje të posaçme për të "mesataruar" modelet e përkthimit. Një shembull i përkthimit statistikor me makinë është Google Translate.

  • Përkthimi makinerik me shembuj

Sistemet e përkthimit me makinë të bazuara në shembuj bazohen në parimin e një korpusi paralel dygjuhësh tekstesh, i cili përmban çifte fjalish si shembuj. Çdo fjali kopjohet në një gjuhë të ndryshme. Përkthimi statistikor me makinë ka një veti "të mësuarit". Sa më shumë tekste (shembuj) të keni në dispozicion, aq më i mirë është rezultati i përkthimit me makinë.

Çdo përkthyes në fushën e komunikimit profesional do të përballet me problemin e zgjedhjes së programit të përshtatshëm të përkthimit. Duke përjashtuar shërbimet me pagesë, ne e konsiderojmë të nevojshme të analizojmë sistemet më të njohura.

Elektronike perkthyesi i Google Translate, i cili u zhvillua nga Google në mesin e viteve 2000. Ky shërbim është krijuar për përkthimin e teksteve dhe përkthimin e faqeve të internetit në fluturim. Përkthyesi përdor një algoritëm të përkthimit me makinë vetë-mësimore bazuar në analizën gjuhësore të teksteve.

Ndryshe nga shumica e përkthyesve të makinave, të cilët përdorin teknologjinë SYSTRAN, Google përdor softuerin e vet. Google Translate është aktualisht përkthyesi më i popullarizuar për shkak të thjeshtësisë dhe shkathtësisë së tij (si dhe lidhjes së tij të drejtpërdrejtë me zhvilluesin e softuerit kompjuterik - Microsoft). Në këtë mënyrë, këtë sistem përkthimi me makinë po zhvillohet shumë shpejt dhe është i optimizuar për të përmbushur nevojat e përdoruesve. Prandaj, tani mund të vërehen funksionet e këtij përkthyesi: përkthimi i të gjithë faqes së internetit; kërkimi i njëkohshëm i informacionit me përkthimin në një gjuhë tjetër; përkthimi i tekstit në imazhe; përkthimi i frazës së folur; përkthim me shkrim dore; përkthimi i dialogut.

Karakteristikat e këtij sistemi të përkthimit me makinë përfshijnë:

  1. Opsionet e përkthimit kontrollohen nga një algoritëm statistikor.

Përdoruesit mund të ofrojnë gjithmonë përkthimet e tyre të fjalëve të caktuara dhe/ose të zgjedhin një nga opsionet e përkthimit si më të përshtatshmet. Disavantazhi i një algoritmi të tillë mund të jenë opsionet e përkthimit qëllimisht të pasakta, duke përfshirë fjalë të turpshme.

  1. Mbulimi i gjuhëve të botës.

Kjo do të thotë, programi tani funksionon me më shumë se njëqind gjuhë, duke përfshirë suahili, kinezisht dhe uellsisht. Kështu, Google Translator është në gjendje të përkthejë nga një gjuhë e mbështetur në një gjuhë tjetër të mbështetur, por në shumicën e rasteve përkthimi kryhet përmes anglishtes. Disavantazhi i këtij mekanizmi është i dukshëm - cilësia e përkthimit vuan.

PROMT, i zhvilluar në 1991, zë një pozicion udhëheqës në tregun rus të përkthyesve të makinave.

PROMT, si Google Translate, përdor softuerin e vet, i cili u përditësua ndjeshëm në 2010. Tani e tutje, PROMT kryen përkthimin e bazuar në teknologjinë hibride. Thelbi i tij qëndron në faktin se në vend të një opsioni përkthimi, programi prodhon rreth njëqind përkthime të së njëjtës fjali, në varësi të polisemisë së fjalëve, ndërtimeve dhe rezultateve statistikore. Makina më pas zgjedh përkthimet më të mundshme nga përkthimet e propozuara. Kështu, përkthyesi është në gjendje të mësojë shpejt, por ka të njëjtat disavantazhe si të gjithë përkthyesit bazuar në metodat statistikore përpunimi i tekstit.

Aftësitë e përkthyesit përfshijnë: përkthimin e fjalëve, frazave dhe teksteve, duke përfshirë përdorimin e çelësave të nxehtë; përkthimi i një zone të zgjedhur të ekranit me tekst grafik; përkthimi i dokumenteve të formateve të ndryshme: doc(x), xls(x), ppt(x), rtf, html, xml, txt, ttx, pdf (përfshirë ato të skanuara), jpeg, png, tiff; përdorimi, redaktimi dhe krijimi i fjalorëve të specializuar dhe profileve të përkthimit; lidhjen e bazave të të dhënave dhe fjalorëve të Memorjes së Përkthimit; integrimi në aplikacionet e zyrës, shfletuesit e internetit, portalet e korporatave dhe faqet e internetit.

Disavantazhet e përkthyesit janë: një numër i vogël i çifteve gjuhësore me të cilat funksionon programi; ndërfaqe komplekse; pasaktësitë në përkthime fjalorin profesional(që megjithatë eliminohet duke lidhur fjalorë tematikë).

Sidoqoftë, PROMT u njoh si përkthyesi më i mirë anglisht-rusisht në seminarin vjetor mbi përkthimin statistikor me makinë nën kujdesin e Shoqatës për Gjuhësinë Kompjuterike (ACL) në 2013 dhe 2014.

Ka shumë sisteme të tjera të përkthimit me makinë, por ato disi kopjojnë karakteristika të ndryshme përkthyes vendas PROMT ose Google Translate amerikan.

Kështu, një përkthyes në fushën e komunikimit profesional, duke njohur teknologjitë e përkthimit në makinë, i cili di të zgjedhë përkthyesin e duhur elektronik për qëllime të caktuara, do të jetë i zgjuar për të kryer me sukses veprimtari profesionale, sepse në këtë fazë të zhvillimit teknologji kompjuterikeËshtë shumë herët për të menduar për përkthimin plotësisht automatik me makinë. Një përkthyes njerëzor mendon në imazhe dhe del nga qëllimi: t'i përcjellë një mendim specifik dëgjuesit/lexuesit. Është e vështirë të imagjinohet program kompjuterik me mundësi të tilla. Përkthyesit e makinerive moderne luajnë një rol mbështetës. Ato janë krijuar për të shpëtuar një person nga puna rutinë gjatë procesit të përkthimit. Epoka e fjalorëve në letër ka mbaruar dhe sistemet e përkthimit me makinë po vijnë për të ndihmuar përkthyesit profesionistë (dhe jo vetëm të tjerët).

Lista e literaturës së përdorur

  1. www.promt.ru
  2. www.translate.google.com
  3. Belonogov G.G. Zelenkov Yu.G. Sistemi interaktiv për përkthimin makine rusisht-anglisht dhe anglisht-rusisht, VINITI, 1993.
  4. Buletini i Universitetit të Moskës. Ser.19 Gjuhësia dhe komunikimi ndërkulturor. 2004. Nr.4, f.51.

Vlerësimi juaj: Bosh



Artikulli i mëparshëm: Artikulli vijues:

© 2015 .
Rreth sajtit | Kontaktet
| Harta e faqes