1.原理
翻譯記憶 (TM) 的原理其實非常簡單。由于專業翻譯領域所涉及的翻譯資料數量巨大,而范圍相對狹窄,集中于某個或某幾個專業,如政治、經濟、軍事、航天、計算機、通訊等專業都有自己的專業翻譯公司或部門。這就必然帶來翻譯資料的不同程度的重復。據統計,在不同行業和部門,這種資料的重復率達到 20%―70% 不等。這就意味著譯者至少有 20% 以上的工作是無謂的重復勞動。翻譯記憶技術就是從這里著手,首先致力于消除譯者的重復勞動,從而提高工作效率。
翻譯記憶 (TM) 技術原理是這樣的:用戶利用已有的原文和譯文,建立起一個或多個翻譯記憶庫 (Translation Memory),在翻譯過程中,系統將自動搜索翻譯記憶庫中相同或相似的翻譯資源(如句子、段落等),給出參考譯文,使用戶避免無謂的重復勞動,只需專注于新內容的翻譯。翻譯記憶庫同時在后臺不斷學習和自動儲存新的譯文,變得越來越“聰明”,效率越來越高。幾乎所有翻譯記憶廠家都會告訴用戶:有了 TM,你永遠不必對同一句話翻譯兩遍!
機器翻譯界一位著名專家曾經說過,機器翻譯做了人愿意做的工作,卻沒有做好;翻譯記憶則做了人不愿做的工作!可不是嗎,有誰愿意把時間花在重復勞動上,又有誰樂意讓一臺技術不成熟機器來代替自己的工作呢?翻譯記憶技術,實際起了輔助翻譯的作用,也就是“計算機輔助翻譯”,簡稱 CAT (Computer Aided Translation)。
2.功能與實例
1) 翻譯過程
我們來看一個典型的翻譯記憶軟件工作的例子。利用 TM 系統來翻譯句子 "This is a file for demo"。由于這是 TM 第一次啟動,當然沒有任何“記憶”,需要用戶輸入譯文,“這是一個演示文檔”。TM 在翻譯下一句的同時,也把這一原文和譯文做為一個翻譯單元儲存了起來。當我們再來翻譯另一個句子 "This is a demo file" 時,TM會搜索翻譯記憶庫,對該句和記憶庫中翻譯單元進行對比和匹配,挑出原文最接近的翻譯單元,給出參考譯文。在這里,該參考譯文就是“這是一個演示文檔”。用戶當然可以接受該譯文,也可以做一些修改,修改后的新譯文會自動存入記憶庫,供以后使用。翻譯記憶庫就這樣儲存每一句新的譯文,隨時為用戶提供參考。由于專業領域詞匯和句式相對固定,當用戶積累了多個有一定規模的記憶庫后,遇到的重復句子會越來越多,翻譯工作也變得越來越輕松。
TM 產品還都支持網絡共享記憶庫功能。也就是說,當多人同時進行翻譯時,可以通過局域網共享一個翻譯記憶庫。比如,譯員 A 剛剛翻譯了 "This is a file for demo",當譯員 B 遇到 "This is a demo file" 時,系統會給出 A 的譯文 "這是個演示用的文件"。B 可以接受,也可以修改,修改后的譯文又可供自己或他人重復使用。翻譯記憶庫就在這樣的不斷補充和完善過程中,發揮著越來越大的作用。
2) 自動建庫
對于在使用 TM 產品前,已經積累了大量翻譯資料的用戶,TM 產品會提供一個自動建庫工具。該工具能自動分析和匹配原文和譯文,以句子為單位將原文和譯文一一對應。用戶做完一些調整和校對之后,該工具會自動生成一個標準的翻譯記憶庫文件。用戶所有的資料都可以通過該工具得到回收,從而高效、快捷地建立起翻譯記憶庫。這些庫在不斷的使用過程中,又會得到進一步補充和完善。
3)術語管理
TM 產品一般還提供一個非常重要的功能:術語管理。對于專業技術領域來說,幾乎每篇文檔都帶有大量的專業術語,術語譯文的前后一致,始終是校對的重要內容之一。這項工作費時費力,難保還會有疏漏。TM 產品通過一個術語管理工具(一般是個電子辭典),來規范所有的術語。用戶只需一次性建立一個或多個標準術語列表(表中包括術語原文和譯文),在使用 TM 系統翻譯時,打開術語管理工具中相應的術語列表,TM 會自動識別出當前句子中有哪些詞是已定義的術語,并給出標準的術語譯文。這樣就不會在一篇文章或一本書中,不同的人把 "Mouse" 分別譯為“鼠標”、“滑鼠”,甚至“老鼠”了,也省掉了校對的麻煩。不同的 TM 產品對術語管理的實現方式雖有不同,但殊途同歸,最終都是為了保證術語的統一。
4) 多語種間雙向互譯
由于翻譯記憶實現的是原文和譯文的比較和匹配,這還帶來了 TM 的一個先天優勢--支持多語種之間的雙向互譯。以全球最著名的翻譯記憶軟件廠商,德國塔多思 (TRADOS) 公司為例,該公司的產品基于 UNICODE,支持 55 種語言,覆蓋了幾乎所有語言版本的 Windows 95/98/NT。換句話說,一套產品就可以實現各語種間的雙向互譯,這在機器翻譯是難以想像的。
5) 自動排版
人不愿做的事情又豈止是重復勞動。電子文檔的排版工作也是讓翻譯人員頭疼的工作。尤其本地化行業,對譯文的格式要求極為嚴格,必須和原文檔的格式保持一致。在這方面,翻譯記憶產品又遠遠地走在了前頭。目前的翻譯記憶產品一般都提供各種格式處理工具,支持流行文檔格式,如 DOC、RTF、HTML、SGML、PPT 等等。譯文會自動套用原文的格式,翻譯人員不必費心排版,只要全神貫注從事翻譯就可以了。
統計數據表明,通過在翻譯流程中應用 TM 技術,工作效率能提高 30%―60%,效益十分可觀。
6)項目管理
翻譯軟件市場,誰主沉浮
答案似乎不言自明,難道不是翻譯記憶嗎?其實翻譯記憶的技術特點決定了它的用戶群主要是專業和行業用戶。對外語水平較差的個人用戶來說,機器翻譯的譯文盡管還“不太明白”,但總比“一點都不明白”要好得多了。而翻譯記憶產品昂貴的價格,日復一日的翻譯記憶庫建立工作,都是非專業用戶所無法承受的。所以現階段,TM 和 MT 各有所需,各得其所,倒也相安無事。
目前在全球翻譯記憶 (TM) 市場上,德國塔多思 (TRADOS) 公司處于絕對領先地位,其核心產品 Translator's Workbench(翻譯工作平臺)直接和微軟 Word 集成,界面友好,此外還有強大的網絡共享、術語管理、翻譯項目管理,以及格式轉換處理功能,為專業翻譯領域提供了一整套解決方案。
隨著 TM 這一技術在國內的推廣應用,人們必然面臨一個選擇的問題。其實只要做到了以下幾點,就可以說是真正的 TM 產品:第一,支持 TMX(Translation Memory Exchange - 翻譯記憶交換)標準。因為只有翻譯記憶庫文件的輸出格式符合 TMX 標準,才能實現不同 TM 產品間的數據交換。第二,支持多語種之間的雙向互譯。第三,開放的翻譯記憶庫管理機制,允許用戶根據需要,對記憶庫進行分類、檢索、合并、拆分及加密。第四,支持多種常用文檔格式(DOC、RTF、HTML、SGML、PPT、FM、MIF 等),避免用戶再排版。第五,提供術語管理功能,即通過統一的術語列表,在翻譯過程中動態提示術語的譯文,規范術語的翻譯。如果您所面對的 TM 產品完全符合這些條件,那就值得進一步評估。至于其它功能,當然多多益善,但以上幾條是必需的。
對于專業翻譯領域來說,翻譯記憶 (TM) 是目前唯一的選擇。該領域特點決定了翻譯記憶技術有著廣闊的應用前景!
(摘自SDL-TRADOS中國技術中心)
Copyright @ 2005-2020 南京同傳翻譯公司 版權所有