一、機器翻譯現(xiàn)在能做什么
針對我們當前機器翻譯的發(fā)展狀況,我們可用以下的案例來說明。5年連續(xù)用機器翻譯同一個句子,通過結果對比,我們可以從流暢度、準確度等方面看出,機器譯文翻譯質量是在不斷提高的。
這也有賴于近幾年機器翻譯的發(fā)展——2016-2017年,谷歌翻譯上線神經網(wǎng)絡機器翻譯,此后各機器翻譯企業(yè)也跟進了這方面的研發(fā),譯文流暢度得到大幅提升;特別是在2018年,微軟公司宣布在新聞翻譯系統(tǒng)特定領域,其質量超過人工翻譯,可以窺見機器翻譯近幾年突飛猛進的現(xiàn)狀。
同時,我們也可以開出機器翻譯應用場景也大大拓寬,大體上可以分為開放翻譯系統(tǒng)、私有系統(tǒng)、機器翻譯與場景的融合。其中,私有翻譯系統(tǒng)是一個較明確的商業(yè)化方向,根據(jù)用戶數(shù)據(jù)實現(xiàn)定制化,無需聯(lián)網(wǎng),滿足了不少B端和G端用戶需求。
國內外也出現(xiàn)了較多出色的機器翻譯公司,視頻翻譯也成為了一個熱潮,字幕通、網(wǎng)易見外、Videolocalize和人人譯視界等平臺逐漸發(fā)揮出優(yōu)勢;各種新聞資訊翻譯平臺也得到了大眾的認可;另外,電商翻譯、跨語言搜索、跨語言大數(shù)據(jù)分析蓬勃發(fā)展,網(wǎng)絡小說出海,翻譯APP、翻譯機/翻譯耳機、AI同傳等產品逐漸受到大眾歡迎。
二、機器翻譯還不能做什么
雖說機器翻譯發(fā)展很迅猛,但當前機器翻譯的發(fā)展還是具有局限性的,主要有漏譯、上下文不一致等現(xiàn)象,在技術層面則存在大部分語言數(shù)據(jù)稀疏、神經網(wǎng)絡可解釋性差,融合語言知識難度大,缺乏客觀評價標準等問題。具體而言,在技術層面,也面臨著一些瓶頸,大部分語言數(shù)據(jù)稀疏,除中英外,其他語種的語料十分稀缺,比如東南亞語種;另一方面,神經網(wǎng)絡可解釋性還不夠高,還是一個黑盒子;機器翻譯在當前融合語言知識的“性價比”還不高;機器翻譯缺乏客觀評價標準,計算機語言沒有絕對的量化指標衡量譯文的好壞,不可能做到計算機完全取代人工翻譯。
機器翻譯什么時候像人工翻譯一樣好?李總用了兩個圖形象地說明:機器翻譯在進行文字轉換的過程中,會丟失大量的文化、常識、背景等信息,這是機器翻譯短期無法像人工翻譯一樣好的重要原因。
三、機器翻譯和人工翻譯邊界的幾點思考
機器翻譯和人工翻譯比拼的不是語言能力,文字轉換能力,而是語言背后的背景知識、常識、推理、文化。語言文化知識目前很難用計算機語言來描述和自動化;第二,機器翻譯在可見未來的使命是完成語言層面的轉換(單詞、詞法、句法關系那些死記硬背的、學外語過程中痛苦大于樂趣的東西),但不是文化和思維(那恰恰是學外語的樂趣所在);第三,高維和低維邊界模糊(比如陪同翻譯對計算機而言場景更復雜,更難勝任、相反和同傳卻天然存在一些能力上的重合),情感和文化上的交流很難通過機器來實現(xiàn)。
四、2030年的兩類譯者會是什么樣子?
在講者看來,在2030年會產生兩種譯者。
**,各行業(yè)非專業(yè)譯者。我們可以從歷史中看出,隨著技術的發(fā)展,特定行業(yè)都會發(fā)生平民化趨勢——上個世紀曾經光鮮靚麗的打字員在計算機普及的趨勢下,逐漸消失;2010年,“美圖秀秀”之類的圖片編輯軟件的普及讓大眾具有了部分“P圖”的能力;2020年,短視頻,視頻剪輯被大眾所熟悉,可謂人人皆可化身視頻剪輯師;2040年,伴隨著今天“編程從娃娃抓起”的現(xiàn)狀,人人皆軟件開發(fā)者。具體而言,新譯者和傳統(tǒng)譯者是存在著能力差別的。這里可以提到了譯者A核心能力模型變化———傳統(tǒng)譯者對比新譯者,在專業(yè)知識方面會次于新譯者,比如說前幾年某引入了醫(yī)療機器翻譯系統(tǒng)的語言服務企業(yè),在招聘時候已經有所傾向,相比于招語言專業(yè)背景的人員,生命科學專業(yè)人員更受青睞。
第二,學外語出身的新型譯員。這種譯員的特點是——有個人定制級的機器引擎,超出機器翻譯水平的語言能力且不甘只做譯后編輯這樣的“清潔工”工作,技術賦能的相關工具(檢索、術語、項目管理),個人數(shù)據(jù)、信用資產(區(qū)塊鏈)。
五、給翻譯專業(yè)同學的一些建議
**后,講者給翻譯專業(yè)同學的一些建議。**,未掌握超過機器翻譯的語言能力,如果要從事翻譯行業(yè),對語言素質方面要對自己要有極高的要求,譯者永遠要讓機器翻譯服務于自身;
第二,要學會善用、理解技術。理解技術背后的原因,比如說鳥派學和空氣動力學派之于飛行、規(guī)則還是數(shù)據(jù)驅動之于機器翻譯,;第三,深扎幾個領域,比如說醫(yī)療、金融、法律。同時,個人數(shù)據(jù)、信用資產,未來透明信用社會下,區(qū)塊鏈等信用資產是一個很好的起點。
針對于翻譯老師的建議,講者強調要關注翻譯技術、市場,很多翻譯理論研究有局限性,傳承性不高,有些還不具有解釋性;其次翻譯技術可能不只是軟件操作,更重要的是一種解決實際問題的開放心態(tài)。
同時,面向不想做翻譯同學,講者也提供了一些建議。**,要認識到學語言本來就不限于翻譯職業(yè),語言背后有著文化、思維的拓展;借助語言能力增加信息寬帶縱深,進入職業(yè)市場,只有專業(yè)知識,才有立足的一席之地。
**后,講者提出了一些具有啟發(fā)性的總體建議。**,跟隨自己的熱情,不能盲目追求熱點,比如30年前,語言專家在機器翻譯研發(fā)中占主導,30年后的今天,則是算法工程師主導,可謂“三十年河東,三十年河西”。如果對語言感興趣,不妨深扎語言,機器永遠無法取代。第二,AI重塑生產力是社會范圍的,比如同傳、金融分析師、放射科醫(yī)生等等,并不局限在翻譯行業(yè)。在這樣的變化下,更重要是的如何適應變化。第三,變商:《贏在扭轉力》一書中提到了“10倍速時代,應變能力比起點重要”。
本文摘自《AI時代:2030年的譯者會是什么樣子?》講座