花季传媒免费观看下载_花季传媒下载旧版_花季传媒网站入口_花季传媒APP下载应用

盡管川普的走馬上任更多與“逆全球化”綁定在一起,但考慮到人類歷史“螺旋狀”上升的演化軌跡,在技術進步和文化擴散的雙重推動下,這個世界總體趨向互通互聯的趨勢似乎不可違——尤其當全球化與網絡相遇的一瞬,不同國家之間平等便捷獲取信息,低成本地有效溝通即成一種必然。從這個意義上,全球化的最大敵人之一也許是各國千百年來夯實的語言壁壘。

作為一門交叉學科,機器翻譯涉及到認知科學,計算機,信息論,語言學等多學科,其理論路徑同樣經歷了螺旋狀上升:從最久遠的“翻譯備忘錄”到后期基于規(guī)則,基于實例的機器翻譯,再到被視為機器翻譯重要轉捩點的統計翻譯模型(SMT)——后者是科學家初次察覺到通過大數據消弭信息不確定性是攻克“智能”的好辦法。

而最近兩年,機器翻譯正在擁抱另一個更重要的技術轉折點——基于神經網絡的機器翻譯(NMT:Neural Machine Translation)。

機器翻譯的技術路徑

感同身受的是,無論是普通用戶還是資深譯員,無論使用WEB還是APP,都明顯察覺到近些年來的翻譯質量有著迅猛的提升。

問題是:為何變化如此明顯?不妨從技術路徑上拆解來看。

直覺便知,當人類試圖讓機器翻譯語言時,自然要對文字進行解構,就像同心圓的關系,文章由段落構成,段落由句子構成,句子由短語和字構成,而遵循從易到難,機器翻譯的理論路徑也是從后向前:從最初的逐字翻譯到基于短語的翻譯——如今,依靠于神經網絡,基于句子的翻譯成為可能。

于是,按照翻譯單元的不同,大體而言,目前機器翻譯有兩種類型:其一是上文提及的統計翻譯模型(SMT),如你所知,互聯網的廣泛普及為統計翻譯提供了豐富的訓練養(yǎng)料,而千禧年左右興起的基于短語的SMT更是讓機器翻譯質量大為提高,也在很長一段時間占據機器翻譯的主流,但以短語作為翻譯單元的弊端即是,當面對整句層面的翻譯時顯得非常生硬。

另一種類型當然是基于神經網絡的機器翻譯(NMT),其翻譯路徑是所謂端到端(end-to-end),將源語句整體編碼為一個向量,再通過解碼器對其進行解碼,理論上僅需給定源語言句子,即可通過神經網絡輸出目標語言譯文。這里不妨舉個例子,若你在百度翻譯中輸入“蘿卜青菜各有所愛”,它可以輕松輸出“Every man has his hobbyhorse”的正確譯文,而非諸如“Turnip greens his taste”的荒誕結果。也正因如此,短短兩年,NMT就在多個公開測試集上超越了作為前輩的SMT系統。

而若要比較的話,整體而言,在數據訓練比較充分的時候,NMT無疑要優(yōu)于SMT;在短句或數據量相對較小之時,SMT在處理固定搭配和習慣表達上具有優(yōu)勢。所以兩種方式談不上殊途同歸,只是在不同場景中分類而用——要知道,用戶的翻譯場景頗為多變,這要求一個優(yōu)秀的翻譯系統要成為集大成者。如今百度的翻譯系統就包含SMT,NMT,甚至更傳統的EBMT(基于實例的機器翻譯)。

當然,倘若我們談論的是未來,幾乎可以肯定,神經網絡技術本身的向前奔進,會讓NMT日趨成為主流(事實上,在百度中英日韓等多個系統中,它已是主流)——在今年8月的國際計算語言學年會上(ACL),移動端離線NMT被列為未來重要研究方向,即是為機器翻譯的未來畫了一個幾乎確定性的腳注。

機器翻譯的跑馬圈地

自二十世紀三十年代初法國科學家阿爾楚尼提出用機器進行翻譯的想法至今,哪怕對人工智能的定義已幾經翻折,機器翻譯都被長期視為人工智能的“終極目標”之一。巨大的期許往往意味著目標艱難,但這仍然無法阻擋這塊大蛋糕對全球頂尖科技大佬的吸引力。

而作為翻譯技術發(fā)展的初級階段,如果在這個時候硬要拼個排名或者高下,其實并沒有太大意義,而科技界的競爭也無非就是微軟、百度、谷歌這三家而已,孰輕孰重一看便知。只不過,從“百度更懂中國”的大思路能夠看出,百度在中國乃至亞洲市場更具侵略性,和搜索之爭同理,雖然誰都打不死誰,但區(qū)域優(yōu)勢已成不爭事實。

12月21日,從百度機器翻譯技術開放日上百度技術委員會聯席主席、自然語言處理部技術負責人吳華博士的觀點可以看出,百度其實已經成為了翻譯技術領域的破繭者,他們早于谷歌一年就正式上線了基于神經網絡的翻譯系統,同時也打造了全球首個互聯網在線NMT系統以及手機端離線NMT系統。據悉,百度翻譯每天已有上億次訪問,支持28種語言的互譯,開方的API接口也有超過2萬家第三方接入。

而就在前幾天,微軟發(fā)布全球首個萬能翻譯器,微軟官方表示它也可以實現多達100人間實時翻譯交談,并支持9種語言的語音輸入。而谷歌全球化帶來的影響無疑的巨大的,在收購科技公司的同時也在大力發(fā)展區(qū)域化優(yōu)勢,如谷歌2014年收購的Word Lens也在積極開展機器翻譯的工作,這李彥宏所說的話是一樣的道理:用人工智能打破一切邊界。

其實,百度的現狀其實并不令人意外,考慮到中國經濟在全球化中的地位,在將更多人卷入全球化的社會協作網絡過程中,中國對翻譯行為的仰仗無疑更迫切。而更為現實的是:在全球數萬億網頁中,80%為非中文網頁;去年中國出境游人數超過1.2億,前20個旅游目的地國家和地區(qū)中共使用了12種語言,尤其是中英語——這個世界上使用人數最多和使用最廣泛的兩種語言之間的翻譯,在很多人眼中是純粹的剛需。

機器翻譯的未來

很簡單,翻譯技術最終是要服務大眾,否則就是鏡中月、水中花。

重要的是,技術也逐漸還原到更具體的實用場景,百度翻譯APP就通過結合OCR技術和語音技術,為用戶滿足各種碎片化的翻譯需求,舉幾個例子:當你在國外游覽時,只需將手機屏幕對準外文介紹,OCR翻譯即可呈現翻譯結果;面對天書一般的外文菜單,百度翻譯可以迅捷地將菜單翻譯結果顯示在手機上,從此不必再在點餐時聽天由命;在國外買買買時,它也能讓你快速讀懂說明書;另外,當遇到不認識的實物,實物翻譯可以用中英雙語告知其名,同時伴隨著準確的發(fā)音;而結合語音技術的會話翻譯,能幫助用戶與外國人無障礙交流——我甚至還看到過這樣的新聞:靖江市民警在語言不通的情況下,用百度翻譯成功救助4名俄羅斯籍船員……

技術的福祉正在惠及每一位擔心語言關的人,而另一端,一部分人對技術的憂慮也在所難免?!拔磥砣舾赡?,我們很容易想象語言障礙會完全被打破,現在做同聲翻譯的人可能將來就沒有工作了?!鄙蟼€月的烏鎮(zhèn)互聯網大會,李彥宏為人們勾勒了未來的場景。

機器雖然突破了固有翻譯原則的局限,但必須承認的是,機器翻譯和真正意義上的“語言學”還關系不大,距離文人向往的“信雅達”目標還很遙遠,這也意味著,機器翻譯任重道遠,人工翻譯可稍安勿躁。

究其原因,在基于端到端的翻譯手法中,神經網絡無法理解自己翻譯出的句子,無法對譯文給出一個合理解釋——這正是它與專業(yè)人工翻譯最本質的差別。譬如,遵循上文提及的從后向前(從易到難)的理論路徑,讓機器理解基于“段落”甚至“篇章”的翻譯自然再好不過,這要求機器在上下文理解和連貫性上飛躍一大步。

那么問題是:它會實現么?作為技術樂觀主義者,我個人答案當然是會,一切或許只是時間問題。

在昔日古老的歲月,人類誕生語言的原始目的,一方面是增進本族人的內部溝通,另一方面是制造與外族的天然隔閡。而若你相信技術的發(fā)展內嵌在全球化的偉大浪潮中,通過技術終結千萬年來人類語言互不相通的歷史就值得期許。畢竟,讓人們聽懂彼此,這是一個太過古老的夙愿。

相關新聞

  • 都說行業(yè)冷,憑什么這家VR公司10個月能融到3輪?

    都說行業(yè)冷,憑什么這家VR公司10個月能融到3輪?

    導語:也許VR對許多人來說還只是一個小眾的、新奇的概念,但在科技企業(yè)林立的深圳,這一產業(yè)發(fā)展的速度已經遠遠超過了人們的想象。 在各種琳瑯滿目的“深圳制造”的VR產品之中,在大大小小近100家VR企業(yè)里,有這么一家成立僅一年的初創(chuàng)公司,憑借過硬的技術基因連獲三輪融資,最新的產品更是在今年CES上一舉奪得最佳創(chuàng)新大獎。 它就是深圳看到科技,一家專注于360度全景VR相機的科技公司。近日VR陀螺通過與聯合創(chuàng)始人兼COO蔡樹煥先生的訪談,揭開了這個在行業(yè)內如此“低調”,在技術上卻十分“高調”的初創(chuàng)企業(yè)的…

    公司新聞 2016 年 12 月 22 日
  • 楊偉東:簡單而有力量 視頻行業(yè)的下一個十年

    楊偉東:簡單而有力量 視頻行業(yè)的下一個十年

    2016年12月21日,優(yōu)酷的十歲生日,當天,優(yōu)酷上線了全新品牌標識,從logo到slogan,從顏色到狀態(tài),從視覺到內涵——“優(yōu)酷想要有年輕心態(tài)的人看到, 這世界很酷。” 品牌煥新的溝通會上,回答問題的間隙,楊偉東順手擺正了臺前小桌上擺著的“YOUKU”字母小模型,在加入土豆之前,楊偉東做了9年的市場,很多時候,他會經意、不經意地表現出對品牌的某種苛刻。就像這次的品牌煥新,許多細節(jié)在優(yōu)酷內部已經PK了很多回合。 楊偉東喜歡簡單而有力量的少年心態(tài),恰好文化娛樂的消費主力就是年輕人,有年輕心態(tài)的人…

    公司新聞 2016 年 12 月 22 日
  • 阿里動真格?淘寶上你恐怕再也買不到30塊以下的數據線

    12月22日消息:近日,阿里巴巴要整頓平臺上3C產品的商家,他們制定了一些產品的標準,不合規(guī)的商戶可能要被清除。首先涉及的領域是數據線、電動車、行車記錄儀。 天貓抽檢行為規(guī)范細則新增“數據線”一類,不包含只帶充電功能而不帶數據傳輸功能的連接線。該規(guī)范將于2017年2月20日正式生效。業(yè)界人士稱,如果要做出一條符合現行標準的數據線,最低售價并不會超過30元。這也就意味著,無下限低價銷售的競爭在阿里巴巴的平臺上將逐漸減少。 據了解,天貓抽檢團隊或志愿者在線上店鋪直接購買商品后,將樣品寄送至具備檢驗檢…

    行業(yè)動態(tài) 2016 年 12 月 22 日
  • Facebook與17所頂尖大學簽訂合作協議 加快硬件項目開發(fā)

    Facebook與17所頂尖大學簽訂合作協議 加快硬件項目開發(fā)

    新浪科技訊 北京時間12月22日上午消息,Facebook Building 8研發(fā)部門負責人雷吉納·杜甘(Regina Dugan)剛剛與美國17所頂尖大學簽訂了《贊助學術研究協議》(以下簡稱“SARA”),希望以更快的節(jié)奏與學術機構就新項目展開合作。 在此之前,高等院校與私有公司合作時通常需要花費9至12個月時間才能達成意向,而SARA則可以消除漫長的談判和審批過程,在短短幾周甚至幾天內啟動合作項目。 當然,參與合作項目的大學將獲得Facebook提供的報酬。他們的研究成果也有望脫離理論層面…

    行業(yè)動態(tài) 2016 年 12 月 22 日
  • 千億茶飲市場的資本戰(zhàn)局:最終競爭對手是瑞幸?

    千億茶飲市場的資本戰(zhàn)局:最終競爭對手是瑞幸?

    潘攀一直預感中國會有一個類似星巴克的國際品牌,去年年中,他對媒體說,“這個品牌一定與星巴克不一樣。這會是一個結合中國文化的產物,茶是一個很好的載體?!迸伺适翘靾D投資的管理合伙人,從投資八馬茶業(yè)開始,便一直關注著茶飲市場的更迭。 這種預感并非空穴來風。一年2.1億外賣訂單,銷量遠遠高于咖啡,爆紅茶飲店的生意甚至一杯難求。這是一個遠比咖啡更大的市場,并且能夠無線拓展下沉空間,根據中商產業(yè)研究院的估算數據,現制新中式茶飲的市場規(guī)模接近一千億元。 資本也在涌入這一市場。CV Sourse披露數據顯示,自…

    行業(yè)動態(tài) 2019 年 5 月 28 日
  • 湖南醫(yī)聊等13家自媒體獲2016年度影響力自媒體獎

    12月21日,“城市力量”2016騰訊區(qū)域影響力峰會在北京盛大啟幕。一大批優(yōu)秀的自媒體脫穎而出,影響力逐漸擴大。那么,2016年度最具影響力自媒體都有哪些? 華中科技大學新聞與信息傳播學院鐘瑛教授,騰訊區(qū)域內容總監(jiān)、大湘網總裁鄧科頒發(fā)13項影響力自媒體獎,獲獎名單: 獲獎人:湖南醫(yī)聊(大湘網推薦) 獲獎理由:“湖南醫(yī)聊” 注冊于2016年3月,專注醫(yī)療健康科普資訊 。截止目前,在企鵝媒體平臺共發(fā)稿924篇,累積閱讀量400萬+,多篇稿件被天天快報、騰訊新聞客戶端PUSH,也被騰訊迷你首頁重要位置…

    行業(yè)動態(tài) 2016 年 12 月 22 日
  • iPod touch又回來了,但活下去的理由不是情懷

    iPod touch又回來了,但活下去的理由不是情懷

    時隔近四年,美國時間5月28日,蘋果公司悄悄在官網上線了新一代iPod touch。 iPod曾是蘋果非常重要的一個產品線,但隨著iPod最主要的功能(播放音樂)被智能手機分流,它漸漸淪為蘋果相對次要的產品線。 時至今日,蘋果官網還在售的iPod系列也僅剩iPod touch了。 四年后iPod touch終于更新 iPod首個產品是iPod classic,于2001年10月發(fā)布,iPod系列曾推出iPod mini、iPod nano、iPod shuffle、iPod touch等多款經典…

    行業(yè)動態(tài) 2019 年 5 月 29 日
  • 關店、退燒的陣痛期后,新風口再為新零售續(xù)命?

    關店、退燒的陣痛期后,新風口再為新零售續(xù)命?

    自“新零售”概念被電商巨頭提出,大到巨頭,小到中小型企業(yè),無論是互聯網企業(yè)還是傳統商超,均想在新市場中站穩(wěn)腳跟并分得一杯羹。在多方混戰(zhàn)的格局下,新零售市場逐漸出現了較為清晰的路線,也形成了多種可行的模式,為后面新入局的玩家提供了思路。 然而盡管說線上線下相結合的新零售模式在市場已經普及開來,但新零售市場目前仍處于行業(yè)初期的摸索階段,也因此,不少嘗鮮的新零售企業(yè)們在入門階段交了不少學費。 隨著生鮮新零售新風口的堆起,幾乎所有站上賽道的玩家均希望在最短的時間里,通過快速擴張搶占市場先機。其中發(fā)力最猛…

    行業(yè)動態(tài) 2019 年 5 月 29 日
  • 陳冷西:規(guī)范網絡傳播勢在必行

    國家新聞出版廣電總局日前發(fā)布《關于加強微博、微信等網絡社交平臺傳播視聽節(jié)目管理的通知》要求,利用微博、微信等各類社交應用開展互聯網視聽節(jié)目服務的網絡平臺,應當取得《信息網絡傳播視聽節(jié)目許可證》等法律法規(guī)規(guī)定的相關資質;微博、微信等網絡社交平臺不得轉發(fā)網民上傳的自制時政類視聽新聞節(jié)目。 此前,文化部印發(fā)了《網絡表演經營活動管理辦法》,直接對準網絡直播平臺,規(guī)定直播平臺須有許可證,主播要實名。兩部門相繼出臺規(guī)定,對網絡視聽類節(jié)目和直播平臺加強管理、明確監(jiān)管辦法,直指網絡動態(tài)傳播的混亂局面。 伴隨網絡…

    行業(yè)動態(tài) 2016 年 12 月 22 日
  • Facebook 全球貨幣戰(zhàn)略:從企業(yè)進化成“超級國家”

    Facebook 全球貨幣戰(zhàn)略:從企業(yè)進化成“超級國家”

    民族國家是人類有史以來最強大的社會結構。數以百萬計的人因為這樣或那樣的原因聯系在一起,起草管理社會網絡的法律。組織這一網絡的原因可以任意,如信仰不可剝奪的權利,或共同的語言、地理、經濟等。因此,官僚和獨裁者,無論是否由選舉產生,都會起草法律來影響通訊,管理社會組織,建設基礎設施,并為他們的社會做出經濟決策。如此一來,少數人的決定會影響許多人的生活——無論是好是壞。 Facebook監(jiān)管著一個平臺,這個平臺就影響著通訊、管理著社會組織、建設著基礎設施,并為有史以來規(guī)模最大的社會網絡做出經濟決策。雖…

    公司新聞 2019 年 5 月 29 日
分享本頁
返回頂部