久久精品一区二区三区四区_国产91久久久久久久免费_99免费在线视频_亚洲免费成人网

AI 翻譯的 30 部女頻總裁文長(zhǎng)什么樣

人工智能
2019
12/31
00:09
雷鋒網(wǎng)
分享
評(píng)論

來(lái)源:雷鋒網(wǎng)  作者:李勤

萬(wàn)萬(wàn)沒(méi)想到,雷鋒網(wǎng)編輯花一塊錢試用一個(gè)經(jīng)由 xx 部批準(zhǔn)的合法 " 國(guó)際瀏覽器 " 的目的竟然是看海外版霸道總裁文。

說(shuō)起來(lái)真的有點(diǎn) " 羞恥 ",畢竟我已經(jīng)不是愛(ài)幻想的 18 歲少女,而是飽經(jīng)生活折騰的社畜。

事情是這樣的,前幾天,閱文集團(tuán)與國(guó)內(nèi)人工智能公司彩云科技合作的 30 部 AI 翻譯網(wǎng)文作品上線了閱文旗下海外門戶起點(diǎn)國(guó)際(Webnovel)。

AI 也來(lái)插手網(wǎng)文翻譯,看來(lái),繼 AI PK 速記員,AI 換臉 " 威脅 " 演員之后,在我們的精神文化生活中,AI 又觸達(dá)了一個(gè)領(lǐng)域。

這 30 部依靠 AI 走向國(guó)際化的網(wǎng)文就是我前面提到的霸道總裁文,還是女頻向的。

emmm,放眼望去,《豪門謀妻》《豪門千金重生之賺大錢》《喬先生撩妻上癮》。。。部部散發(fā)著無(wú)法抵擋的總裁魅力。

試水 

雖然霸總網(wǎng)文看上去不是什么陽(yáng)春白雪,但它的譯文卻是 " 精品 "。

如果翻譯質(zhì)量以滿分 100 分為計(jì),AI 翻譯的這些作品可以達(dá)到 80~ 85 分,相當(dāng)于專業(yè)翻譯的級(jí)別。

彩云科技的運(yùn)營(yíng)負(fù)責(zé)人張可馨稱,合作推出的這 30 本 AI 翻譯的網(wǎng)文屬于現(xiàn)代言情品類,是現(xiàn)在比較受歡迎以及好翻譯的品種,非常適合拿來(lái)作為 AI 翻譯網(wǎng)文出海的第一步測(cè)試。

在這次合作中,閱文提供語(yǔ)料、修改詞表、用戶的反饋,彩云進(jìn)行語(yǔ)料訓(xùn)練,詞表提取和模型部署,安排得妥妥當(dāng)當(dāng)。

起點(diǎn)國(guó)際與 " 彩云小譯 " 合作的 AI 翻譯模型針對(duì)普通難度的文本, 翻譯速度能夠達(dá)到人工的千倍,同時(shí),在翻譯質(zhì)量把控上,閱文集團(tuán)的編輯和智能技術(shù)團(tuán)隊(duì)聯(lián)合彩云小譯的算法工程師對(duì) AI 模型進(jìn)行集中性的 " 專項(xiàng)訓(xùn)練 ",既往優(yōu)秀的譯本、經(jīng)典網(wǎng)文原作、標(biāo)準(zhǔn)核心詞庫(kù)都是 AI 學(xué)習(xí)的語(yǔ)料。

此外,網(wǎng)傳 " 雙方在訓(xùn)練 AI 模型時(shí)還加入了‘翻譯風(fēng)格’的選項(xiàng),方便精準(zhǔn)進(jìn)行男頻、女頻,甚至不同品類作品風(fēng)格的呈現(xiàn)。面對(duì)不同的風(fēng)格要求,AI 能夠?qū)⑼痪湓捰枚喾N不同的譯法進(jìn)行差異化呈現(xiàn)。

這是個(gè)讓人眼前一亮的功能,雷鋒網(wǎng) ( 公眾號(hào):雷鋒網(wǎng) ) 了解到,目前這個(gè)功能尚未正式上線,是一個(gè) " 正在調(diào)教中的模塊 "。

技術(shù)難點(diǎn) 

剩下的 " 分 " 缺在哪里?

正如人類譯者的翻譯能力受自身知識(shí)面的限制一樣,AI 模型能達(dá)到的能力范圍也受到語(yǔ)料范圍的限制。語(yǔ)料中少見(jiàn)但比較淺白的表述,AI 可以根據(jù)自己學(xué)到的語(yǔ)料 " 猜 " 出正確的翻譯,但遇到比較迂回的表述,如一個(gè)語(yǔ)料中從未出現(xiàn)過(guò)的成語(yǔ),AI 猜錯(cuò)的可能性就會(huì)變大。

彩云科技算法工程師毛詩(shī)倩提到,例如:" 燃燈如豆 ", 指的是燈的火焰很小,而不是火焰像豆子。如果語(yǔ)料中沒(méi)有出現(xiàn)過(guò)這個(gè)詞語(yǔ),那么 AI 就只能翻譯出字面意思。

公開(kāi)資料稱,閱文團(tuán)隊(duì)基于自然語(yǔ)言理解技術(shù)進(jìn)行網(wǎng)文內(nèi)容深入挖掘,通過(guò)對(duì)大量網(wǎng)文內(nèi)容和優(yōu)質(zhì)社區(qū)內(nèi)容的清洗、訓(xùn)練和標(biāo)注,使得機(jī)器更好地理解網(wǎng)文內(nèi)容,建立閱文自己的內(nèi)容大腦。

基于閱文內(nèi)容大腦,閱文智能可以提取網(wǎng)文的一些專有名詞,同時(shí)可以自動(dòng)識(shí)別角色(人名)、場(chǎng)景(地名)、升級(jí)體系等結(jié)構(gòu)化信息,構(gòu)建整體網(wǎng)文的知識(shí)圖譜。基于這些信息的補(bǔ)充,目前 AI 翻譯能夠較好地翻譯網(wǎng)文特殊領(lǐng)域中的詞、句、段落,包括作品中的人名、地名以及類似 " 金丹 " 這種網(wǎng)文作品特色核心元素詞等專有名詞,并識(shí)別出各種代詞指代的對(duì)象,盡可能避免傳統(tǒng)機(jī)翻中的 " 一詞多譯 "、" 張冠李戴 " 等現(xiàn)象。

看來(lái),閱文在試圖給合作伙伴的 AI 模型 " 喂 " 更足的語(yǔ)料。

在構(gòu)建這個(gè) AI 模型的過(guò)程中,毛詩(shī)倩遇到了三個(gè)難點(diǎn):

第一,正確補(bǔ)全句子結(jié)構(gòu)。

文學(xué)作品中有些句子結(jié)構(gòu)復(fù)雜或缺省成分,AI 需要自己找到正確出主賓的關(guān)系。

" 還是早點(diǎn)回家吧 "

AI 看到這句話,可能會(huì)有點(diǎn)懵逼,必須使勁找尋主語(yǔ)是 I 還是 You。

第二,人名指代統(tǒng)一。

一個(gè)人物可能會(huì)有多種稱呼。比如一個(gè)角色可能大名叫 " 七月,同時(shí)還有 " 小七 "、" 月月 " 等好幾個(gè)昵稱,AI 需要知道這些稱謂都是指向同一個(gè)人,否則翻譯出三個(gè)在英文中看起來(lái)沒(méi)什么關(guān)聯(lián)的名字,AI 沒(méi)有懵逼,但讀者會(huì)瞬間懵逼。

(講真,像我們這種神經(jīng)大條的讀者,可能肉身看文遇到這種情況也會(huì) " 臉盲 "。)

AI 還要知道角色的性別,以便正確使用人稱代詞。

舉個(gè) " 霸總文 " 的例子:

冷半夏整個(gè)人依靠在顧瑾白的懷里,蒼白的臉上帶著放大的笑意,看向冷可欣,口型比劃:你完了!

Leng Banxia leaned against Gu Jinbai's embrace. Her pale face carried a magnified smile as shelooked at Leng Kexin. She mouthed, "you're done for!"

上面加粗的部分就是在 AI 知道冷半夏是女性的基礎(chǔ)上才能正確翻譯的結(jié)果。

第三,文風(fēng)統(tǒng)一。

上一句是言情小說(shuō)文風(fēng),下一句變成科幻小說(shuō)文風(fēng),讀者就會(huì)分分鐘出戲。AI 需要保證一部作品翻譯風(fēng)格統(tǒng)一,并且符合這個(gè)作品本身的品類。

AI 翻譯還有進(jìn)步的空間。

毛詩(shī)倩稱,在 transformer 模型的基礎(chǔ)上,目前可以引入對(duì)抗訓(xùn)練、模型蒸餾等改進(jìn)技術(shù),以及利用非對(duì)齊語(yǔ)料預(yù)訓(xùn)練改進(jìn)翻譯質(zhì)量的工作,如 BERT、MASS 等,但目前的所有翻譯模型本質(zhì)上都是基于大數(shù)據(jù)的擬合,機(jī)器還沒(méi)辦法像人類一樣真正理解文本。

AI 的強(qiáng)大助力 

盡管 AI 翻譯暫時(shí)無(wú)法像人類一樣 " 機(jī)智 ",但對(duì)于網(wǎng)文出海這個(gè)領(lǐng)域而言,已經(jīng)產(chǎn)生了非常大的推動(dòng)力。

艾瑞咨詢發(fā)布的《2019 年中國(guó)網(wǎng)絡(luò)文學(xué)出海研究報(bào)告》稱,海外網(wǎng)文讀者對(duì)網(wǎng)文翻譯質(zhì)量比較滿意,但更新速度還需提升。

在這個(gè)背景下,能達(dá)到 85 分的 AI 翻譯不得不說(shuō)是一個(gè)滿足需求的好辦法。

看到這種需求后,國(guó)內(nèi)內(nèi)容平臺(tái)閱文、掌閱都加緊對(duì)網(wǎng)文出海的布局。在閱文和彩云科技共同推出 AI 翻譯的 30 部試水網(wǎng)文作品之前,成立于 2017 年 11 月的公司推文科技在 9 個(gè)月的數(shù)據(jù)積累后,于 2018 年 7 月推出了網(wǎng)絡(luò)文學(xué)人工智能翻譯系統(tǒng)。

推文科技今年 3 月已完成由 Wifi 萬(wàn)能鑰匙、連尚文學(xué)、聯(lián)想之星參與的 1000 萬(wàn) Pre-A 輪融資,同樣依靠具備內(nèi)容資源的平臺(tái)朝網(wǎng)文出海進(jìn)軍。

按照推文科技接受小飯桌的采訪中所言,1000 字的翻譯,人工需要 1 小時(shí),AI 單芯片只需要 1 秒。成本也降低到原來(lái)的 1%, 100 萬(wàn)字的專業(yè)譯者翻譯需要 20 萬(wàn)元,AI 只需要不到 1000 元。

毛詩(shī)倩對(duì)雷鋒網(wǎng)肯定了這種說(shuō)法,他稱:" 只要錢足夠多,買更多的顯卡部署翻譯模型,速度可以無(wú)限大,即使是一張顯卡,它翻譯速度也是人類的千倍。"

雷鋒網(wǎng)發(fā)現(xiàn),在 AI 翻譯網(wǎng)文出海上,推文科技和彩云科技目前只進(jìn)行中譯英,但這只是語(yǔ)料多少的問(wèn)題,張可馨說(shuō),要做到 85 分的準(zhǔn)確率,需要大量語(yǔ)料,很多小語(yǔ)種的語(yǔ)料比較難收集。

在語(yǔ)料充足(幾千萬(wàn)句)的情況下,基本上幾個(gè)月之內(nèi)就可以訓(xùn)練出一個(gè) AI 翻譯的特定語(yǔ)種類型。

不過(guò),有意思的是,這位對(duì) AI 翻譯網(wǎng)文模型無(wú)比熟練的毛詩(shī)倩是一個(gè)海歸男性算法工程師,他并沒(méi)有月讀 300 本網(wǎng)文。

海外卻有無(wú)數(shù)人在等待他的 AI 小伙伴翻譯網(wǎng)文。

THE END
廣告、內(nèi)容合作請(qǐng)點(diǎn)擊這里 尋求合作
ai
免責(zé)聲明:本文系轉(zhuǎn)載,版權(quán)歸原作者所有;旨在傳遞信息,不代表砍柴網(wǎng)的觀點(diǎn)和立場(chǎng)。

相關(guān)熱點(diǎn)

據(jù)外媒Venture Beat報(bào)道,F(xiàn)acebook人工智能研究院(Facebook AI Research,F(xiàn)AIR)稱,他們推出了一個(gè)與紙牌游戲Hanabi相關(guān)的最新AI項(xiàng)目。
業(yè)界
12月1日消息 當(dāng)?shù)貢r(shí)間11月28日,印尼總統(tǒng)佐科·維多多下令政府機(jī)構(gòu)在2020年取消兩個(gè)公務(wù)員層級(jí),用人工智能取代,以減少阻礙投資的繁瑣程序。
業(yè)界
在北京舉行的2019戴爾科技峰會(huì)展示了多項(xiàng)科技成果,包括其部署5G、AI時(shí)代的產(chǎn)品及解決方案。
業(yè)界
一年一度的世界互聯(lián)網(wǎng)大會(huì)進(jìn)入第二天,少了些大佬,多了些論道。
業(yè)界
總部位于德國(guó)的電子零售巨頭Zalando由商學(xué)院畢業(yè)生羅伯特·根茨(Robert Gentz)和大衛(wèi)·施耐德(David Schneider)于2008年共同創(chuàng)立,它既是一家零售商,也是一家科技公司。
業(yè)界

相關(guān)推薦

1
3
久久精品一区二区三区四区_国产91久久久久久久免费_99免费在线视频_亚洲免费成人网

    9000px;">

      日韩视频一区二区在线观看| 亚洲国产精品嫩草影院| 在线观看区一区二| 成人黄页在线观看| 国产精品亚洲一区二区三区在线 | 久久狠狠亚洲综合| 秋霞成人午夜伦在线观看| 日韩国产欧美在线播放| 亚洲成在人线在线播放| 亚洲一区二区三区爽爽爽爽爽| 亚洲另类在线制服丝袜| 自拍偷拍亚洲欧美日韩| 亚洲精品少妇30p| 一级中文字幕一区二区| 亚洲一区二区三区四区的| 午夜精品免费在线| 奇米影视在线99精品| 日产国产高清一区二区三区| 蜜桃精品视频在线| 国产美女久久久久| 99久久免费精品| 欧美性欧美巨大黑白大战| 91精品国产一区二区| 久久色在线观看| 国产精品久久久久久久久图文区 | 麻豆精品在线播放| 国产精品性做久久久久久| 风间由美性色一区二区三区| 色成年激情久久综合| 91精品久久久久久久91蜜桃| 久久精品网站免费观看| 最新欧美精品一区二区三区| 午夜久久久久久久久久一区二区| 久久精品国产网站| 95精品视频在线| 欧美一区二区三区公司| 国产精品女人毛片| 日韩制服丝袜先锋影音| 国产大陆a不卡| 欧美裸体bbwbbwbbw| 国产亚洲综合av| 亚洲成人一区在线| 国产精品影音先锋| 色婷婷综合久色| 国产日韩欧美电影| 肉丝袜脚交视频一区二区| 成人免费视频app| 欧美一区二区视频免费观看| 国产精品理论片| 久久99国产精品久久99 | 国产很黄免费观看久久| 欧美日韩一区不卡| 国产精品国产a级| 久热成人在线视频| 欧美性欧美巨大黑白大战| 国产精品天美传媒| 久久国产剧场电影| 欧美日韩国产精品成人| 国产精品成人一区二区艾草 | 色欧美片视频在线观看在线视频| 国产日韩欧美一区二区三区综合| 人人精品人人爱| 欧美日韩综合在线| 一区二区视频免费在线观看| 成人av网站免费观看| 国产欧美一区二区精品仙草咪| 日日欢夜夜爽一区| 欧美日韩精品二区第二页| 亚洲黄色免费电影| 91欧美激情一区二区三区成人| 日本一区二区成人| 成人免费毛片高清视频| 欧美激情在线一区二区三区| 国产精品一品视频| 国产女人水真多18毛片18精品视频 | 国产精品白丝jk黑袜喷水| 精品黑人一区二区三区久久| 日韩成人精品在线观看| 91精品国产麻豆国产自产在线 | 青青草一区二区三区| 日韩精品一区二区三区蜜臀| 肉肉av福利一精品导航| 日韩一区二区精品在线观看| 偷拍自拍另类欧美| 在线播放亚洲一区| 免费成人在线视频观看| 欧美一区二区三区视频在线| 美女视频黄 久久| 久久免费精品国产久精品久久久久| 久久99精品久久久久久| 国产网站一区二区| 99精品热视频| 亚洲国产精品自拍| 精品免费99久久| 成人黄色软件下载| 伊人一区二区三区| 欧美电影免费观看高清完整版在线观看 | 免费观看一级欧美片| 国产夜色精品一区二区av| jiyouzz国产精品久久| 一区二区三区在线视频播放| 欧美肥大bbwbbw高潮| 国产一区二区精品久久| 中文字幕在线观看不卡| 欧美日韩美少妇| 国产综合色视频| 亚洲男人的天堂网| 日韩欧美激情在线| 91在线观看免费视频| 日本美女一区二区三区| 久久精品一二三| 欧美日韩一级大片网址| 国产一区二区看久久| 自拍偷拍国产精品| 精品福利一二区| 欧美日韩三级一区| av不卡免费电影| 蜜桃视频在线一区| 亚洲特黄一级片| 欧美不卡在线视频| 欧美日精品一区视频| 国产a精品视频| 蜜桃视频一区二区三区在线观看| 国产精品国产三级国产aⅴ原创| 欧美一区二区视频在线观看2022| 成+人+亚洲+综合天堂| 蜜臀av性久久久久蜜臀av麻豆| 亚洲欧美怡红院| 久久一区二区三区四区| 在线不卡中文字幕播放| 91免费小视频| 高清成人免费视频| 久草在线在线精品观看| 三级成人在线视频| 亚洲v精品v日韩v欧美v专区| 国产精品色噜噜| 久久久久久久电影| 日韩美女视频在线| 91麻豆精品国产| 欧美日韩一区二区三区四区| 色94色欧美sute亚洲线路二 | 国产一区二区三区av电影| 五月天亚洲婷婷| 夜夜夜精品看看| 一区二区在线电影| 国产精品久99| 中文字幕乱码亚洲精品一区| 久久久五月婷婷| 久久一夜天堂av一区二区三区 | 粉嫩高潮美女一区二区三区| 激情综合色综合久久综合| 日本不卡123| 蜜桃视频第一区免费观看| 日本午夜一本久久久综合| 日韩影院免费视频| 蜜臀av一级做a爰片久久| 婷婷久久综合九色综合绿巨人| 亚洲超碰精品一区二区| 午夜精品久久久久影视| 日本欧美肥老太交大片| 激情小说欧美图片| 国产美女娇喘av呻吟久久| 懂色av一区二区在线播放| 99精品在线免费| 色丁香久综合在线久综合在线观看| 欧美探花视频资源| 日韩午夜精品视频| 精品国产成人系列| 久久精品在线观看| 一区二区三区自拍| 麻豆一区二区99久久久久| 国产精品资源在线| 一本到一区二区三区| 日韩欧美一级二级三级| 国产片一区二区| 亚洲国产成人av好男人在线观看| 日韩av不卡在线观看| 福利91精品一区二区三区| 精品视频在线免费| 精品国产不卡一区二区三区| 中文字幕中文字幕在线一区 | 91同城在线观看| 欧美日韩视频在线一区二区| 精品久久一区二区三区| 中文字幕亚洲欧美在线不卡| 天天av天天翘天天综合网 | 色综合久久久久综合体桃花网| 欧美老人xxxx18| 国产精品国产三级国产aⅴ原创| 亚洲国产日韩一级| 国产精品一级在线| 欧美午夜寂寞影院| 精品国产一区二区三区四区四| 欧美国产乱子伦 | 亚洲自拍另类综合| 国产91精品一区二区麻豆网站 | 国产精品123| 7777精品伊人久久久大香线蕉最新版| 久久天天做天天爱综合色| 亚洲精品成人精品456|