入駐騰訊AI加速器,「譯馬網(wǎng)」想要機(jī)器翻譯逐漸替代人工
據(jù)中CSA2015年年調(diào)查顯示,全球語(yǔ)言服務(wù)的市場(chǎng)規(guī)模接近380億美元,同比增長(zhǎng)6.4%,其中在中國(guó)從事翻譯服務(wù)的注冊(cè)機(jī)構(gòu)達(dá)7萬(wàn)多家,從事翻譯的職業(yè)人士在200萬(wàn)人左右。
過(guò)去,2B翻譯是一個(gè)典型的勞動(dòng)力密集型產(chǎn)業(yè),一方面過(guò)渡依賴(lài)人力,無(wú)法規(guī)模化生產(chǎn);與此同時(shí),生產(chǎn)鏈條過(guò)長(zhǎng)導(dǎo)致溝通成本過(guò)高,再加上翻譯價(jià)格的持續(xù)下降,翻譯行業(yè)的摩擦成本越來(lái)越高。
36氪近期接觸到的譯馬網(wǎng)成立于2015年,其前身是一家成立于2006年的翻譯公司。成立初期,譯馬網(wǎng)的定位是一家提供翻譯項(xiàng)目管理的服務(wù)平臺(tái),致力于優(yōu)化2B翻譯行業(yè)的流程管理。提供協(xié)同翻譯、譯審?fù)脚c自動(dòng)查錯(cuò)等功能模塊。
創(chuàng)始人兼CEO張馬成告訴36氪,以協(xié)同功能為例,過(guò)去當(dāng)翻譯公司接到用戶(hù)需求后,會(huì)先交由項(xiàng)目經(jīng)理審稿,項(xiàng)目經(jīng)理依靠主觀經(jīng)驗(yàn)判斷這篇稿件所屬的專(zhuān)業(yè)領(lǐng)域與難易程度,根據(jù)這些信息項(xiàng)目經(jīng)理需要去匹配符合的翻譯員,這個(gè)過(guò)程還需要與翻譯員溝通確定是否接單;溝通完翻譯員之后,項(xiàng)目經(jīng)理要再對(duì)接審校人員、排版人員等多達(dá)5~8個(gè)不同環(huán)節(jié)的工作人員。所有環(huán)節(jié)都是雙向溝通,這也進(jìn)一步限制了單個(gè)項(xiàng)目經(jīng)理服務(wù)客戶(hù)的上限。
譯馬網(wǎng)的價(jià)值相當(dāng)于幫助項(xiàng)目經(jīng)理提升單位時(shí)間的產(chǎn)能,比如平臺(tái)會(huì)給每位翻譯員貼上標(biāo)簽、梳理其擅長(zhǎng)的領(lǐng)域以及翻譯的水準(zhǔn),以便項(xiàng)目經(jīng)理快速搜索到合適的譯員。當(dāng)文稿量巨大,涉及多個(gè)譯員一齊翻譯一篇文章時(shí),為了解決不同譯員的用詞和翻譯習(xí)慣的異同,平臺(tái)會(huì)提供特定場(chǎng)景下的術(shù)語(yǔ)庫(kù),比如當(dāng)A翻譯員將Computer翻譯為計(jì)算機(jī),那么B/C/D譯員翻譯Computer時(shí),系統(tǒng)會(huì)自動(dòng)顯示為計(jì)算機(jī),而不是電腦等其他用詞。與此同時(shí),審校人也會(huì)同步譯員做審稿,機(jī)器也會(huì)在翻譯過(guò)程中自動(dòng)查錯(cuò)糾錯(cuò)。
但是就算采用平臺(tái)的方式提高了效率,只要是人工翻譯,都會(huì)有犯錯(cuò)的時(shí)候。張馬成表示,團(tuán)隊(duì)今年開(kāi)始引入AI去提升工作效率與翻譯的精準(zhǔn)度,目前主要有以下兩個(gè)應(yīng)用方向:其一是代替項(xiàng)目經(jīng)理去判斷文本的領(lǐng)域,由機(jī)器快速識(shí)別文本并自動(dòng)分配給相關(guān)領(lǐng)域的譯員;另一個(gè)方向則是提供垂直細(xì)分的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯,構(gòu)建人機(jī)交互的編輯平臺(tái)。
目前這種以機(jī)器翻譯為主,人工翻譯為輔的模式支持國(guó)際工程、機(jī)械制造與生物制藥這三個(gè)領(lǐng)域,這也是譯馬網(wǎng)在過(guò)去很長(zhǎng)時(shí)間積累了這3個(gè)領(lǐng)域大量的數(shù)據(jù),并一直在這三個(gè)領(lǐng)域構(gòu)建知識(shí)圖譜。按照張馬成的說(shuō)法,機(jī)器人維修,機(jī)器翻譯為主的翻譯模式,庫(kù)卡機(jī)器人驅(qū)動(dòng)器維修,將單個(gè)翻譯人員4000字的日平均工作量提升到10000字,在這個(gè)場(chǎng)景下,翻譯人員要做的事主要以調(diào)整句子結(jié)構(gòu)及潤(rùn)色。
關(guān)于機(jī)器翻譯目前存的局限性一直是學(xué)界以及商界應(yīng)用的一大難題,其對(duì)語(yǔ)料規(guī)模的依賴(lài)度不高,但對(duì)語(yǔ)料質(zhì)量的依賴(lài)度非常強(qiáng)。針對(duì)這類(lèi)情況,譯馬網(wǎng)的做法是將行業(yè)類(lèi)別進(jìn)一步細(xì)分,把領(lǐng)域做到足夠窄,持續(xù)對(duì)語(yǔ)料清洗,篩選出高質(zhì)量的語(yǔ)料。而在算法層面上,依托于自身機(jī)器翻譯研發(fā)人員不斷地進(jìn)行優(yōu)化外,譯馬網(wǎng)也對(duì)外開(kāi)展積極的合作,例如加入騰訊AILab,與其N(xiāo)LP團(tuán)隊(duì)開(kāi)展合作,算法模型也在進(jìn)一步優(yōu)化。
由于譯馬網(wǎng)是一個(gè)2B翻譯的項(xiàng)目管理平臺(tái),所以其主要商業(yè)模式是以SaaS的方式以年為單位收取服務(wù)費(fèi),每個(gè)賬號(hào)為1000元人民幣。不同類(lèi)型的企業(yè)可根據(jù)自身情況購(gòu)買(mǎi)相應(yīng)的賬號(hào)數(shù),每個(gè)賬戶(hù)只限一人使用,無(wú)論他是翻譯人員還是項(xiàng)目管理人員。除了SaaS的商業(yè)模式以外,譯馬網(wǎng)也會(huì)為大型客戶(hù)、政府部門(mén)提供私有化部署及定制化服務(wù)。
譯馬網(wǎng)2017年的銷(xiāo)售額較2016年相比實(shí)現(xiàn)了翻番,今年10月份后,成功實(shí)現(xiàn)正向現(xiàn)金流。譯馬網(wǎng)目前全職員工50人余人,有過(guò)3次融資經(jīng)歷,種子輪為賽創(chuàng)合伙,天使輪為德商資本,www.twshmhelmet.com,Pre-A輪為上海界石資本。
譯馬網(wǎng)目前正在尋求新一輪A輪融資,資金需求1500萬(wàn)人民幣,主要用于引進(jìn)高端AI人才并尋求外部合作。