入駐騰訊AI加速器,「譯馬網」想要機器翻譯逐漸替代人工
據中CSA2015年年調查顯示,全球語言服務的市場規模接近380億美元,同比增長6.4%,其中在中國從事翻譯服務的注冊機構達7萬多家,從事翻譯的職業人士在200萬人左右。
過去,2B翻譯是一個典型的勞動力密集型產業,一方面過渡依賴人力,無法規模化生產;與此同時,生產鏈條過長導致溝通成本過高,再加上翻譯價格的持續下降,翻譯行業的摩擦成本越來越高。
36氪近期接觸到的譯馬網成立于2015年,其前身是一家成立于2006年的翻譯公司。成立初期,譯馬網的定位是一家提供翻譯項目管理的服務平臺,致力于優化2B翻譯行業的流程管理。提供協同翻譯、譯審同步與自動查錯等功能模塊。
創始人兼CEO張馬成告訴36氪,以協同功能為例,過去當翻譯公司接到用戶需求后,會先交由項目經理審稿,項目經理依靠主觀經驗判斷這篇稿件所屬的專業領域與難易程度,根據這些信息項目經理需要去匹配符合的翻譯員,這個過程還需要與翻譯員溝通確定是否接單;溝通完翻譯員之后,項目經理要再對接審校人員、排版人員等多達5~8個不同環節的工作人員。所有環節都是雙向溝通,這也進一步限制了單個項目經理服務客戶的上限。
譯馬網的價值相當于幫助項目經理提升單位時間的產能,比如平臺會給每位翻譯員貼上標簽、梳理其擅長的領域以及翻譯的水準,以便項目經理快速搜索到合適的譯員。當文稿量巨大,涉及多個譯員一齊翻譯一篇文章時,為了解決不同譯員的用詞和翻譯習慣的異同,平臺會提供特定場景下的術語庫,比如當A翻譯員將Computer翻譯為計算機,那么B/C/D譯員翻譯Computer時,系統會自動顯示為計算機,而不是電腦等其他用詞。與此同時,審校人也會同步譯員做審稿,機器也會在翻譯過程中自動查錯糾錯。
但是就算采用平臺的方式提高了效率,只要是人工翻譯,都會有犯錯的時候。張馬成表示,團隊今年開始引入AI去提升工作效率與翻譯的精準度,目前主要有以下兩個應用方向:其一是代替項目經理去判斷文本的領域,由機器快速識別文本并自動分配給相關領域的譯員;另一個方向則是提供垂直細分的神經網絡機器翻譯,構建人機交互的編輯平臺。
目前這種以機器翻譯為主,人工翻譯為輔的模式支持國際工程、機械制造與生物制藥這三個領域,這也是譯馬網在過去很長時間積累了這3個領域大量的數據,并一直在這三個領域構建知識圖譜。按照張馬成的說法,機器人維修,機器翻譯為主的翻譯模式,庫卡機器人驅動器維修,將單個翻譯人員4000字的日平均工作量提升到10000字,在這個場景下,翻譯人員要做的事主要以調整句子結構及潤色。
關于機器翻譯目前存的局限性一直是學界以及商界應用的一大難題,其對語料規模的依賴度不高,但對語料質量的依賴度非常強。針對這類情況,譯馬網的做法是將行業類別進一步細分,把領域做到足夠窄,持續對語料清洗,篩選出高質量的語料。而在算法層面上,依托于自身機器翻譯研發人員不斷地進行優化外,譯馬網也對外開展積極的合作,例如加入騰訊AILab,與其NLP團隊開展合作,算法模型也在進一步優化。
由于譯馬網是一個2B翻譯的項目管理平臺,所以其主要商業模式是以SaaS的方式以年為單位收取服務費,每個賬號為1000元人民幣。不同類型的企業可根據自身情況購買相應的賬號數,每個賬戶只限一人使用,無論他是翻譯人員還是項目管理人員。除了SaaS的商業模式以外,譯馬網也會為大型客戶、政府部門提供私有化部署及定制化服務。
譯馬網2017年的銷售額較2016年相比實現了翻番,今年10月份后,成功實現正向現金流。譯馬網目前全職員工50人余人,有過3次融資經歷,種子輪為賽創合伙,天使輪為德商資本,www.twshmhelmet.com,Pre-A輪為上海界石資本。
譯馬網目前正在尋求新一輪A輪融資,資金需求1500萬人民幣,主要用于引進高端AI人才并尋求外部合作。