來源:IPRdaily中文網(wǎng)(IPRdaily.cn)
原標(biāo)題:專利機(jī)器翻譯,到AIpatent這樣,如何?
近日,南京深思得信息科技有限責(zé)任公司聯(lián)合上海語智信息科技有限責(zé)任公司發(fā)布了專利跨語言綜合服務(wù)平臺(tái)“AIpatent”,并先期發(fā)布了專利專用機(jī)器翻譯服務(wù)(t.aipatent.com)和專利詞典服務(wù)(d.aipatent.com)兩個(gè)線上服務(wù)板塊。據(jù)悉,AIpatent通過在線機(jī)器翻譯、離線專利專用機(jī)器翻譯引擎定制、專利專用詞典、專業(yè)專利人工翻譯等解決方案,消除專利從業(yè)人員在調(diào)查、檢索、翻譯國外專利時(shí)經(jīng)常遇到的語言障礙。
t.aipatent.com 專利專用機(jī)器翻譯界面
d.aipatent.com 專利專用檢索詞典界面
據(jù)了解,AIpatent上述兩項(xiàng)服務(wù)的研發(fā)人員中的張方元,他曾于2007年至2012年就職于永新事務(wù)所的日本部,在涉外專利方面,有很多的經(jīng)歷和經(jīng)驗(yàn)。據(jù)他介紹,在涉外專利方面,行業(yè)人員經(jīng)常會(huì)遇到3個(gè)問題:
1、雖然涉外所的翻譯業(yè)務(wù)收入所占比重能占到4成甚至更多,但是翻譯人員大部分時(shí)間浪費(fèi)在打字的重復(fù)性、低水平的勞作上。
近幾年,有的涉外所引入了trados輔助翻譯系統(tǒng),提升了重復(fù)內(nèi)容的應(yīng)對(duì)效率,但是機(jī)器翻譯這個(gè)終極解決方案卻始終未能實(shí)現(xiàn)突破,市面上做引擎的有很多家,現(xiàn)在NMT算法公開,好像有了語料都能做引擎,但是大部分還是沒有到能讓翻譯人從翻譯的角色轉(zhuǎn)變到思考(審校)的角色上來,大部分用戶的感覺是:專利機(jī)器翻譯,離實(shí)用化還差的遠(yuǎn)。
2、代理人遇到不會(huì)的語種的對(duì)比文件而不得不求助其他部門的語言人員或是代理人。
這樣給雙方工作都帶來困擾,別人來問了,你不能不幫,因?yàn)閷砟阋矔?huì)遇到語言問題要去請(qǐng)教對(duì)方;
3、審查員有時(shí)候引用對(duì)比文件,因?yàn)檎Z言不通僅僅靠附圖相似就給出不完全正確的審查意見。
據(jù)張方元介紹,為了將涉外專利工作人員,從語言的難題上解放出來,AIpatent團(tuán)隊(duì),經(jīng)過數(shù)年研究,推出兩款專利常用工具,其分別為專利專用機(jī)器翻譯服務(wù):t.aipatent.com和專利專用檢索詞典:d.aipatent.com。
專利專用機(jī)器翻譯服務(wù) t.aipatent.com
專利的機(jī)器翻譯進(jìn)入到神經(jīng)網(wǎng)絡(luò)時(shí)代以來,其可讀性大大提高,但是在細(xì)節(jié)方面仍然需要不斷地打磨。在專利領(lǐng)域,最近幾年無論是WIPO還是歐專局,或是Google都推出了適用于專利的機(jī)器翻譯服務(wù),其中尤以Google的影響力最大,Google的機(jī)器翻譯有時(shí)候異常精準(zhǔn),有時(shí)候斷句又讓人感到無厘頭。算法沒有太大差別的情況下,誰家打磨的更細(xì),就意味著誰家會(huì)脫穎而出,從點(diǎn)滴細(xì)節(jié)做起,滿足廣大涉外所的語言需求,是AIpatent的使命。而在隱私性方面,有的事務(wù)所全體電腦斷網(wǎng),只為保證數(shù)據(jù)不泄露,定制引擎的服務(wù)需求也愈發(fā)旺盛。
張方元舉了下面幾個(gè)例子,說明具體產(chǎn)品的效果:圖1至圖6分別是日中、日英、英中、英日、中日、中英六個(gè)方向的權(quán)利要求的譯文。
圈內(nèi)人都知道權(quán)利要求的翻譯是翻譯時(shí)候最難的部分,那么AIpatent的機(jī)器翻譯處理的如何?
圖1 日中機(jī)器翻譯結(jié)果
圖2 日英機(jī)器翻譯結(jié)果
圖3 英中機(jī)器翻譯結(jié)果
圖4 英日機(jī)器翻譯結(jié)果
圖5 中日機(jī)器翻譯結(jié)果
圖6 中英機(jī)器翻譯結(jié)果
此外,為了方便廣大用戶方便的修改譯文以及下載譯文,AIpatent創(chuàng)新性的在右側(cè)增加了編輯框和下載按鈕,如下圖7、8所示。
圖7 批量替換編輯框=可進(jìn)行替換回退等操作
圖8 至頁面頂部、下載為tmx、excel、txt,copy、修改等快捷鍵一應(yīng)俱全
專利專用檢索詞典d.aipatent.com
在提到專利術(shù)語的痛點(diǎn),張方元這樣介紹,在涉外業(yè)務(wù)中,很多同行們會(huì)感同身受,有時(shí)候公司有了新客戶,但需要抓緊時(shí)間確認(rèn)這個(gè)客戶的用詞特點(diǎn)。有的事務(wù)所的做法是專門派人整理這個(gè)客戶之前的同族,然后一篇篇去閱讀,提煉出客戶專屬詞典。有時(shí)候遇到新案件,碰到新詞,首先要看別家是怎么確詞的。一樣要去翻別家的同族,查找相關(guān)的術(shù)語,費(fèi)時(shí)費(fèi)力?,F(xiàn)在有了AIpatent的專利詞典,人工做詞典的事情,再也不需要了。
具體情況看下例子。
詞典分為常規(guī)檢索和高級(jí)檢索,常規(guī)檢索默認(rèn)完全匹配模式,高級(jí)檢索可以使用""+-等一般檢索引擎的高級(jí)檢索方式進(jìn)行檢索,比如可以同時(shí)限定公司名,IPC分類號(hào)等。
在常規(guī)檢索中,如果用戶檢索詞命中了專利詞庫,AIpatent詞典會(huì)給出參考譯詞,并將其在專利句對(duì)庫中的翻譯數(shù)量按從多到少排列,給用戶最直觀的提示。譬如用戶檢索“雷達(dá)”這個(gè)詞,AIpatent中英詞典和中日詞典會(huì)有如下呈現(xiàn),當(dāng)然,這里的譯詞和傳統(tǒng)詞典有些不同,是在幾千萬句對(duì)庫中進(jìn)行分析和計(jì)算的,可以看到它在句對(duì)庫中最常用的翻譯。
圖9
圖10
而在高級(jí)檢索中,用戶可以設(shè)定一些條件進(jìn)行檢索,比如檢索谷歌公司的關(guān)于“向量”的翻譯,則可以如圖11所示輸入相關(guān)關(guān)鍵詞,即可得到圖12的結(jié)果,此外,點(diǎn)擊公開號(hào)則可以直接鏈接到歐專局查看公開文檔。
圖11
圖12
如果想查看其它公司的關(guān)于“向量”的翻譯時(shí),則得到如圖13的結(jié)果。
再看下左側(cè)公司名的排序,以及可以點(diǎn)擊對(duì)應(yīng)句對(duì)下方的公司名進(jìn)行深入確認(rèn)等。
圖13
張方元還提到,AIpatent的機(jī)器翻譯經(jīng)過語智公司以及南京深思得研發(fā)團(tuán)隊(duì)近80人的全職團(tuán)隊(duì),歷經(jīng)2年精細(xì)打磨。雖然現(xiàn)在已經(jīng)迭代到V4.1,但仍然有不少補(bǔ)足,還在不斷優(yōu)化中。歡迎大家多多試用,多提反饋意見。具體試用網(wǎng)站為專利專用機(jī)器翻譯服務(wù)(t.aipatent.com)和專利專用檢索詞典(d.aipatent.com)。
最后,IPRdaily記者就“AIpatent”系統(tǒng)的開發(fā)目標(biāo)和未來規(guī)劃采訪了張方元,他提到,隨著貿(mào)易戰(zhàn)越來越激烈,“真”研發(fā)的重要性愈發(fā)凸顯。古人說,知己知彼百戰(zhàn)不殆,我們現(xiàn)在應(yīng)該是知己的。AIpatent的理解,所謂知彼,對(duì)我們廣大科研人員來說干掉語言壁壘是第一位,干掉復(fù)雜的檢索邏輯,實(shí)現(xiàn)概念檢索則是第二位。AIpatent是為了實(shí)現(xiàn)上述兩個(gè)目標(biāo)而生。計(jì)劃三步走:1、提供專利多領(lǐng)域的高水平機(jī)器翻譯服務(wù),在此基礎(chǔ)上實(shí)現(xiàn)跨語言檢索;2、利用研發(fā)途中積累的大量經(jīng)驗(yàn),活用到相關(guān)概念挖掘中,實(shí)現(xiàn)概念檢索;3、在1和2的基礎(chǔ)上提供分領(lǐng)域?qū)@麛?shù)據(jù)定制服務(wù),總結(jié)歸納國外某些特定領(lǐng)域的研發(fā)數(shù)據(jù),提供類調(diào)查服務(wù)。
IPRdaily作為全球知識(shí)產(chǎn)權(quán)產(chǎn)業(yè)媒體會(huì)一直關(guān)注知識(shí)產(chǎn)權(quán)的最新發(fā)展態(tài)勢,如果您有更新,更具創(chuàng)新的知識(shí)產(chǎn)權(quán)工具,可以聯(lián)系我們。
來源:IPRdaily中文網(wǎng)
編輯:IPRdaily趙珍 校對(duì):IPRdaily縱橫君
推薦閱讀
【2天成為區(qū)塊鏈IP精英】區(qū)塊鏈知識(shí)產(chǎn)權(quán)精英特訓(xùn)營來了!
大咖來了!這些重磅嘉賓將要出席2018全球區(qū)塊鏈知識(shí)產(chǎn)權(quán)峰會(huì)
“投稿”請(qǐng)投郵箱“iprdaily@163.com”
「關(guān)于IPRdaily」
IPRdaily成立于2014年,是全球影響力的知識(shí)產(chǎn)權(quán)媒體+產(chǎn)業(yè)服務(wù)平臺(tái),致力于連接全球知識(shí)產(chǎn)權(quán)人,用戶匯聚了中國、美國、德國、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個(gè)國家和地區(qū)的高科技公司、成長型科技企業(yè)IP高管、研發(fā)人員、法務(wù)、政府機(jī)構(gòu)、律所、事務(wù)所、科研院校等全球近50多萬產(chǎn)業(yè)用戶(國內(nèi)25萬+海外30萬);同時(shí)擁有近百萬條高質(zhì)量的技術(shù)資源+專利資源,通過媒體構(gòu)建全球知識(shí)產(chǎn)權(quán)資產(chǎn)信息第一入口。2016年獲啟賦資本領(lǐng)投和天使匯跟投的Pre-A輪融資。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來自IPRdaily.cn 中文網(wǎng)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場,如若轉(zhuǎn)載,請(qǐng)注明出處:“http://m.globalwellnesspartner.com/”
還原美國高校與研究機(jī)構(gòu)技術(shù)轉(zhuǎn)讓的本貌(下篇)
#晨報(bào)#國家市場管理監(jiān)督總局再次發(fā)文,將重點(diǎn)打擊“傍名牌”及商標(biāo)侵權(quán);蘋果因侵犯他人專利權(quán)被判賠償1.45億美元
文章不錯(cuò),犒勞下辛苦的作者吧