數據標簽實現同案類推人工智能如何輔助辦案?
人工智能技術與司法制度的深度結合可能會深度凸顯在兩個方面:其一是AI速裁,以智能機器人(19.240,0.00,0.00%)和法官相結合所完成的簡易案件速裁。其二是案件預測全覆蓋,輔助當事人參與訴訟,或者幫助訴訟參與人作出理性的預判。
高某某駕駛一輛白色越野車在某市街頭發生交通事故,KUKA機器人維修,導致4車相撞3人受傷,高某某等在原處被抓獲后,經檢測每百毫升血液酒精含量243毫克。
高某某將面臨何種處罰?
當高某某的案件來到法院后,一套智能辦案輔助系統會自動告訴法官,自家法院已經判決了多少起類似案件,平均量刑為多長時間,這些判決書中的判決依據是什么。
同樣的技術服務也已面向普通公眾,市面上多款法律AI產品都已具備這種類案推送功能,有的產品甚至還能夠支持當事人的語音查詢識別。
甚至系統可以告訴你某個法官處理這類案件中上訴率、二審發回率、他常采信的證據、他的裁判觀點、他關注的爭議焦點等等。法律科技公司華宇元典總經理、曾經的檢察官鄒劭坤在1月5日接受21世紀經濟報道記者采訪時表示。
這種智能輔助辦案技術正在越來越多的法院中應用,建立在海量司法大數據、語義識別,以及初步的機器學習技術之上。盡管受訪的司法和技術人士均表示,這還只是極低水平的智能化,但已經開始為司法領域描繪一幅人工智能前景。
人工智能提上政策議程
智能輔助辦案系統出現的背景,是近年來司法機關‘案多人少’的矛盾日漸突出,司法效率亟待提升,同時大數據、人工智能技術取得了很大突破,最高檢、最高法先后提出了智慧檢務和智慧法院建設。北京大學法律人工智能實驗室副主任江溯說。
從政策脈絡中,最高司法機關從最初的信息化到商業智能,最終大膽提出了人工智能的應用目標。
《人民法院信息化五年發展規劃(2016-2020)》提出建設基于大數據智能服務的審判支持系統,并提出利用商業智能、大數據分析和可視化手段,對司法審判信息資源庫中的數據進行挖掘、分析和展現。
在2016年11月17日的第三屆世界互聯網大會智慧法院暨網絡法治論壇上,最高人民法院院長周強正式提出積極推動人工智能在司法領域的應用,現在同案類推都是為人工智能的發展奠定了基礎。
國務院2017年7月印發的《新一代人工智能發展規劃》也納入了智慧法庭,提出促進人工智能在證據收集、案例分析、法律文件閱讀與分析中的應用。
目前法律人工智能領域涌現了多種市場主體,比如人民法院出版社旗下的法信平臺,庫卡機器人,與上海市高級人民法院合作開發‘206工程’的科大訊飛(61.950,0.00,0.00%),屬于國家隊;還有更多的創業公司在進入,比如電子政務領域的上市公司華宇軟件(15.650,0.00,0.00%)成立了華宇元典,天同律師事務所孵化的無訟,金杜律師事務所孵化的理脈等。江溯告訴21世紀經濟報道記者。
BAT也有布局,他們因為具有強大的云計算實力而更占優勢,但相對低調,他們更愿意用已有技術為司法提供公眾服務,而不是切入人工智能領域。一名互聯網企業從事法律服務工作的人士告訴記者。
據報道,騰訊與深圳、廣州、北京等地法院合作了小程序訴訟服務,提供在線立案、送達、開庭等服務。21世紀經濟報道獲悉,騰訊近日將上線智慧法院開放平臺,此前騰訊已推出了智慧城市等開放合作平臺。
在中國,有許多像華宇元典這樣的法律科技公司在競逐,他們用自己的方法在探索,試圖改變當前的法律服務市場。鄒劭坤告訴21世紀經濟報道記者,華宇元典與母公司華宇軟件合作,已推出了面向法院的智慧裁判解決方案和面向檢察院的智慧公訴輔助系統。
輔助系統如何運作?
智能輔助辦案系統中,上海的206工程是一項標桿,它的全稱是上海刑事案件智能輔助辦案系統。
這項工程由中央政法委交辦,因交辦日期為2月6日而得名,科大訊飛為206工程配備了215名技術人員,其中,在上海高院現場辦公79人。
最高法院司改辦規劃處處長何帆曾公開介紹,法官決定判決某個罪名的案件時,寫好判決書放入系統里,系統會自動提示跟本院以及上級法院有將近85%的類似情況下的判決是不一樣的,問法官是否堅持這樣做,若堅持該判決,那么系統將自動把判決推送給庭長以供討論。
這可以被理解為一個具有法律機器人雛形的智能輔助辦案系統是如何運作的。廣州市中院向記者提供的材料顯示,廣州兩級法院平均每天產生2500件新收、結案案件信息,歷史案件數字化信息超過300萬件。基于海量案件信息,廣州法院以案由為分類,建立了龐大的案件特征要素庫(案件詞庫),并輔助辦案。
第一步是智能提取案件要素。一件案件的案件材料涉及當事人提供的紙質材料、從立案到結案審判輔助人員錄入的各類信息、庭審中訴訟參加人的實時語音數據、審判人員撰寫的各類法律文書。
這些材料形成后,系統按照從圖片、語音到文字,從文本到結構化數據的思路,利用OCR(光學字符識別)技術、語音識別技術、文本分析技術,將每件案件關鍵信息提取出來,錄入案件要素特征庫。
案件要素特征庫中的海量數據(46.280,0.00,0.00%)由系統自動采集,數據質量相對較差,無法直接運用于輔助辦案工作。
廣州市中院提供的材料顯示,大數據中心數據質量模塊通過人工調整和自動調整兩種手段對海量數據進行處理,補充不完整數據,修正錯誤數據,去除冗余數據。
比如在紙質案卷掃描成電子文檔,以及庭審錄音轉化成文字后,法院工作人員對生成的文字進行校對糾錯,在糾錯過程中,系統進行一定的自動學習,逐漸提高轉化的準確率,這是目前比較成熟的智能化應用。中國社科院國家法治指數研究中心副主任呂艷濱說。
在此基礎上,法官辦案時,系統通過案件畫像技術理解在辦案件,根據案件要素特征庫中匹配案件特征,推送關聯案件信息。
推送的信息主要包括:與在辦案件當事人有關的訴訟、信訪情況;與在辦案件特征類似的生效裁判文書;全市法院對此類案件的裁判趨勢;符合在辦案件特征的法律法規條文。
在外行人的潛意識里,可能認為法律是一個封閉的規則體系,按照三段論,系統中具有法律規定的大前提,輸入發生的案件事實,就會得出相應的裁判結果。但實際上存在數不清的爭議點和模糊地帶。鄒劭坤告訴21世紀經濟報道記者。
用機器取代大量重復性工作
2017年初,一則南京市中院將引入智能機器人判案的報道激起了輿論,但南京市中院隨即辟謠稱,該院并未成立機器人項目組,更沒有任命項目負責人,并稱個別企業為了推銷產品,無中生有地編造我院引進所謂‘法律機器人’項目。