AI醫療來襲,患者、機構、數據科學家分別有哪些新機會?
貫穿整個人類史,醫學一直是門自帶藝術氣質的學科。相較于建立一套標準的診斷治療流程,醫學的重點一直在每個醫生的技巧和經驗上。
雖然近年來,實證醫學(EBM)和精準醫學的先驅已經向醫療領域注入數據驅動的嚴謹實踐,上面的情景已經改變。但是,大多數醫療觀念還是公元前希波克拉底學說的延伸。
△古希臘公元前醫師希波克拉底雕像,他建立了健康和疾病的平衡學說
那目前的醫療現狀如何呢?事實上,世界人口稠密地區的實際醫生數量不足需求十分之一,需要百年時間才能填補。不僅醫務人員缺口大,并且醫療水平有限。誤診、延診和過度診斷造成數百萬病患死亡和數百億資金的流失。
好在我們有科技。技術給醫護人員和病患提供所需的準確信息,偏遠地區的醫務工作者看到世界各地的醫療研究,讓發達地區的醫生診斷更高效準確,在醫療診斷中更方便地了解病人及親屬。
這股醫療科技的中堅力量就是人工智能。尤其是深度學習,已經成為一種強有力的檢測工具,在醫學影像領域表現驚人。比如谷歌的視網膜病變診斷系統、斯坦福的AI診斷皮膚病算法、Enlitic將深度學習運用到癌癥等結節檢測里。
放眼整個AI醫療布局,患者、醫務工作者和數據科學家都面臨著怎樣的機遇和挑戰?未來的醫療形勢怎樣?那就接著往下看
挑戰
1)標記過的歷史數據
有種廣為流傳的普遍說法是,深度學習算法需要大量數據才有效,這種說法不一定是對的。舉例來說,Enlitic的肺癌算法只掃描了1000多名癌癥患者的數據,庫卡機器人,盡管數據集很小,但它具有有效建模的關鍵特征:
首先,數據集中包含了每個病人至少三年的年度掃描數據,在構建診斷算法時,病情隨時間的變化情況至關重要。
其次,數據中包含了放射科醫生提供的診斷意見,里面包含肺部結節的位置,算法可以從中快速找到重要信息。
最后,數據集中包含確診肺癌三年后每個病人的康復情況,能夠說明患者存活率等信息,幫助構建診斷系統。
這個項目無法顯示的信息也可能很實用,比如醫生的治療建議。因為數據集中不包含對病人的治療干預及病患反應等縱向數據,因此構建的算法只對診斷有效,不牽扯治療計劃。
目前,傳統檢測方法仍無法發現肺部40毫米大小的結節,因此肺癌患者死亡率高達90%。驚喜的是,Enlitic開發的系統能發現小于5毫米的結節,使患者的生存率能增加10倍。
△圖中箭頭所指為肺結節(LungNodule)
目前,這些醫療數據信息還零散地分布在多個機構中的不同部門中。不知我們還要多久才能實現跨地區醫療記錄整合,可以將多年內所有的檢測、診斷及治療措施全部包含在里面。
2)法律保守主義
不管數據是集中獲取還是多來源拼湊起來的,一般來說,數據持有機構對將數據共享給數據科學家還非常謹慎。據司法人員透露,泄露病患隱私可能會終結數據科學家的職業生涯,還會連帶機構損失數百萬美元。
那么,病人是如何看待分享私人數據的呢?在被問及如果將來可能幫到他人,是否愿意分享自己的數據時,大多數病人欣然同意特別是聽說可能會為自己將來的治療帶來更好選擇時。
患者的新機遇
1)病人可控的數據
患者有個很清晰的機遇可以選擇:即從不同渠道收集自己的醫療數據,包括可穿戴設備、自我報告等。數據科學家和機構可以讓病人自己選擇將數據分享給哪些數據科學家或項目,給他們一個安全的數據環境。作為回報,他們可以為患者提供:
a)提前享受到醫學最新突破的治療
b)財物補貼
c)數據怎樣被利用幫助其他患者的信息
這是患有罕見或無法治療疾病的患者家屬的新機會:聯合其他情況相似的病人提供各種數據。越多病人加入數據共享,越可能盡快發現疾病的關鍵信息。
2)區塊鏈
不同數據的重要性不能一概而論。
罕見疾病患者的數據對治療至關重要,多年長期觀測的數據比短時間內的數據更具價值。這就會帶來一些潛在問題,比如有人想通過偽造數據獲得報酬。
區塊鏈技術能讓醫療數據記錄變得清晰可查找。根據這一記錄,數據提供者可根據數據實用程度獲得獎勵。因此,機器人維修,病人提供的數據越完整、準確、相關,報酬就越高。
這也為機構提供了一些有趣的機會。獲得病人許可的機構可為研究人員提供完整的數據集,從中獲得財物或技術回報。從長期看,病人可以授權機構通過區塊鏈將數據傳遞給數據科學家。
數據科學家的機會
數據科學家都希望拿數據做些有意義的事,但只有少數人有這樣的機會,大部分對口工作集中在廣告技術、對沖基金交易和產品推薦領域。
數據科學家的挑戰通常包括尋找數據獲取途徑、了解待解決問題、提供可實現的解決方法。
為了讓數據更實用,他們需要進行一系列處理,在實踐中這些步驟通常重復多次:
a)數據清理
b)探索性數據分析(EDA)
c)創建驗證集
d)構建模型
e)分析并檢驗模型
為了完成上述步驟,數據科學家需要一個豐富的分析環境,在里面可以選擇他們的工具、庫、可視化解決方案。目前,大多數人用的是R語言或Python。
通過提供預裝數據和環境,數據科學家能快速找到有意義的數據。也可能是多人獨立處理一個問題,根據工作效果分得獎勵。
AI醫療來襲,我們應該怎么做
1)數據收集
我們需要賦予每個病人收集和維護個人醫療數據的能力,包括:
a)實驗室的檢測和影像學研究
b)診斷
c)用藥處方
d)非處方藥和補充劑
e)其他醫療干預措施
f)飲食和鍛煉記錄
g)家族病史(理想情況下,自動通過鏈接家庭成員自動維護這些數據)
h)自我報告進展,比如精力水平、幸福感等。
i)基因組學和其他測試
這意味著患者數據也可以從醫療服務提供者那下載。不論是來自用戶還是服務提供者的數據,都需要在計劃開始時下載一次,之后可以用API定期追蹤患者情況,或者用各種可穿戴設備的APP獲取他們的數據了。
2)數據分享
每個病患都需要處理他們收到的數據請求,請求一旦增多,工業機器人維修,病人處理每個單獨請求也會很麻煩。在這種情況下,我們可以為病人設置接收規則,自動判斷接受、拒絕還是需要人工干預。
每份數據都需用能溯源的方式打上來源標簽。當然,一些醫療數據存儲量很大,它不一定被存儲在病人的設備上。
一旦患者允許項目訪問他們的數據,這些數據就需要對研究者公開。研究人員需要的分析環境要足夠豐富。這將向他們展示問題的全面信息,并展示如何訪問項目數據。
3)巨大的機會
讓病人控制數據,讓數據科學家有地方施展拳腳是個不錯的想法。