新聞動態
公司動態
會議與講座
精彩資料
會議報導
SCI&基金&講座資料
MedSci服務與公司動態
會議資訊
常見問題FAQ
專業知識
疾病標準指南
醫學英語
醫學統計與圖表製作技巧
研究動態與學術教育
SCI論文寫作與基金申請
研究動態
Newsletter
當前位置:首 頁 >> 新聞中心: 臨床醫生為什麼要用數據庫開展臨床研究?

臨床醫生為什麼要用數據庫開展臨床研究?

添加時間:2015-10-30

臨床科研是每一位醫生的必爭之地,然而也是最痛的痛點之一。如何設計臨床科研,如何積累有價值的科研數據,如何將收集的數據轉換成科研的成果,並且將科研成果轉換為公眾健康意識是永恒的話題。

然而,如何積累有價值的科研數據更多的是執行層麵的部分,包括如何設計CRFs、如何構造電子數據采集係統(EDC)、如何檢查數據質量、清理和分析數據、整合數據庫,也包括對數據錄入員的管理等。串接這兩部分的核心就是CRFs,也是醫生的痛點所在。

其一:CRFs設計難度大,且耗時

CRFs的設計是臨床科研項目的核心,根據某一研究目的確定需要收集的信息並且規定收集的整個標準流程。除了必要的科研想法和試驗設計外,一些方法是可以降低設計CRFs難度的。

其二:數據收集成本高

每一個科研項目常有不同的CRFs設計,變量名或收集的流程可能存在很大的差異。

數據錄入員進行數據收集前,需要耗時培訓和長期適應才能保證對CRFs內問題的了解。這樣無形增了科研項目執行的培訓成本;另外,也容易出現理解錯誤而導致不合適的執行行為;

數據需要重複收集。對於一個設計完備的數據庫,可以用於一個領域內多方麵的分析,首先,也許很多的科研並不需要重新收集數據;對於需要重新收集數據的臨床科研,如何設計良好則可以從電子病例/醫學儀器等方麵獲得高質量的共享數據;另外,也許發動患者主動錄入數據是另一種突破,當然是通過直接的輸入,通過可穿戴設備,又或者是社區醫生的介入。當然如何調動患者積極性,如何保證數據正確性都是挑戰的。

其三:各數據庫間不認識

中國醫學研究者擁有最多的病例數據,但又是最缺少數據的。怎麼說呢?
1)創建CRFs時沒有統一標準;

2)各CRFs間使用不同的標準,導致後期無法合並使用。
正因為數據間缺少一致性而導致了數據的分散而不可用,可謂是坐擁數據金山卻無法享用的狀態。

其四:數據分析成本高

同樣是因為CRFs設計規範的差異,包括變量名、收集方式等,導致數據分析員分析每一個項目時都需要重新熟悉數據數據庫,甚至重新進行編碼;如果需要進行數據庫合並更是難上加難。

關鍵:數據庫必須保證一致性!

1. 統一變量名(數據編碼):編碼的數據便於數據錄入,幫助統計師對數據進行解釋和分析;
2.  要求數據的一致性:包括日期、小數點、測量單位、選項設置(不明/不適用/不可用/未實施)等格式一致性;
3.  通用標識性變量和時間變量應該出現在CRFs或數據采集係統,至少包括方案編號、受試者ID、SiteID和訪視日期;也可添加申辦方ID、受試者姓名縮寫、表單ID、CRF版本號等信息;
4.  對CRF內的問題進行詳細說明,保證收集內容理解的一致性;
5.  根據統一標準/方法學進行CRF設計。

保證CRFs一致性的好處:

1.  最大化的重複利用產生的數據、CRFs和電子數據庫
同一治療領域,科研目的也許千差萬別,分析角度也大相徑庭;但CRFs的內容卻有很多可以重複利用的部分;如果保持所有CRFs具有相同的編碼係統,統一的格式,將大大減少製作CRFs的時間;
2.  減少研究機構重複培訓和數據質疑的數量,提高首次填寫的一從性和數據質量;
3.  基於對CRFs標準的熟悉度,可以提高數據錄入的速度和質量,並減少內部培訓的負擔;
4.  可使數據元的再利用成為可能,減少係統間的重複作業,並改善數據的可靠性,同時收集到的數據可以相互匹配輕鬆擴大數據庫信息量;
5.  降低統計分析的難度
收集的數據除了可能需要滿足FDA提交數據的要求外,最重要的莫過於導出數據進行統計分析。那麼CRFs的設計將直接決定數據導出的友好性。如果一個設計精良,編碼統一的CRFs將大大降低統計分析的難度,提高準確性;
6. 促進數據分享,保障數據存儲。

如何方便使用數據庫開展臨床研究呢?

MedSci為大家量身定做一套標準的數據庫管理係統,方便大家規範開展臨床研究,關鍵一切都是免費。有需要,可以聯係MedSci。

為什麼說它是規範的呢?因為它遵循了CDISC規範,包括其中的“CDASH”。

Clinical Data Acquisition Standards Harmonization (CDASH)定義了臨床數據收集的基本標準,並且開發了一些列新藥研發臨床試驗的CRFs基本內容標準(即,定義了最常用的變量庫)。

一、CDASH提供了設計數據收集係統的方法學

Clinical Data Acquisition Standards Harmonization(CDASH)定義了臨床數據收集的基本標準,並且開發了一些列新藥研發臨床試驗的CRFs基本內容標準(即,定義了最常用的變量庫)。盡管這是為新藥研發企業準備的,但是我們為什麼不能偷師呢!!!

先附上CDASH推薦的CRFs製作流程:


(引用自:CDASH standard v1.1, 2011)

從上圖可以看出,CRFs製作絕對不是一個人的事情,而是整個臨床科研過程中所有角色都應該參與撰寫、修改、測試和確認的過程。

整個CRFs製作流程必須嚴格控製,正如上圖所示。當研究方案通過後,就進入草擬CRFs階段。需要注意

1. 僅采集必要的數據:僅采集將用於分析的數據和避免榮譽的數據采集

  • 采集的變量並不是越多越好,因為數據的質量和數據量成反比,但收集成本和時間與數據量成正比。同時,從倫理上來說,也應該把控數據采集的量。比如,過度采集PK數據,就會對受試者身體造成負擔;

2. 采集的數據應該與統計分析計劃相關:根據統計分析計劃,保證所有分析涉及的變量以符合統計要求的方式被合理收集;

3. 數據采集標準化使用CDASH數據標準。重點說一說數據庫編碼問題

a. CRFs內的問題名建議使用CDSIC受控術語(CDSIC Controlled Terminology)。比如,twice per day=BID,Diastolic Blood Pressure=DIABP等。受控術語列表下載鏈接:http://dwz.cn/26H7Km;如果在列表中沒有,盡量使用列表中的變量名,或根據實驗目的創建新的變量名,但必須保證在同一組織內使用統一標準;

b.同一研究機構內所有科研項目的CRFs使用統一變量名;

c. 如果CRFs需要翻譯成其他的語言,需要保證語義上一致,並且保證與整個CRFs設計同步進行;數據采集標準化的好處請見上一期內容;

4. 使用清晰簡潔的問題名、提示和說明,保證CRFs內的問題和收集說明不會引起誤導。比如,使用標準日期格式(dd/mm/yyyy)、指明小數點應記錄的位數、測量單位、設置“不明/不適用/不可用/未實施”選項,如果數據可以從其他問題延伸而來則不必要收集,使用合理的跳轉關係避免混淆等;

5. 每一個問題都應該有獨立的操作說明,以免需要附加額外的說明文檔進行說明;

6. 設置數據清理的提示語:數據庫應該包含一些提示是否完成某些檢查的問題。比如:否/是-評價是否完成” 優於勾選是否未實施:因為否/是-評價是否 完成可以得到完全的信息,然“勾選是否未實施”如果用戶未選擇不能確定是做了,還是漏了;

7. 避免“自由文本”,因為他需要編碼後才能分析;

8. 強烈建議使用電子數據采集係統(EDC=eCRFs)進行數據收集,可以加快數據分析過程,項目管理和統計檢查。

完成CRFs設計後,進入測試和審閱階段。應該涉及到的人員包括:PI、醫學監察員(medical monitor)、臨床監察員(clinical research associates)、臨床協調員(clinical research coordinators)、臨床數據經理(clinical data manager)、生物統計師、藥品安全監督員等角色。隻有所有角色對CRFs具有相同的理解,並且是填寫友好的,數據符合統計標準的情況下才有意義開始臨床研究。

定稿CRFs後,各類人員需要共同批準後開始數據的收集。一旦開始數據收集後,除不可抗拒因素外,不建議修改CRFs。

二、充分利用CDASH中已經儲備的CRF模版

CDASH根據常用的數據收集的類型進行歸納總結,提供了非常完備的模版庫供我們參考。

模版涉及如下方麵:



盡管這是為企業新藥研發而設計的,但在臨床研究中都可以參考,非常有價值。

舉一個例子說明:


這是一個來自CDASH官網的eCRF的例子,並且提示常規需要收集的變量包括:

  • AETERM-不良事件名稱

  • AESTDAT-不良事件發生日期

  • AESTTIM-不良事件發生時間

  • AEENDAT-不良事件緩解日期

  • AEENTIM-不良事件緩解時間

  • AEREL-與試驗藥物的關係

  • AEACN-措施記錄

  • AEACNYN-采取措施(是/否)

  • AEOUT-不良事件結局

  • AESEV-嚴重程度

  • AETOXGR-毒性級別

  • AESER-嚴重不良反應事件SAE

  • AESAEDAT-報告嚴重不良反應事件日期

  • AESCONG-認知異常或出生缺陷

  • AESDISAB-致殘

  • AESDTH-致死

  • ASSHOSP-導致住院

  • AESLIFE-生命受到威脅

  • AESMIE-其他醫學重要事件

  • AEDRYN-因不良事件退出試驗(是/否)

注意:

其中中文之前的編號的規律,簡略說域名(domain)+變量縮寫。比如,AE代表不良反應,TERM代表變量名稱。大部分的變量名CDSIC已經做了規定,至於如何創建CDSIC沒有包含的變量名,以及如何設計和理解數據庫導出格式等內容。

總之,CDASH就是我們一個很好的製作CRFs的開始。他給我們提供了很多CRFs常用收集的數據模版,幫助我們規範CRFs的製作和使用規範,大大降低製作CRFs的難度,也為後期數據分析奠定基礎。

醫學統計與圖表製作技巧相關的新聞


臨床研究學院課程推薦2:臨床醫學統計課程
臨床研究學院課程推薦4:SCI發表支持課程
臨床研究學院課程推薦3:SCI論文寫作指導課程
核查知情同意書的十個點
跟我一起從零學習stata統計軟件,從此統計不求人
臨床醫生為什麼要用數據庫開展臨床研究?
論文數據要慎用條圖
SparkR:數據科學家的新利器
大數據分類利器---支持向量機(SVM)入門介紹
web对话
live chat