本文內容來自《中華流行病學雜誌》2019年第40卷第1期,作者爲嚴若華和彭曉霞教授,原題目爲《醫學期刊統計報告要求的詳述與解讀》(感謝作者彭曉霞教授的授權)。

該文結合已發表的研究論文,從研究設計、統計分析與結果報告3方面涉及的統計學問題入手,進行逐條解讀,以闡明醫學論文應達到的統計報告要求。研究設計部分詳見:一表總結:醫學期刊的統計報告要求。下文主要分享統計分析和結果報告要求。

統計分析

1、缺失值的處理:

缺失值是人羣研究中不可避免的問題,其處理方式的差異可能在不同程度上引入偏倚,因此,詳細報告數據清理過程中缺失值的處理方法有助於讀者對潛在偏倚風險進行評價。

例如,瑞舒伐他汀試驗在統計分析部分詳細說明了缺失值的填補策略,包括:將二分類結局中的缺失值視爲未發生事件;將生物標誌物和心電圖測量中的缺失值進行多重填補(multiple imputation);爲了證明缺失值處理的合理性和填補結果的穩定性,研究還比較了多重填補與完整數據(complete-case)分析的結果。

2、數據的預處理:

實施統計分析之前往往需要將原始數據進行預處理,如:對連續變量進行函數轉換使其更接近正態分佈,基於原始數據構建衍生變量,將連續變量拆分爲分類變量或將分類變量的不同類別進行合併等。醫學論文應報告處理原始數據的方法及依據,瑞舒伐他汀試驗即在統計分析部分描述了對血液生物標誌物的對數轉換。

3、變量分佈特徵描述:

確定統計分析使用的變量,並針對每一個變量的分佈特徵進行描述,是決定研究選用何種統計分析方法的基礎。醫學期刊雖然普遍對此提出要求,但作者往往套用常用方法,如:連續變量符合正態分佈時,採用均數(標準差)描述,否則採用中位數(四分位間距)描述;分類變量採用頻數(百分比)描述等。

事實上,應根據研究設計類型、統計分析目的和數據特徵選擇恰當的描述方法。例如,CKB選擇採用年齡、性別和地區校正的均值和率來描述人羣分佈特徵,而非簡單的報告連續變量的均數和分類變量的構成比。

4、主要分析(primary analysis):

指針對研究結局的統計分析,是研究論文的核心證據。因此,醫學論文應詳細描述主要分析的實施過程和適用性。

試驗性研究中,應明確統計分析數據集、試驗效應指標、相對或絕對風險及其置信區間的計算方法、以及假設檢驗的方法。

例如,瑞舒伐他汀試驗採用意向性分析(intention to treat)數據集,通過計算OR值及其95%CI來評價術後房顫發生風險在試驗組與對照組間的差異,置信區間包含1說明研究結果不拒絕原假設,即兩組的術後房顫發生風險相等;考慮到重複測量的需要,採用協方差分析比較兩組術後6~120 h肌鈣蛋白Ⅰ釋放曲線下面積的對數,並計算其均值的絕對差異及其95%CI來評價圍術期心肌損傷情況在試驗組與對照組間的差異,置信區間包含0說明研究結果不拒絕原假設,即兩組的圍術期心肌損傷情況相同。

觀察性研究中,通常採用多因素統計模型來控制混雜,此時應明確定義因變量、自變量及潛在的混雜變量或效應修正因子,描述變量轉換的方法和變量篩選的過程,並預先說明論文報告哪一種統計模型的結果。如果採用讀者並不熟悉的統計分析方法,還應詳細介紹該統計分析方法的原理。

例如,CKB採用Cox比例風險迴歸模型分析水果攝入與心血管事件之間的關聯,因變量爲心血管事件,包括心血管死亡、主要冠狀動脈事件、出血性卒中、缺血性卒中、其他缺血性心臟病和其他腦血管病;

自變量爲水果攝入頻率,即每天、4~6 d/周、1~3 d/周、每月、極少或從不;分層變量爲年齡、性別和地區;同時模型調整了基線的混雜變量;

爲了幫助多個暴露類別之間的比較,研究採用浮動絕對風險的方法(floating-absolute-risk method)估計危險比的變異程度,並與傳統的不浮動絕對風險的方法進行比較。

5、其他分析:

如果研究在主要分析之外,還進行了其他輔助分析(ancillary analysis),如敏感性分析(sensitivity analysis)或亞組分析(subgroup analysis),應在統計分析部分給予充分說明。

如果是事後分析(post-hoc analysis),應考慮潛在的Ⅰ類錯誤膨脹問題。例如,瑞舒伐他汀試驗在主要分析的基礎上,根據基線年齡(≤60歲或>60歲)、性別、他汀用藥史(是或否)等變量分亞組比較主要結局指標在試驗組與對照組間的差異。但是,由於該亞組分析在研究設計時已預先設定(pre-specify),因此無需對顯著性水平進行調整。

6、多重比較:

除了常規使用的統計分析方法外,作者還應特別注意多重比較的問題。

例如,瑞舒伐他汀試驗設置了兩個平行的主要結局指標:術後房顫和圍術期心肌損傷,原則上應調整顯著性水平以控制總體Ⅰ類錯誤概率。然而,由於研究假設兩個主要結局指標同時達到組間差異有統計學意義纔算試驗陽性,且在估算樣本量時已對此給予了充分考慮,因此無需考慮多重檢驗的問題(without allowance for multiple testing)。

7、Ⅰ類錯誤概率與統計軟件:

醫學論文應對統計檢驗的Ⅰ類錯誤概率(單/雙側)及統計軟件進行說明。例如,兩部分數據分別採用SAS 9.3和Stata 13.0軟件進行分析,所有檢測均爲雙側檢驗,P<0.05爲差異有統計學意義。

結果報告

1、研究對象的納入流程:

醫學期刊推薦使用研究對象流程圖來描述研究對象的納入流程、研究實施過程中的失訪或無應答、以及最終的統計分析數據集等信息,見圖 1。研究對象流程圖的展示可以爲研究對象是否存在選擇偏倚、研究結果的可外推範圍等提供重要證據。

圖1 瑞舒伐他汀試驗的研究對象流程圖

注:a患者可能被多種原因排除;b接受手術患者的百分比;所有生化測量的缺失值百分比範圍爲5.0%~7.5%,除了sCD40L(17.5%)

2、基線數據比較:

醫學期刊通常要求分組報告基線變量的分佈特徵,但在組間比較時可以不做假設檢驗,不標註P值,見表 2。因爲,在大樣本研究中,絕對差異的微小改變都可能造成統計學顯著,而該差異本身並不一定具有臨牀意義。另一方面,在樣本量較小的隨機對照試驗中,即便採用了嚴格的隨機分組策略,仍會有個別變量無法達到組間可比,此時,如果預先對基線數據進行組間比較,作者可能會選擇性不報告組間差異有統計學意義的變量,而導致選擇性報告偏倚。

表2. 瑞舒伐他汀試驗的研究對象基線特徵(節選)

3、效應估計與置信區間:

醫學論文在報告統計結果時不應僅依賴於P值,還應給出量化的效應估計結果,同時評價其測量誤差或不確定性,如報告95%CI(如有必要,可根據顯著性水平對置信係數進行調整。因爲P值無法反映關於效應大小和估計精度的重要信息,只能說明統計學意義,而損失對臨牀意義的表達。

SAMPL指南建議研究者給出臨牀意義的最小界值,以幫助讀者根據點估計及置信區間判斷研究的臨牀意義。中華流行病學雜誌則提出,當P值小於Ⅰ類錯誤概率時,應說“組間差異有統計學意義”,而不應說“組間有顯著性差異”。例如,CKB在評價研究因素對結局的發生風險時,報告了危險比及其95%CI。

4、結果與方法一一對應:

醫學論文應保證研究結果與方法一一對應,如:在方法中介紹了基線的統計描述與組間比較的具體方法,應在結果中對基線數據進行相應的描述與比較;在方法中說明了研究的主要分析方法,應在結果中對主要結局指標的估計或假設檢驗結果進行報告;在方法中提出了其他分析,包括敏感性分析、亞組分析等,應在結果中羅列出相應內容。

例如,瑞舒伐他汀試驗在方法部分說明研究將對主要結局指標、次要結局指標分別進行組間比較,並對主要結局指標進行亞組分析;在結果部分則依次報告了相應結果。

5、傷害:

需要注意的是,無論是試驗性研究還是觀察性研究,都有可能存在傷害研究對象的風險。醫學論文應如實報告研究過程中發生的傷害。

例如,噻託溴銨試驗報告了試驗組與對照組的不良事件發生情況:除了輕度不良事件(如口咽不適)外,其他不良事件、嚴重不良事件和死亡發生率的組間差異均無統計學意義。

6、P值的報告規範及保留小數位數:

不同醫學期刊對P值的報告規範有不同要求。例如,NEJM規定,除非研究設計需要進行單側檢驗,如非劣效性試驗,其他報告的P值均應爲雙側。P值大於0.01應報告小數點後兩位;P值在0.01到0.001之間應報告小數點後三位;P值小於0.001應報告爲P<0.001。在分層分析中,只需報告層間比較差異有統計學意義的P值,而不需報告所有層間兩兩比較的P值。

CMJ(Engl)規定,應使用大寫斜體,並報告P值的精確值(如果P值在0.001~0.05之間時)。中華醫學雜誌規定,應儘可能給出具體的P值。中華流行病學雜誌規定,應給出P值的實際數值,並保留3位小數。在使用不等式表示P值時,選用P>0.05、P<0.05和P<0.01即可滿足需求,無須細分P<0.001或P<0.000 1。

可以看出,目前醫學期刊對P值的報告尚無統一規範,導致一些研究僅給出P值與顯著性水平之間的不等關係,而不體現量化的數值(如P>0.05);一些研究則盲目追求P值的精度,而保留不必要的小數位數(如P=0.0357)。

7、統計表規範:

統計表可以簡明、高效地展示研究的關鍵信息。ICMJE對統計表的要求包括:依照正文的引用順序連續編碼,並確保每個表都在正文中被引用;設置簡短清晰的表標題,使讀者可以直接理解表中內容而無需閱讀上下文;設置簡短清晰的縱標目與橫標目,並在腳註中解釋標目涉及的細節問題;在腳註中解釋所有表中的非標準縮寫,同時明確變異特徵,如標準差或標準誤;如果表中用到其他來源的已發表或未發表的數據,應獲取許可並充分引用,見表 2。

8、統計圖規範:

統計表用於展示數據的精確數值,而統計圖則提供對數據的全面評估。ICMJE對統計圖的要求包括:依照正文的引用順序連續編碼,並確保每張圖都在正文中被引用;如果圖片已經發表,應獲取許可並充分引用;如果存在符號、箭頭、數字或字母用於標記圖片,需在圖例中逐一解釋,見圖 1。不同雜誌還會對圖片的格式和大小進行進一步要求。統計圖表達方式的創新有助於讀者快速掌握研究的核心結果。

9、圖表內容不重複:

醫學論文的圖表內容不應重複,且不應在文中複述圖表中的所有數據;應僅強調或總結最重要的結果。

例如,瑞舒伐他汀試驗在結果部分依次用圖表展示了基線、主要結局指標及亞組分析、共同主要結局指標和次要結局指標的相關內容。

總結

本文從研究設計、統計分析、結果報告3方面涉及的統計學問題入手,對醫學期刊的統計報告條目及內容進行歸納,並藉助試驗性研究和觀察性研究論文,對其進行逐條解讀,以闡明醫學論文統計報告應達到的基本要求。

本文發現,英文醫學期刊普遍參考ICMJE提出的“醫學期刊學術著作實施、報告、編輯和發表建議”及EQUATOR協作網發佈的針對多種研究設計類型的報告聲明等規範性文件,對於醫學研究的統計報告已有詳細規定。

中文醫學期刊通常採用編輯部自行刊發的對統計學方 法的要求,雖然對統計分析的格式和內容有具體說明,但並不充分,建議根據國際規範完善現行的統計報告要求。

需要注意的是,本文介紹的統計報告條目是不同研究設計類型均可能涉及的共性問題,當研究者在進行論文撰寫時,應根據自身的研究設計類型、研究目的與學術期刊要求選擇參考適用的條目,而非逐一報告。本文有望幫助研究者瞭解醫學研究的統計報告要求,從而切實提高醫學論文的統計報告質量。

內容來源:嚴若華,彭曉霞. 醫學期刊統計報告要求的詳述與解讀[J]. 中華流行病學雜誌, 2019, 40(1): 99-105.

醫咖會面向醫生個人、醫院/單位、企業提供各種科研服務,包括研究設計、統計分析、EDC系統、科研培訓等,詳情查看:醫咖會可爲你提供這些科研服務,助你解決各種科研難題!。快加小咖微信(xys2019ykh)或掃描以下二維碼加小咖微信諮詢吧。

相關文章