世界百事通！分析阿茲夫定的臨床試驗(yàn)數(shù)據(jù)：一個(gè)打死不冤的偽新冠特效藥

2023-01-07 17:41:31 來(lái)源：手機(jī)網(wǎng)易網(wǎng)

申明：僅代表個(gè)人觀點(diǎn)，不代表任何組織與單位

這幾天有報(bào)道說(shuō)阿茲夫定的三期臨床試驗(yàn)公布，顯著縮短核酸轉(zhuǎn)陰時(shí)間。這個(gè)藥之前寫過(guò)很多，有效性極為可疑，安全性上的遺傳、生殖毒性問(wèn)題更無(wú)法解決（詳見(jiàn)二條）。

但很多人還在問(wèn)，所以就去看了所謂顯示有效性的巴西三期臨床試驗(yàn)，其實(shí)根本談不上顯示有效性，部分內(nèi)容也與之前相關(guān)藥企IPO文件里提到的其它臨床試驗(yàn)結(jié)果沖突。此藥能上架就已荒唐，如果你有（不）幸拿到阿茲夫定，扔了算了。

(資料圖片)

1. 沒(méi)有達(dá)到主要終點(diǎn)的“成功”

阿茲夫定巴西的三期臨床試驗(yàn)公布，國(guó)內(nèi)媒體大言不慚地說(shuō)安全有效：

好像試驗(yàn)非常成功，而且有意思的是說(shuō)成了巴西的一項(xiàng)三期臨床試驗(yàn)，同時(shí)涉及輕癥與中癥感染者。實(shí)際上這明明就是兩項(xiàng)研究，預(yù)印版論文也是兩篇。

輕癥的[1]：

中癥的[2]：

別看兩個(gè)標(biāo)題就Mild（輕癥）和Moderate（中癥）這一字之差，差點(diǎn)也讓我看花了眼，但兩個(gè)試驗(yàn)在Clinicaltrial.gov上分別編號(hào)，是不同的試驗(yàn)。連通稿買的都不嚴(yán)謹(jǐn)，不得不佩服，當(dāng)然去看了這兩篇論文，按其中的學(xué)術(shù)嚴(yán)謹(jǐn)程度以及寫作水平，通稿發(fā)不對(duì)也不讓人意外。

媒體報(bào)道更讓人震撼的是，報(bào)道內(nèi)容里直接顯示了試驗(yàn)主要終點(diǎn)未達(dá)到，居然還能說(shuō)是證明有效。例如輕癥的試驗(yàn)，媒體報(bào)道里的主要重點(diǎn)都寫明了：

是出院時(shí)病情量表各級(jí)比例，這個(gè)有區(qū)別嗎？報(bào)道里直接一張圖都顯示沒(méi)有區(qū)別：

主要終點(diǎn)都沒(méi)達(dá)到，也能說(shuō)是成功？

中癥那個(gè)也一樣。媒體報(bào)道里也說(shuō)明了主要重點(diǎn)是什么：

WHO病情改善一個(gè)級(jí)別的患者比例，這個(gè)終點(diǎn)達(dá)到了嗎？這里阿茲夫定耍了個(gè)心機(jī)，預(yù)印版論文里承認(rèn)了出院時(shí)除了1位退出和7位惡化，其他人都是WHO評(píng)分里最低的0或1分。也就是說(shuō)都改善了，主要重點(diǎn)同樣沒(méi)有區(qū)別?？蔀槭裁凑f(shuō)阿茲夫定耍了個(gè)心機(jī)呢？因?yàn)樗f(shuō)阿茲夫定組出院時(shí)最終評(píng)分是0.02 ± 0.15（對(duì)，最低評(píng)分是0，但它能做出0.02方差0.15），比安慰劑組的0.11 ± 0.31低。

這個(gè)最終評(píng)分差異到底在哪里？看了下原論文：

安慰劑組1分的比阿茲夫定多。那1分和0分是什么區(qū)別？?jī)蓚€(gè)都是無(wú)癥狀，只是1分的核酸還沒(méi)轉(zhuǎn)陰。就這么點(diǎn)區(qū)別?？晌覀冎揽祻?fù)者很長(zhǎng)時(shí)間可能因病毒尸體檢測(cè)出核酸陽(yáng)性。這種差異根本就沒(méi)有意義。后面也會(huì)重點(diǎn)說(shuō)阿茲夫定強(qiáng)調(diào)的核酸轉(zhuǎn)陰差距為什么不靠譜。

此外，這個(gè)試驗(yàn)只招募了180人，最后完成試驗(yàn)的是172人，7個(gè)惡化進(jìn)入ICU（6個(gè)死亡），1位退出，這8人都沒(méi)放入上述分析，其中除了退出的和一位心臟驟停死亡的都完成了治療。把這些人放入分析，還能有區(qū)別嗎？要知道WHO評(píng)分里死亡可是10分。

難不成現(xiàn)在我們判斷阿茲夫定的有效性標(biāo)準(zhǔn)是，吃了后好了的都好了，所以就有效，沒(méi)好的直接忽略？要是用這標(biāo)準(zhǔn)，要找出個(gè)沒(méi)用的藥也不容易啊。

兩個(gè)試驗(yàn)主要終點(diǎn)都沒(méi)達(dá)到，居然能說(shuō)顯示有效，只能讓人覺(jué)得要去查查字典，看看“有效”二字的定義是不是改過(guò)了。

2. 核酸轉(zhuǎn)陰靠譜嗎？

主要終點(diǎn)都錯(cuò)過(guò)，但不妨礙阿茲夫定愛(ài)好者們拉出“加速核酸轉(zhuǎn)陰”的賣點(diǎn)來(lái)宣傳。其實(shí)這從兩篇預(yù)印版論文的標(biāo)題都能看出來(lái)，都是通過(guò)載毒量來(lái)評(píng)估有效性。

兩篇論文都宣稱阿茲夫定顯著縮短了感染患者核酸轉(zhuǎn)陰時(shí)間，在輕癥的試驗(yàn)里，阿茲夫定組第一次轉(zhuǎn)陰是5.55天，安慰劑組是8.27天；中癥的試驗(yàn)，阿茲夫定組第一次轉(zhuǎn)陰6.24天，安慰劑組是7.94天。但這些天數(shù)是平均值還是中位值？新聞稿里沒(méi)說(shuō)，也正常，因?yàn)橹挥休p癥的論文里說(shuō)了是平均，而中癥雖是獨(dú)立的文章，卻一字不提。所以我說(shuō)兩篇論文的嚴(yán)謹(jǐn)程度令人震撼。不過(guò)別急，還有更震撼的，現(xiàn)在繼續(xù)說(shuō)核酸轉(zhuǎn)陰。

核酸轉(zhuǎn)陰是用RT-PCR來(lái)判斷，就是劃一個(gè)CT值的標(biāo)準(zhǔn)，CT值越高，載毒量越低。核酸陰性即RT-PCR的CT值低于設(shè)定的陰性標(biāo)準(zhǔn)了。然后看中癥試驗(yàn)論文里的CT值比較：

兩個(gè)組有區(qū)別嗎？方差范圍互相重合，居然能說(shuō)阿茲夫定轉(zhuǎn)陰時(shí)間更快？論文說(shuō)阿茲夫定是6.24天轉(zhuǎn)陰，安慰劑組7.94天，去看5、7、9這三個(gè)采樣點(diǎn)，兩組CT值有區(qū)別嗎？還能一個(gè)轉(zhuǎn)陰一個(gè)沒(méi)轉(zhuǎn)陰？

另外這里核酸轉(zhuǎn)陰的標(biāo)準(zhǔn)是什么？從文章的方法來(lái)看，CT值大于30.5是陽(yáng)性。第7天的時(shí)候，阿茲夫定組方差范圍的上限連CT值30的毛都沒(méi)碰到，能算出來(lái)核酸轉(zhuǎn)陰時(shí)間是6.24天？就算最快轉(zhuǎn)陰時(shí)間都不符合這張圖啊。

輕癥試驗(yàn)用的核酸檢測(cè)試劑盒與中癥的文章一模一樣，但核酸陰性的標(biāo)準(zhǔn)成了CT大于37。不要問(wèn)我為什么，因?yàn)槲乙膊恢溃荒苷f(shuō)是量子核酸。這是輕癥的CT值變化圖：

雖然說(shuō)紅色的阿茲夫定組和藍(lán)色的安慰劑組在CT值上有區(qū)分，阿茲夫定在3、5、7三個(gè)采樣點(diǎn)都是CT值更高，可是連30都沒(méi)超過(guò)，離37的轉(zhuǎn)陰標(biāo)準(zhǔn)更是十萬(wàn)八千里，怎么就得出阿茲夫定輕癥組5.55天轉(zhuǎn)陰呢？

對(duì)了，輕癥這幅圖的圖標(biāo)是Ciral load，都不是病毒載量，是Ciral載量，不過(guò)這仍不是我說(shuō)的令人震撼的地方，繼續(xù)往下看，最后再揭曉。

這些核酸轉(zhuǎn)陰或載毒量比較，還有一個(gè)不靠譜的地方在于不同的采樣時(shí)間點(diǎn)，收集的樣本數(shù)不一樣。比如輕癥試驗(yàn)里：

紅框里的是每個(gè)采樣時(shí)間點(diǎn)的采樣人數(shù)，這個(gè)輕癥試驗(yàn)招募了312人，但31人在完成治療前退出了（同樣，我們不知道為什么這31人退出了，另外阿茲夫定的治療是不超過(guò)14天，未完成治療是什么概念？是不是也吃了一段時(shí)間，有沒(méi)有采樣？這些還是不知道）。完成治療的281人采樣，可隨著時(shí)間進(jìn)行，采樣的受試者越來(lái)越少。這種情況下，比較出來(lái)的載毒量差異是否還有意義？

為什么有的人沒(méi)采到樣？?jī)山M里分布是否平均？?jī)蓚€(gè)試驗(yàn)還專門用ddPCR來(lái)檢測(cè)載毒量，可一樣受到采樣人數(shù)變化的影響。

反正，阿茲夫定愛(ài)好者們眼里的證明阿茲夫定有效安全的巴西三期臨床試驗(yàn)，主要終點(diǎn)沒(méi)有達(dá)到。所謂的核酸轉(zhuǎn)陰顯著縮短，按兩篇論文里給出的具體數(shù)據(jù)，連這轉(zhuǎn)陰時(shí)間都不靠譜。

3. 與過(guò)往試驗(yàn)矛盾

這也不是阿茲夫定第一次炒作。說(shuō)這次試驗(yàn)證明有效的人，為何不去看看阿茲夫定過(guò)往試驗(yàn)的結(jié)果，比較一下？比如阿茲夫定還有在中國(guó)的臨床試驗(yàn)，曾在藥企IPO文書中提到過(guò)[3]。

為什么要再看一下這個(gè)中國(guó)的試驗(yàn)？因?yàn)檫@個(gè)從2020年6月做到了2022年3月的輕癥與普通型新冠試驗(yàn)，主要終點(diǎn)恰好是受試者服藥后第7與14天時(shí)的載毒量。巴西的試驗(yàn)不是說(shuō)顯著降低載毒量嗎？那我們就看看這種說(shuō)法在以載毒量為主要標(biāo)準(zhǔn)的試驗(yàn)，是什么結(jié)果。

中國(guó)實(shí)際招募348人。完整數(shù)據(jù)沒(méi)有公布過(guò)，IPO文件描述有效性時(shí)，加了一個(gè)前提——基線載毒量高于3^10，在這些高載毒量受試者中，第3、5、7天用藥組載毒量下降比安慰劑組更多：

那么問(wèn)題來(lái)了，這載毒量高的受試者是多少人呢？這一標(biāo)準(zhǔn)是事先確定的，還是事后加入？如果是事后加入，是否存在偏倚（bias）呢？而且即使是在這不知道多少人的高載毒量組里，載毒量變化達(dá)到顯著差異的只有第5天。

根據(jù)這些描述可以推斷試驗(yàn)的主要終點(diǎn)——受試者第7與14天的載毒量，用藥組與安慰劑組沒(méi)有顯著差異，也就是說(shuō)該試驗(yàn)還是沒(méi)有達(dá)到主要終點(diǎn)。

另外，IPO文件里也說(shuō)了所有次級(jí)終點(diǎn)均未顯示顯著差異。那么次級(jí)終點(diǎn)里有什么呢？除了吸氧比例、肺炎變化等癥狀，還有核酸檢測(cè)轉(zhuǎn)陰時(shí)間與速率。

也就是說(shuō)，巴西兩個(gè)試驗(yàn)里觀察到的核酸轉(zhuǎn)陰更快，在中國(guó)的試驗(yàn)里沒(méi)有觀察到。而且在以載毒量為主要終點(diǎn)的中國(guó)試驗(yàn)里，這個(gè)主要終點(diǎn)沒(méi)有達(dá)到。

以癥狀相關(guān)指標(biāo)為主要終點(diǎn)的兩個(gè)巴西臨床試驗(yàn)，沒(méi)達(dá)到主要終點(diǎn)，拿出不知怎么計(jì)算出來(lái)的核酸轉(zhuǎn)陰時(shí)間以及不知采樣人數(shù)為何不斷變動(dòng)的載毒量數(shù)據(jù)說(shuō)有差異。可真的以載毒量為主要終點(diǎn)的中國(guó)臨床試驗(yàn)里，載毒量沒(méi)有達(dá)到終點(diǎn)，核酸轉(zhuǎn)陰也沒(méi)有差異。

這種情況下，你覺(jué)得阿茲夫定值得相信嗎？如果還是相信，那只能說(shuō)是真愛(ài)，韭菜愛(ài)鐮刀那種真愛(ài)。

4. 試驗(yàn)人數(shù)問(wèn)題

巴西的兩個(gè)試驗(yàn)，輕癥的是招募312人，中癥原計(jì)劃招募342人，后來(lái)改成180人。阿茲夫定藥企IPO文件里還提到中國(guó)和俄羅斯兩個(gè)試驗(yàn)。中國(guó)計(jì)劃招募342人，俄羅斯計(jì)劃招募314人。

這些試驗(yàn)的主要終點(diǎn)不一，中國(guó)的是載毒量下降，俄羅斯與巴西是癥狀緩解。可是無(wú)論什么終點(diǎn)，如此少的計(jì)劃招募人數(shù)非常詭異。

有人可能會(huì)說(shuō)，管它招募多少人，最后有效性指標(biāo)——臨床試驗(yàn)終點(diǎn)能做出統(tǒng)計(jì)意義上的區(qū)別不就行了？可在非常少的招募人數(shù)下做出顯著差異，意味著藥效要非常好，這樣用藥組與安慰劑組才能拉開(kāi)足夠的差距。但前瞻性的三期臨床試驗(yàn)，試驗(yàn)完成前——包括設(shè)計(jì)試驗(yàn)的時(shí)候，沒(méi)人知道藥效有多高。試驗(yàn)人數(shù)的確定，一般是在希望能有多大概率（統(tǒng)計(jì)檢驗(yàn)功效）確認(rèn)至少多高的有效性，這一基礎(chǔ)上去推算。

比如新冠疫苗的試驗(yàn)，假設(shè)希望試驗(yàn)?zāi)苡?0%的把握確認(rèn)一個(gè)50%有效性的疫苗，可以回推需要多少病例，再根據(jù)一些感染率假設(shè)，推算應(yīng)招募多少人以及試驗(yàn)需要做多久。

新冠藥物在試驗(yàn)設(shè)計(jì)階段，覺(jué)得只要招募三百多人就能確定有效性幾乎是匪夷所思。參考輝瑞與默克口服藥。在輕到中癥的高危人群三期臨床，輝瑞計(jì)劃招募約3000人，希望有1700人有數(shù)據(jù)做主要分析，默克計(jì)劃招募1550人[3-4]。這些都是基于希望有足夠的統(tǒng)計(jì)檢驗(yàn)功效去檢測(cè)50%降低重癥風(fēng)險(xiǎn)，演算出來(lái)的需要的樣本量大小。最后兩家實(shí)際分析的數(shù)據(jù)量分別有2200多人與1400多人。

即使說(shuō)這兩個(gè)藥檢測(cè)的降低重癥風(fēng)險(xiǎn)與阿茲夫定的臨床試驗(yàn)終點(diǎn)不同，那參考輝瑞口服藥在低危人群的EPIC-SR試驗(yàn)，這里主要重點(diǎn)是癥狀持續(xù)改善，也招募了1440人[5]。國(guó)內(nèi)新冠單抗藥Brii-196/198，參與NIH的ACTIV-2試驗(yàn)，確認(rèn)有效性是用藥組418人，安慰劑組419人[6]。

為什么阿茲夫定的研發(fā)方認(rèn)為300多人的試驗(yàn)就能驗(yàn)證藥物有效性？同行都是計(jì)劃招募一兩千人明確有效性時(shí)，有人卻不斷設(shè)計(jì)300多人的臨床試驗(yàn)，甚至改到180人后能繼續(xù)做出所謂的有效性，這值得警惕。

5. 遠(yuǎn)離渣藥

前文屢次提到阿茲夫定巴西臨床試驗(yàn)的兩篇論文不嚴(yán)謹(jǐn)程度令我震撼，現(xiàn)在就揭曉最讓我震撼的一點(diǎn)——是的，就算有怎么都讓我想不明白的轉(zhuǎn)陰時(shí)間，還有更震撼的：

這張截圖是巴西中癥那個(gè)臨床試驗(yàn)里的補(bǔ)充材料里截出來(lái)的。為什么讓我震撼，看一下圖里上半部分那個(gè)表，里面的人數(shù)，阿茲夫定組143人，安慰劑組138人。我們說(shuō)了中癥這個(gè)試驗(yàn)總共才180人入組，怎么會(huì)有這么多人？這個(gè)人數(shù)其實(shí)是輕癥那個(gè)試驗(yàn)里的分組人數(shù)，第二個(gè)表格里阿茲夫定91人，安慰劑88人才是中癥的分組人數(shù)。

牛吧，兩篇論文居然數(shù)據(jù)能混到一起去。搞得我讀著讀著總覺(jué)得自己眼睛是不是花了。這到底是簡(jiǎn)單筆誤，還是整個(gè)數(shù)據(jù)都弄錯(cuò)了呢？咱也不好說(shuō)，反正第一張表里顯示的阿茲夫定組平均發(fā)燒天數(shù)更短也是作為有效性之一在論文里提出來(lái)的。但都是這樣的嚴(yán)謹(jǐn)程度，還值得相信嗎？

不過(guò)阿茲夫定牛就牛在，別人都要幾千人才能做出有效性，它堅(jiān)持幾百人解決問(wèn)題；別人試驗(yàn)受試者招不滿，一般都是失敗告終，它能減員做出“有效性”；別人錯(cuò)過(guò)了主要終點(diǎn)，都是灰頭土臉，它能理直氣壯說(shuō)安全有效。難怪引得國(guó)內(nèi)多位權(quán)威專家競(jìng)折腰，不信看新聞稿：

就好像有人明確地非常渣，卻偏偏有很多人還要圍著他轉(zhuǎn)。這里面可能有各種原因，比如人家有錢，有權(quán)，有特長(zhǎng)?？蓡?wèn)題是，不論別人為何折腰，你有必要也去被人家渣嗎，也去做韭菜被人割嗎？

新冠是一個(gè)自限性疾病，絕大多數(shù)人不需要任何藥物就能自愈。即便是高危人群，能起幫助的也是真實(shí)有效的藥物，而不是沒(méi)藥非硬拉一個(gè)出來(lái)吃。

記?。哼h(yuǎn)離渣藥保平安。

參考資料：

https://www.researchsquare.com/article/rs-2273694/v1

https://www.researchsquare.com/article/rs-2273657/v1

https://www1.hkexnews.hk/app/sehk/2022/104646/documents/sehk22080402059.pdf

https://www.nejm.org/doi/full/10.1056/NEJMoa2118542

https://www.nejm.org/doi/full/10.1056/NEJMoa2116044

https://clinicaltrials.gov/ct2/show/record/NCT05011513

https://www.briibio.com/news-detail.php?id=354

關(guān)鍵詞：阿茲夫定臨床試驗(yàn) 新冠特效藥新冠口服藥 2019冠狀病毒病

世界百事通！分析阿茲夫定的臨床試驗(yàn)數(shù)據(jù)：一個(gè)打死不冤的偽新冠特效藥

世界百事通！分析阿茲夫定的臨床試驗(yàn)數(shù)據(jù)：一個(gè)打死不冤的偽新冠特效藥