個人資料
正文

【Nature】生物圈問題有多大?希望也有多大。

(2022-09-30 06:06:45) 下一個

有一篇自然文章,可以說是振聾發聵。

Principal Component Analyses (PCA)-based findings in population genetic studies are highly biased and must be reevaluated

 

Principal Component Analysis (PCA) is a multivariate analysis that reduces the complexity of datasets while preserving data covariance. The outcome can be visualized on colorful scatterplots, ideally with only a minimal loss of information. PCA applications, implemented in well-cited packages like EIGENSOFT and PLINK, are extensively used as the foremost analyses in population genetics and related fields (e.g., animal and plant or medical genetics). PCA outcomes are used to shape study design, identify, and characterize individuals and populations, and draw historical and ethnobiological conclusions on origins, evolution, dispersion, and relatedness. The replicability crisis in science has prompted us to evaluate whether PCA results are reliable, robust, and replicable. We analyzed twelve common test cases using an intuitive color-based model alongside human population data. We demonstrate that PCA results can be artifacts of the data and can be easily manipulated to generate desired outcomes. PCA adjustment also yielded unfavorable outcomes in association studies. PCA results may not be reliable, robust, or replicable as the field assumes. Our findings raise concerns about the validity of results reported in the population genetics literature and related fields that place a disproportionate reliance upon PCA outcomes and the insights derived from them. We conclude that PCA may have a biasing role in genetic investigations and that 32,000-216,000 genetic studies should be reevaluated. An alternative mixed-admixture population genetic model is discussed.

 

主成分分析 (PCA) 是一種多元分析,可在保持數據協方差的同時降低數據集的複雜性。結果可以在彩色散點圖上可視化,理想情況下隻有最小的信息損失。 PCA 應用程序在 EIGENSOFT 和 PLINK 等被廣泛引用的軟件包中實施,被廣泛用作群體遺傳學和相關領域(例如,動物和植物或醫學遺傳學)中最重要的分析。 PCA 結果用於塑造研究設計、識別和表征個人和群體,並就起源、進化、分散和相關性得出曆史和民族生物學結論。科學中的可複製性危機促使我們評估 PCA 結果是否可靠、穩健和可複製。我們使用基於顏色的直觀模型和人口數據分析了 12 個常見測試用例。我們證明 PCA 結果可以是數據的產物,並且可以很容易地操縱以產生所需的結果。 PCA 調整也在關聯研究中產生了不利的結果。 PCA 結果可能不像該領域所假設的那樣可靠、穩健或可複製。我們的研究結果引起了人們對群體遺傳學文獻和相關領域中報告的結果的有效性的擔憂,這些領域過度依賴 PCA 結果和從中得出的見解。我們得出結論,PCA 可能在基因調查中具有偏倚作用,應重新評估 32,000-216,000 項基因研究。討論了另一種混合混合種群遺傳模型。

 

什麽意思,原來方法論這一步的漏洞太大,導致這個領域的所謂專家,可以近乎隨心所欲地生成自己傾向的結論。

 

還是那句話,在C19三年後,反權威主義終於開始起義。終於有人揭開蓋子。這是巨大的希望。是科學終於戰勝“科學家”的預兆。希望。

相信科學,是對科學的方法的嚴謹度的信賴,並不是要相信任何科學家,專家,權威的結論,包括任何權威機構的結論。

自稱科學本身的人就是最反科學的。

[ 打印 ]
閱讀 ()評論 (0)
評論
目前還沒有任何評論
登錄後才可評論.