【佳學基因檢測】語言障礙、說話障礙、說話能力差的基因檢測
佳學基因為什么要推出語言障礙基因檢測項目?
孩子在生命早期學習和使用語言的能力,常被認為是人類進化的核心特征之一。兒童在成長過程中,會迅速發(fā)展出理解和表達語言的能力,他們能掌握并運用看似復雜的形態(tài)學、音系學和句法規(guī)則,同時理解詞義與語用。大多數兒童會在學齡期間以相對有序的方式持續(xù)發(fā)展語言能力,但也有一些兒童在語言學習上難以跟上同齡人的步伐。
在中國,有超過7%的學齡兒童符合發(fā)展性語言障礙(Developmental Language Disorder, DLD)的診斷標準。DLD 指的是兒童的語言能力明顯低于同齡人,已對其日常功能產生影響,且無法通過其他醫(yī)學診斷來解釋。若兒童的語言問題已經對其生活產生實質影響,則可診斷為“語言障礙”。如果這種語言障礙與某種醫(yī)學狀況有關,則稱為“與X醫(yī)學狀況相關的語言障礙”;而若不存在可解釋的醫(yī)學問題,則兒童可被診斷為 DLD,此時會在診斷中加入次級描述,用以表明伴隨的其他癥狀或特定困難領域(如語音困難)。按照這個定義,平均每個教室里至少會有兩名兒童符合 DLD 的診斷標準。
語言障礙對人的一生影響深遠:交流能力的缺陷會干擾其社會、情感及教育的發(fā)展。這些障礙會顯著增加個體患行為障礙的風險,并可能最終導致成年后的失業(yè)及心理健康問題。盡管語言障礙在社會和經濟層面造成的負擔極大,人們對其生物學基礎的認識卻仍非常有限。迄今為止,佳學基因在《人的基因序列變與疾病表征》中已描述超過三十個與言語或語言障礙相關的基因,但這些發(fā)現(xiàn)僅能解釋部分 DLD 個案的基因原因。
在語言障礙領域,表型定義的局限性是造成其遺傳證據薄弱的重要原因之一。這一問題又因缺乏國際統(tǒng)一的診斷標準和金標準測試而加劇,導致各研究之間存在高度異質性,難以進行結果的直接比較或復制研究。這種異質性限制了樣本量的積累,從而進一步妨礙了對遺傳發(fā)現(xiàn)的驗證。因此,與其他神經發(fā)育障礙(如自閉癥譜系障礙、智力障礙和注意力缺陷多動障礙)相比,語言障礙的遺傳機制研究進展明顯滯后。
在《語言障礙、說話障礙、說話能力差的基因檢測》中,佳學基因將探討語言障礙當前的遺傳學研究現(xiàn)狀,并說明單基因疾病與復雜遺傳疾病之間的界限正逐漸模糊。佳學基因也將介紹近期全球在統(tǒng)一診斷標準方面的努力,這些進展顯著擴大了研究樣本量,使得跨隊列的大規(guī)模薈萃分析成為可能,進而推動了越來越多相關遺傳位點的發(fā)現(xiàn)。
什么樣的人應當做語言障礙基因檢測?
“特發(fā)性語言障礙”的歷史術語包括“特異性語言障礙(SLI)”,而近年來則更常使用“發(fā)展性語言障礙(DLD)”這一術語。SLI 一詞曾用于描述那些在語言能力方面落后于非語言智力發(fā)展的兒童,但其原因無法通過已知醫(yī)學因素解釋。然而,SLI 的診斷標準在國際上從未形成統(tǒng)一的共識,尤其是在語言缺陷的具體定義及非語言智力的界定方面。
在以往文獻中,SLI 的常用診斷標準是:語言測評得分低于平均值1.25個標準差以下,且表現(xiàn)性智商(Performance IQ)在85分或以上。與之相比,ICD-10中對 SLI 的診斷要求為語言能力低于平均值2個標準差,且至少比非語言智力低1個標準差。然而在實際研究中,所采用的診斷閾值標準差異巨大。為了解決術語與診斷標準缺乏統(tǒng)一的問題,CATALISE 研究團隊通過德爾菲共識研究,建議使用“發(fā)展性語言障礙(DLD)”這一更具包容性的術語來指代特發(fā)性語言障礙。
CATALISE 的研究還對 DLD 的定義進行了重要的重新界定,承認其可能伴隨其他醫(yī)學狀況——這是以往 SLI 定義中所忽視的。醫(yī)學共病在神經發(fā)育障礙中極為常見。DLD 與其他發(fā)育性障礙的共病率也很高,包括語音障礙(共病率為11%–77%,或40.8%)以及讀寫障礙如誦讀困難癥(共病率為17%–29%),這些共病情況提示其之間可能存在共同的病因。
患有 DLD 的兒童通常在早期語言發(fā)展階段就表現(xiàn)出延遲,例如:第一次開口說話的年齡、雙詞組句子的使用時間、以及句子結構的產生等方面落后于同齡人。進入小學階段后,這些兒童在語言理解與表達能力方面的表現(xiàn)明顯低于同齡人,具體體現(xiàn)在詞匯量、語法使用、語用功能以及識字能力等多個方面。
目前認為,遺傳和環(huán)境風險因素及保護因素共同影響兒童語言能力的發(fā)展軌跡。例如,母親的受教育水平及家庭社會經濟地位均被認為是語言發(fā)展的預測因子。正是由于遺傳與環(huán)境的交互作用,DLD 群體在表型上呈現(xiàn)出高度的異質性。
語言障礙的遺傳學
早在 1995 年,Bishop 等人的研究首次顯示語言障礙(當時稱為 SLI)具有顯著的遺傳基礎。他們發(fā)現(xiàn)同卵雙胞胎之間的共患率極高:一旦其中一人符合 SLI 診斷標準,幾乎所有的同胞也會表現(xiàn)出相同障礙。然而,后續(xù)研究對此提出不同看法,有研究估計 DLD/SLI 的遺傳率約為 18% ,顯示其高度遺傳性的結論可能并不絕對。Bishop 與 Hayiou-Thomas 于 2008 年的研究指出,遺傳率的估算受研究樣本獲取方式影響極大:如果是臨床招募的雙胞胎樣本,其遺傳率可高達 0.97;而在人群篩查中發(fā)現(xiàn)的雙胞胎樣本中,遺傳率幾乎為零。這表明語言障礙的遺傳圖景可能比其他神經發(fā)育障礙(如自閉癥譜系障礙 ASD 或 注意缺陷/多動障礙 ADHD)更加復雜。值得注意的是,ASD 和 ADHD 的遺傳率估算一般約為 80%,但不同研究之間仍存在一定差異,具體數值受評估方式與受試年齡等因素影響。
Stromswold(1998)也發(fā)現(xiàn),若一級親屬中有人患有語言障礙,個體自身罹患語言障礙的風險也會顯著升高。Dale 等人(1998) 和 Spinath 等人(2004) 的研究表明,與一般語言能力相比,語言障礙的遺傳性更強,暗示在語言障礙與語言能力之間,遺傳因素所起的作用可能存在差異。
盡管大量研究支持語言障礙的遺傳基礎,但目前我們對其具體的遺傳機制以及這些遺傳變化與環(huán)境如何交互的理解仍相對有限。語言障礙的遺傳研究通常分為兩大類:單基因遺傳障礙,即 DNA 中的單一突變即可導致疾病;以及復雜遺傳障礙,即多個基因變異共同作用,并受到環(huán)境因素進一步影響,導致個體總體患病風險上升。值得一提的是,隨著我們對基因變異功能及其與環(huán)境交互的了解不斷深入,這兩類之間的界限也變得日益模糊。
傳統(tǒng)上,單基因障礙和復雜遺傳障礙的研究方法是截然不同的:前者多通過家系研究進行,而后者則依賴于群體中的遺傳關聯(lián)研究。佳學基因將對語言障礙領域中,通過這兩類方法所取得的關鍵發(fā)現(xiàn)進行綜述。
單基因型的言語與語言障礙
目前研究最深入、理解最透徹的語言障礙遺傳原因,是由單基因遺傳引起的罕見變異所致的障礙。單基因遺傳(意為“由一個基因決定”)是指某一特定疾病由一個基因的變異引起,該變異可能以隱性方式(兩個拷貝均受影響)或顯性方式(一個拷貝受影響即足以致病)遺傳。雖然存在顯性與隱性的語言障礙實例,但這些情況極其罕見,通常全世界僅有少數人受到某一特定遺傳變異影響,且常常是同一基因的不同變異形式。由于這類單基因變異在普通人群中極其稀少,攜帶者通常不到十萬分之一,有些變異甚至是首次在個體中發(fā)現(xiàn)的“新發(fā)變異”。這些變異會對其所編碼的蛋白質產生不良影響,進而在細胞層面引發(fā)功能障礙,導致特定的疾病表現(xiàn)。
FOXP2 基因 是最著名的單基因遺傳性語言障礙案例之一。在英國 KE 家族中,F(xiàn)OXP2 基因中的一個罕見致病變異導致兒童言語失用癥(CAS),這一病癥主要表現(xiàn)為言語所需運動編程與計劃能力受損。這種障礙被認為是獨立于其他語言障礙的特殊類型,屬于 DLD(發(fā)展性語言障礙)范疇下的一個子類。FOXP2 相關變異的研究已相對成熟,多表現(xiàn)為顯性遺傳:攜帶者會表現(xiàn)出癥狀,而未攜帶者則不受影響。攜帶致病 FOXP2 變異的個體通常表現(xiàn)出感知性與表達性語言困難,語言發(fā)育遲緩、言語不清晰,但其非語言智力多為正?;蚱退?。盡管存在特定的言語運動障礙,這些個體的整體運動能力,包括大運動與精細運動,通常是正常的。然而,F(xiàn)OXP2 變異極為罕見,僅占兒童言語失用癥(CAS)病例的約 2% ,目前并未發(fā)現(xiàn)其與其他類型的語言障礙相關。
FOXP2 的發(fā)現(xiàn)是語言與言語障礙研究的一個重大突破,為理解言語和語言的生物學基礎提供了窗口。FOXP2 是一種轉錄因子,調控多個在多種生物過程中的關鍵基因。通過研究 FOXP2 的下游調控網絡,研究者進一步發(fā)現(xiàn)了如 CNTNAP2 與 FOXP1 等關鍵作用基因。
近年來,隨著測序技術的發(fā)展以及人群層面遺傳變異數據庫的建立,識別致病基因的方法也發(fā)生了根本變化。如今,研究者更傾向于使用全外顯子組或全基因組測序技術,一次性對所有基因進行全面分析,而不是只集中于候選基因研究。一個典型例子是 Chen 等人(2017)的研究:他們對 43 名診斷為嚴重 SLI 的個體進行全外顯子測序,發(fā)現(xiàn)了 ERC1、GRIN2A 和 SRPX2 三個基因中的變異完全可以解釋這些個體的語言困難,并首次識別出一系列此前主要與其他神經發(fā)育障礙相關的候選基因(詳見表1)。
以下是“表 1:單基因型特發(fā)性言語障礙(如 CAS)及語言障礙的致病基因概述”的中文翻譯及表格呈現(xiàn)
基因 | 突變類型 | 表型 | 基因解碼者 |
---|---|---|---|
ATP2C2 | 缺失(del) | DLD(發(fā)展性語言障礙) | Smith 等(2015) |
BCL11A | 缺失(del) | CAS(兒童言語失用癥) | Peter 等(2014) |
BUD13 | — | SLI(特異性語言障礙) | Andres 等(2022),Soblet 等(2018) |
CDK13 | — | CAS | Hildebrand 等(2020) |
CHD3 | — | DLD/CAS,Snijders Blok-Campeau 綜合征 | Eising 等(2018),Snijders Blok 等(2018) |
CNTNAP2 | — | DLD | Worthey 等(2013) |
DDX3X | — | CAS | Hildebrand 等(2020) |
EBF3 | — | CAS | Hildebrand 等(2020) |
ERC1 | — | CAS | Chen 等(2017),Thevenon 等(2013) |
FOXP1 | — | CAS | Hamdan 等(2010),Horn 等(2010),Sollis 等(2015),Srivastava 等(2014),Le Fevre 等(2013) |
FOXP2 | 含缺失(del) | CAS | Lai 等(2001),MacDermot 等(2005),Reuter 等(2017),Moralli 等(2015),Turner 等(2013),Tomblin 等(2009) |
GNAO1 | — | CAS | Hildebrand 等(2020) |
GNB1 | — | CAS | Hildebrand 等(2020) |
GRIN2A | — | DLD 與癲癇(有無智力障礙) | Chen 等(2017),Carvill 等(2013),Endele 等(2010),Turner 等(2015) |
KAT6A | — | CAS | Eising 等(2018) |
KANSL1 | 缺失(del) | CAS | Morgan 等(2017) |
MEIS2 | — | CAS | Hildebrand 等(2020) |
NFXL1 | — | DLD | Villanueva 等(2015) |
POGZ | — | CAS | Hildebrand 等(2020) |
SETBP1 | — | CAS | Eising 等(2018),Hildebrand 等(2020),Kornilov 等(2016),Morgan 等(2021) |
SETD1A | — | CAS | Eising 等(2018) |
SRPX2 | — | DLD,伴有 Rolanic 癲癇 | Chen 等(2017) |
TM4SF20 | 缺失(del) | DLD | Wiszniewski 等(2013) |
TNRC6B | — | CAS | Eising 等(2018) |
UPF2 | — | CAS | Hildebrand 等(2020) |
WDR5 | — | CAS | Hildebrand 等(2020) |
ZFHX4 | — | CAS | Hildebrand 等(2020) |
ZNF142 | — | CAS | Hildebrand 等(2020) |
ZNF277 | 缺失(del) | SLI | Ceroni 等(2014) |
目前,關于特異性語言障礙(SLI,現(xiàn)稱發(fā)展性語言障礙 DLD)的進一步基因測序研究仍然有限,盡管在嚴重語音障礙領域,尤其是通常伴隨語言障礙發(fā)生的兒童言語失用癥(CAS)方面,已有更多進展。Eising 等人(2019)對 19 名 CAS 患兒應用了新生突變(de novo)范式進行研究。該范式指患兒攜帶一個自發(fā)產生的顯性遺傳變異,而該變異未從父母任何一方遺傳而來。他們在 CHD3、SETD1A 和 WDR5 基因中檢測到了罕見的新生突變變異。
其中,CHD3 基因的重要性已在一項對 34 名攜帶該基因變異個體的大型研究中得到了確認。該基因的功能缺失性變異會導致伴隨大頭畸形(macrocephaly)和嚴重神經發(fā)育障礙的語言與言語缺陷,這一綜合征被稱為 Snijders Blok-Campeau 綜合征。已有研究顯示 CHD3 可與 FOXP2 蛋白相互作用,表明這些基因可能存在共享的分子通路。正如 FOXP2、CNTNAP2 與 FOXP1 所體現(xiàn)的,研究基因之間的共通機制是發(fā)現(xiàn)新致病基因的重要方向。事實上,Eising 等人(2019)正是基于大腦發(fā)育中的共享通路,進一步鑒定出另外五個 CAS 候選基因:KAT6A、SETBP1、ZFHX4、TNRC6B 和 MKL2。
更近期,Hildebrand 等人(2020)對 33 名 CAS 兒童(其中包括一對雙胞胎)的 DNA 進行研究,在其中 11 名患兒中發(fā)現(xiàn)了致病性變異,這些變異涉及 CDK13、EBF3、GNAO1、GNB1、DDX3X、MEIS2、POGZ、SETBP1、UPF2 和 ZNF142 等 10 個基因,以及 5q14.3q21.1 區(qū)段的缺失。這意味著,約三分之一的 CAS 兒童可能攜帶導致其言語障礙的致病性變異。其中 SETBP1 早前已在一個俄國孤立人群中被報道與 SLI 高發(fā)相關。在變異罕見且個案稀少的研究背景下,跨研究重復驗證結果對于建立某基因在語言障礙中的作用證據至關重要。像 Kornilov 等人(2016)所研究的孤立人群,有助于通過家族聚集現(xiàn)象識別特定表型的起源變異。
最近,Morgan 等人(2021)在一組攜帶 SETBP1 變異的兒童中采用了反向表型分析方法,驗證了該基因與言語及語言功能的相關性,并進一步指出其影響語言的方式不同于對其他技能的影響。盡管 Eising 等人(2019)與 Hildebrand 等人(2020)的研究是基于 CAS 患兒篩選而來,但由于大多數 CAS 兒童同時也存在表達性和/或理解性語言障礙,因此這些研究對探討語言障礙的遺傳機制同樣具有重要意義。
另一個使用家族結構成功識別致病變異的優(yōu)秀例子是 NFXL1 基因的發(fā)現(xiàn)。該基因在 魯濱遜·克魯索島人群中的 DLD 患者中被鑒定出來。這類研究通過利用族群歷史,選取更可能攜帶高效應遺傳變異的個體群體,從而提高發(fā)現(xiàn)幾率。
最后,Andres 等人(2021)最近報告稱,在多個無親屬關系的加拿大家庭中,BUD13 被鑒定為一種具有大效應量的罕見變異,每個家庭中至少一人符合 SLI 的診斷標準。該基因也被納入表 1,總結了目前已知的與單基因型 DLD 相關的基因。
此外,還有許多與言語和語言相關的基因被識別出來,但它們通常是更廣泛綜合征的一部分,或作為非特異性、繼發(fā)性表型出現(xiàn)。例如一項最新研究發(fā)現(xiàn),在攜帶 SATB1 致病變異的 42 名個體中,存在包括智力障礙、發(fā)育遲緩和運動困難等神經系統(tǒng)癥狀。盡管該綜合征主要歸類為智力障礙,但其中 89% 的患者同時存在語言障礙。
拷貝數變異(Copy Number Variants, CNVs)
拷貝數變異(CNVs)指的是基因組中某些區(qū)域的缺失或重復,其范圍可以從幾百個堿基對延伸到整條染色體臂。每個人的基因組中都攜帶有許多 CNV,其中一些是從父母遺傳而來,另一些則是新生突變(de novo)。這些 CNV 中,有些對個體生物學影響甚微,可被人體耐受;而另一些則可能導致疾病。因此,單個 CNV 的具體影響往往較難確定,通常取決于其所影響的基因。
某些 CNV 會產生嚴重影響,導致明確的遺傳疾病。一些微缺失或微重復綜合征會影響到整體的神經發(fā)育,而另一些則被證實與語言障礙有關。例如,染色體 16p11 的缺失已被證實與一種高外顯率(penetrant)的 CAS(兒童言語失用癥)有關。
跨越 FOXP2 基因的 CNV 會不可避免地導致 CAS 表型,這是因為它們會破壞該關鍵基因的功能,其作用機制與前述的單基因變異相似。此外,一些 CNV 在個案研究中被首次報道,進而推動了新的候選基因的發(fā)現(xiàn),如 BCL11A、ERC1和 SEMA6D,這些基因后續(xù)都通過基因測序研究得到了驗證。
Morgan 等人(2017)指出,由 17q21.31 區(qū)段微缺失或 KANSL1 基因變異導致的 Koolen de Vries 綜合征患者通常表現(xiàn)出 CAS 及構音障礙(dysarthria)。繪制缺失和重復區(qū)域的位置圖是研究發(fā)展性語言障礙(DLD)的一種經典基因定位方法。
與稀有變異類似,CNV 也被廣泛認為與各種發(fā)育性障礙有關,包括自閉癥、智力障礙和 注意力缺陷多動障礙(ADHD)。研究發(fā)現(xiàn),CNV 負擔(burden)——即個體所攜帶 CNV 的數量及其在基因組中所覆蓋的總長度——在 DLD 中也起到一定作用。Simpson 等人(2015)發(fā)現(xiàn),DLD 個體及其未受影響的親屬中,CNV 負擔更高;但他們也指出,最關鍵的因素是 CNV 所影響的具體基因。Kalnak 等人(2018)的研究也發(fā)現(xiàn),與正常發(fā)育兒童相比,DLD 個體攜帶更多且更大的稀有 CNV。
常見遺傳模型
單基因致病機制在語言障礙中的作用仍較為罕見,且無法完全解釋 發(fā)展性語言障礙(DLD)超過 7% 的患病率。目前普遍認為,常見的遺傳風險變異對 DLD 的易感性具有顯著影響。這種遺傳模式被稱為“復雜遺傳模型”,其特點是每一個變異對患病風險的貢獻較小,但多個變異的累積效應可顯著提高患語言障礙的概率。
為識別這種復雜遺傳模型中的風險變異,研究通常采用兩種主要方法:連鎖分析(linkage studies)和全基因組關聯(lián)研究(GWAS,genome-wide association studies)。
連鎖分析通過尋找表型相似的個體(有時為親屬)間共用的染色體區(qū)域,從而定位可能的致病基因。相比之下,GWAS 通過檢測整個基因組中高密度的遺傳標記,識別在病例中顯著多見而在健康對照中較少見的變異。兩種方法都基于相同的假設:即疾病的發(fā)生是由于少數共享變異的影響,且參與研究的個體在遺傳上較為相似,通常意味著他們來自相同的族群或種族背景。
連鎖分析
在 2000 年代,通過遺傳連鎖分析識別受影響個體間共用的基因組區(qū)域,曾是神經發(fā)育遺傳學研究的核心方法。作為檢測常見變異的主要手段,連鎖研究推動了許多關鍵發(fā)現(xiàn),有助于揭示復雜疾病的遺傳機制。該方法特別適用于檢測在超過 10% 人群中存在的、具有中等或較大效應的常見遺傳變異。
特異性語言障礙聯(lián)盟(SLIC)通過連鎖分析發(fā)現(xiàn)了兩個與特異性語言障礙(SLI)高度相關的基因組區(qū)域:16q24(命名為 SLI1)和19q13(命名為 SLI2) (見表 2)。對這些區(qū)域的進一步精細定位發(fā)現(xiàn)了兩個具體基因:CMIP(C-mad誘導蛋白)和ATP2C2(鈣轉運 ATP 酶 2C 型成員 2) 。
研究表明,CMIP 和 ATP2C2 都含有具有中等效應的常見風險變異,此外,在語言障礙的單基因病例中也發(fā)現(xiàn)了這兩個基因的變異。Newbury 等人(2009)發(fā)現(xiàn),CMIP 與語言、閱讀和拼寫能力相關,無論是在 SLI 患者群體還是在一般人群中均表現(xiàn)出相關性,這可能意味著 CMIP 對語言能力中的語音技能具有普遍影響。相比之下,ATP2C2 在 SLI 患者中與語音記憶有關,但在普通人群中,僅在語言障礙者中表現(xiàn)出顯著關聯(lián),這提示其可能對具有語言障礙的個體具有更專一的影響。
最近,Martinelli 等人(2021) 對 ATP2C2 中的一個稀有變異進行了功能分析,進一步揭示了該基因在語言障礙中的作用。
表2:語言障礙全基因組關聯(lián)研究結果摘要
研究 | 樣本數量 | 隊列類型 | 相關染色體 |
---|---|---|---|
Luciano 等人 (2013) | 約 6500 | 普通人群 | 21 |
Eicher 等人 (2013) | 約 170 | 精選的閱讀和語言障礙者 | 3、4、13 |
Nudel 等人 (2014) | 約 250 | 精選隊列(父源效應) | 5、14 |
St Pourcain 等人 (2014) | 約 10,000 | 普通人群 | 3 |
Gialluisi 等人 (2014) | 約 1800 | 精選的閱讀和語言障礙者 | 7、21 |
Harlaar 等人 (2014) | 約 2000 | 普通人群 | 2、10 |
Kornilov 等人 (2016) | 約 400 | 隔離人群 | 9、21 |
Eising 等人 (2021) | 33,959 | 精選與普通人群混合;對19個隊列的薈萃分析 | 1 |
Doust 等人 (2021) | 51,800 讀寫障礙病例,1,087,070 對照 | 精選與普通人群混合;基于自報讀寫障礙的二分類薈萃分析 | 1、2、3、6、7、11、17、X |
Bartlett等(2002)的研究發(fā)現(xiàn),閱讀能力特異性指標與染色體區(qū)域13q21(SLI3)存在顯著關聯(lián),而更一般的語言發(fā)育遲緩指標則與2p22和17q23區(qū)域存在較弱關聯(lián)。該研究基于五個加拿大大家系的家族連鎖分析,這些家系中多名成員被診斷為特異性語言障礙(SLI)。Evans等(2015)通過對147對同胞(至少一人診斷為SLI)的研究,發(fā)現(xiàn)10q23.33和13q33.3兩個區(qū)域與語音記憶功能相關。
需要指出的是,這些研究中大部分尚未明確具體的致病基因及其變異位點。這本質上是連鎖研究的固有局限——該方法通常只能定位包含數百個基因的廣闊染色體區(qū)段,難以實現(xiàn)精細定位。
隨著樣本量的擴大和群體基因組數據的普及,除大家系或高度同源人群研究外,全基因組關聯(lián)研究(GWAS)已逐步取代連鎖分析。GWAS能提供更高精度的變異檢測,更高效地實現(xiàn)致病位點的精細定位。例如Andres等(2019)通過連鎖分析,在14個近親通婚的巴基斯坦家系(共156人)中確定了與SLI相關的2q染色體區(qū)域。
連鎖研究結果在不同人群中的可重復性較差,各研究間罕有重疊發(fā)現(xiàn)。這是因為在無親緣關系的個體中,語言障礙風險通常由多基因微效變異共同作用,而連鎖分析的前提假設是存在少數大效應變異。這種根本差異導致其檢測遺傳信號的效力不足,必須通過更大樣本量和GWAS研究來解決。
全基因組關聯(lián)研究
當前檢測復雜疾病相關基因組變異的金標準方法是全基因組關聯(lián)研究(GWAS)。該技術利用基因標記技術的進步,可同步評估全基因組超過400萬個已知常見變異位點,提供更高分辨率的檢測能力。除檢測位點數量激增外,研究樣本量也提升至數萬甚至數十萬規(guī)模。精神病遺傳學領域的里程碑研究曾通過對37,000例精神分裂癥患者和113,000名健康對照的分析,鑒定出100多個相關基因組區(qū)域。而針對發(fā)展性語言障礙(DLD)及語言相關表型的研究,近期才逐步達到相近樣本量規(guī)模(表2)。目前已開展的多項SLI/DLD相關GWAS研究及其發(fā)現(xiàn)的基因組區(qū)域匯總于表2。
與前一章節(jié)所述連鎖研究類似,不同GWAS研究發(fā)現(xiàn)的關聯(lián)基因組區(qū)域一致性較低。這一現(xiàn)象部分源于各研究采用的表型評估標準差異——DLD診斷缺乏穩(wěn)健的共識標準加劇了該問題;另一方面,DLD的遺傳病因學本質涉及眾多基因中大量微效變異(及環(huán)境因素)的協(xié)同作用。
最近兩項研究通過薈萃分析整合多個GWAS隊列數據。這種"meta-GWAS"方法通過合并中等規(guī)模隊列的GWAS匯總統(tǒng)計量來提升檢驗效能,是極具成本效益的基因識別策略。Eising等(2021)整合22個隊列數據,分析五項指標:單詞閱讀、非詞閱讀、拼寫、音素意識和非詞拼寫。在19個隊列(33,959人)的子集中發(fā)現(xiàn)rs11208009變異與單詞閱讀相關。該變異位于基因間區(qū),但鄰近(并與存在連鎖不平衡)三個候選基因:DOCK7、ANGPTL3和USP1。研究進一步證實閱讀與語言特征的遺傳基礎與操作智商存在顯著分離。
Doust等(2021)則利用23andMe平臺數據,納入51,800名自報閱讀障礙的成人及超百萬對照,鑒定出42個與閱讀障礙診斷相關的基因組區(qū)域。其中17個區(qū)域既往被發(fā)現(xiàn)與教育程度或認知能力相關,25個為新發(fā)現(xiàn)區(qū)域。值得注意的是,這些研究在樣本量與表型信息精度間存在權衡——診斷僅基于"是/否"自報問卷。
Eising(2021)和Doust(2021)的研究標志著DLD遺傳機制認知的重大突破,現(xiàn)有樣本量已能檢測部分"失蹤遺傳力"。隨著候選基因列表擴展,我們對DLD風險的生物學認知不斷深化。通過構建多基因風險評分(整合與表型相關的所有風險等位基因),可捕捉神經發(fā)育障礙間的遺傳異同。初步研究顯示該領域前景廣闊:認知能力、教育程度、語言發(fā)展和心理社會結局間存在共享遺傳效應。隨著大型GWAS匯總統(tǒng)計量的持續(xù)更新,多基因評分的敏感性與特異性將不斷提升。例如教育程度的多基因評分解釋率已從最初的2%提升至13%。該方法正在語言障礙和閱讀障礙領域推廣應用。臨床實踐表明,多基因風險評分對攜帶極端風險/保護性變異負荷的群體最具指導價值,即使對中間分布個體區(qū)分有限,仍具有臨床意義。
遺傳力缺失之謎
常見變異模型與單基因遺傳模型僅能部分解釋語言障礙的遺傳機制,這一未解難題被稱為"遺傳力缺失",反映了當前對遺傳差異如何導致語言障礙的認知缺口。以下三個研究方向可能為揭示語言障礙的生物學基礎提供突破性進展:
基因-基因互作(上位效應)
當兩個獨立遺傳變異協(xié)同作用導致特定表型時,稱為基因-基因互作(又稱上位效應)。這種互作可視為修飾因子或"二次打擊"。雖然目前尚無直接研究證實其在語言障礙中的作用,但已知其在其他神經發(fā)育疾病中起關鍵作用。閱讀障礙領域已發(fā)現(xiàn)多例基因互作影響閱讀相關特征的證據,這為語言障礙可能存在類似機制提供了佐證。
基因-環(huán)境互作
該機制指遺傳變異與環(huán)境因素相互作用產生特定表型。閱讀障礙研究已發(fā)現(xiàn)典型案例:社會經濟地位、母親吸煙、低出生體重等環(huán)境因素與DYX1C1基因存在互作。未來研究可能揭示不同組織類型及發(fā)育階段中差異化的基因-環(huán)境互作模式。
表觀遺傳調控
表觀遺傳通過DNA甲基化和組蛋白修飾等機制調控基因表達。雖然多個研究團隊提出表觀遺傳可能參與DLD發(fā)生,但尚未發(fā)現(xiàn)明確關聯(lián)證據。Marioni等(2018)在普通成年人群中發(fā)現(xiàn)INPP5A基因的特定甲基化標記與語言流暢性、邏輯記憶和詞匯量相關(但需謹慎解讀)。其他領域證據表明,部分產前表觀遺傳變化可終生持續(xù),其中某些變化可能與早期腦發(fā)育相關。
隨著特定基因和通路的逐步明確,這三個方向將極大推動未來研究進展。
發(fā)展性語言障礙遺傳研究中的表型分析問題
發(fā)展性語言障礙(DLD)在命名學上的歷史變遷及診斷標準缺乏共識,導致探究該疾病遺傳結構的研究采用了多樣化的表型分析方法。表3總結了SLI/DLD關鍵遺傳研究中表型納入標準的主要差異。這種差異性使得不同遺傳研究間的結果比較與重復驗證面臨挑戰(zhàn),同時也阻礙了研究隊列的合并以擴大樣本量,從而難以開展具有足夠統(tǒng)計效力的薈萃分析。
明確定義的語言障礙診斷標準是DLD遺傳研究方法學設計中的關鍵環(huán)節(jié)。下文將詳細闡述該領域迄今采用的遺傳分析方法。
表3. DLD/SLI關鍵研究的表型納入標準匯總
作者及年份 | 研究類型 | 診斷術語 | 納入標準 | 排除標準 |
---|---|---|---|---|
Bishop等 (1995) | 雙生子研究 | SLI |
語言:DSR-III-R標準:語言測量標準分≤80;四項語言測量中至少一項顯著受損 認知:非言語IQ與語言測量分差≥20分 |
智力殘疾;自閉癥譜系障礙(ASD);感音神經性耳聾(SNHL);構音器官結構異常;嚴重視力障礙;醫(yī)學綜合征;英語非母語者(EAL) |
Bartlett等 (2002) | 連鎖分析 | SLI |
語言:口語商數(SLQ)標準分≤85 認知:操作IQ≥80且操作IQ≥SLQ |
聽力障礙;影響言語或非言語構音運動的運動障礙或口腔結構異常;ASD、精神分裂癥、精神病或神經系統(tǒng)疾病診斷 |
Falcaro等 (2008) | 連鎖分析 | SLI |
語言:縱向研究中至少一個時間點語言標準分≤1SD+在英國語言治療機構接受治療 認知:操作IQ≥80 |
感音神經性耳聾;英語非母語者;可能影響語言的醫(yī)學狀況;ASD診斷 |
Newbury等 (2009) | 連鎖分析 | SLI |
語言:CELF-R表達或接受分≥1.5SD低于常模均值 認知:操作IQ≥80 |
單卵雙生;需多次住院治療的慢性疾?。欢@;ICD-10/DSM-IV兒童自閉癥診斷;英語非母語者;地方政府監(jiān)護;已知神經系統(tǒng)疾病 |
Villanueva等 (2011) | GWAS | SLI |
語言:語音、表達和接受形態(tài)句法在TEPROSIF或多倫多西班牙語語法探索測試中≥2SD低于人群均值 認知:操作IQ>80百分位 |
聽力障礙;口腔運動或結構異常;ASD、情緒障礙或神經系統(tǒng)疾病 |
Luciano等 (2013) | GWAS(人群) | 人群語言定量 |
語言:基于非詞重復任務確定低語言能力人群 認知:- |
- |
Eicher等 (2013) | GWAS | 語言障礙(±閱讀障礙) |
語言:三項語言任務(音素刪除、言語理解、非詞重復)中≥兩項z分數≤-1 認知:IQ≥76 |
- |
Gialluisi等 (2014) | GWAS | 語言障礙(±閱讀障礙) |
語言:三個隊列不同標準:1.SLIC隊列CELF-R表達或接受分≥1.5SD;2.英國閱讀障礙診斷;3.科羅拉多學習障礙研究中心兩個數據集(基于閱讀障礙或ADHD診斷),語言分≥3SD樣本均值 認知:1.操作IQ≥80;2.閱讀IQ差異和/或IQ>90;3.全量表IQ≥70 |
1.單卵雙生等(同Newbury);2-3.≥3項標準分≥3SD |
Harlaar等 (2014) | GWAS(人群) | 人群語言定量 |
語言:基于認知測試中的接受性語言測量確定低語言能力 認知:- |
- |
St Pourcain等 (2014) | GWAS | 人群語言定量 |
語言:基于MCDI確定低語言能力 認知:- |
- |
Nudel等 (2014) | GWAS | SLI |
語言:CELF-R表達或接受分≥1.5SD 認知:操作IQ≥80 |
同Newbury標準 |
Evans等 (2015) | 連鎖分析 | 語言能力低下 |
語言:來自縱向語言研究,基于綜合語言、詞匯和句子使用三項得分計算總語言分 認知:操作IQ>70 |
- |
Kornilov等 (2016) | GWAS(隔離人群) | DLD |
語言:半結構化言語樣本分析中≥兩項定量表型z分數<-1 認知:- |
接受特殊教育的兒童 |
Devanna等 (2018) | 測序研究 | SLI |
語言:CELF-R表達或接受分≥1.5SD 認知:操作IQ≥80 |
同Newbury標準 |
Chen等 (2017) | 測序研究(SLIC隊列) | 重度SLI |
語言:CELF-R表達或接受分≥1.5SD 認知:操作IQ≥80 |
同Newbury標準 |
Andres等 (2019) | 連鎖分析與純合性定位 | SLI |
語言:PPVT-4標準分≤80+教師報告的SLI 認知:- |
已知發(fā)育障礙、聽力障礙、神經系統(tǒng)疾病 |
Andres等 (2022) | 測序研究 | SLI |
語言:年齡適配語言測試≥1.0SD低于均值 認知:3.6-6.11歲哥倫比亞心理成熟量表>85或兒童/成人韋氏智力測驗>85 |
已知發(fā)育障礙、聽力障礙、神經系統(tǒng)疾病 |
注:標研究使用SLIC隊列標準;ADHD=注意缺陷多動障礙;ASD=自閉癥譜系障礙;EAL=英語非母語者;HI=聽力障礙;IQ=智商;MCDI=麥克阿瑟-貝茨溝通發(fā)展量表;RD=閱讀障礙;SD=標準差;SNHL=感音神經性耳聾;SS=標準分*
佳學基因觀點
本文系統(tǒng)綜述了發(fā)展性語言障礙(DLD)及其遺傳病因學研究進展。遺傳關聯(lián)研究近期取得的突破性進展——主要得益于樣本量的大幅提升和薈萃分析方法的運用——標志著我們在解析DLD遺傳結構方面取得了實質性突破?,F(xiàn)代遺傳分析技術的進步使得更深入的基因通路研究成為可能。
研究現(xiàn)狀與挑戰(zhàn)
既往研究采用的納入標準存在顯著差異,這反映了SLI/DLD領域長期缺乏統(tǒng)一的定義和分類體系。為確保研究結果的可重復性,未來遺傳研究必須采用統(tǒng)一、精細化的表型分析標準。通過語言、言語和認知能力的多維深度表型分析,將有助于揭示候選基因與表型間的復雜交互機制。
未來研究方向
表觀遺傳調控、基因-基因互作及基因-環(huán)境交互作用極可能是導致DLD表型變異的關鍵因素,這將成為重點研究領域。值得注意的是:
-
表觀遺傳機制可能介導環(huán)境因素對語言發(fā)育的影響
-
多基因微效變異協(xié)同作用模式有待闡明
-
關鍵發(fā)育窗口期的環(huán)境暴露影響需縱向研究驗證
臨床轉化價值
深化DLD生物學機制認知具有重要臨床意義:
-
為早期診斷和遺傳咨詢提供科學依據
-
指導個體化干預方案的制定
-
推動靶向治療藥物的研發(fā)
-
最終改善DLD患者的長期預后
(責任編輯:佳學基因)