|
相信有些小伙伴已經隱隱約約有聽說過UDI和UMI這兩個英文縮寫,但是一直沒搞清楚它們全名是啥?它們能干啥? |
|
|
|
|
|
在正文開始前,我們先來“揭秘”UDI和UMI的全稱: UDI的全稱為Unique Dual Index,譯為雙端不重復標簽技術。 UMI的全稱為Unique Molecular Identifier,譯為分子條形碼或者分子標簽技術。 別急,要弄清這兩個概念,還得從二代測序的那些事情說起: 我們都知道二代測序技術是近十年來曝光率非常高、非常受關注的基因組分析技術。以Illumina為代表的測序儀廠商不斷推出更新型號的測序儀,不斷刷新測序通量,但不變的仍是多樣本混合后測序的策略。 要實現對多個樣本同時測序,必須在各樣本PCR擴增階段,往核酸片段上添加一段分子序列作為樣本標簽,這種標簽叫做index。 |
|
|
|
這樣,每個樣本就帶上屬于它的“專屬號碼牌”,在多樣本混合測序后,生信工程師能通過“翻牌”,確定這個“號碼”所代表的就是“尋尋覓覓”的那個“它”。 |
|
|
|
Index一般由8位堿基所組成,常有單端與雙端兩種添加模式,為了增加同時上樣的通量,大家一般在面臨大量樣本同時測序時,會選擇雙端index↓ |
|
|
|
目前常用的雙端index策略是通過少數幾種index序列排列組合,去實現更多樣本的標簽區分(如96種),但這種方式一直存在交叉污染的可能。 |
|
|
|
同時,為了進一步提升通量與擴增效率,降低測序成本,Illumina為Novaseq等高通量型測序儀引入了圖案化流動槽(Patterned Flow Cell Technology,PFCT)和排他性擴增(Exclusion Amplification,ExAmp)成簇技術。這兩個看似美好的技術卻無意間放大了一種叫做標簽跳躍(index hopping)的樣本標簽錯配的現象,導致科研人員無法正確拆析樣本與數據的關系,終可能與重大發現“失之交臂”。 |
為了降低標簽跳躍,Illumina在可以使用UDI雙端特殊標簽對樣本進行標記,混樣后進行測序。 |
UDI的引入使得文庫兩端的index序列是不重復,一對一組合的,不存在共用。換句話說,只有兩端帶有*正確index序列的reads才能進入后續的樣本分析,從而可以剔除標簽錯配的reads,有效避免樣本之間的數據串擾。 |
|
|
|
一句話總結:采用UDI策略,能更正確拆解測序數據與樣本之間的一一對應關系,減小樣本“戴錯號碼牌”的概率。 |
|
下面再來講講名為分子標簽技術的UMI: |
UMI的原理就是給每一條原始核酸片段加上一段*的標簽序列,經PCR擴增后一起進行測序。這樣根據不同的標簽序列,生信人員就能區分不同來源的DNA模板,分辨哪些是PCR擴增及測序過程中的隨機錯誤造成的假陽性突變,哪些是患者真正攜帶的突變,從而提高檢測靈敏度和特異性。 |
|
|
|
|
|
一些需要較高正確度的應用,如腫瘤稀有突變分析,常會對5%、甚至1%左右的稀有變異作檢測。這時一旦出現測序錯誤、或者PCR偏差,便會產生大量假陽性結果,因此需要添加UMI進行校正。 |
|
一句話總結:做稀有突變檢測、校正測序錯誤與PCR偏差,UMI“勞苦功高”。 |
|
看到這里,關于UDI和UMI的介紹已基本完成。 |
|
接下來我們來看一個實際案例應用。 |
|
近我們收到一位寶粉的來信,咨詢我們Takara有沒有什么好的文庫構建方案↓ |
|
我們了解到這位寶粉的團隊 ① 近正在研發腫瘤稀有突變分析的項目; ② 樣本類型主要是FFPE(石蠟包埋樣本)、cfDNA(游離DNA); ③ 起始量大概在幾十ng;④準備自己建庫,然后送樣測序,平臺是Novaseq; ⑤ 由于是剛接觸建庫實驗,不希望操作太復雜。 我思考了大概1秒鐘,就從我們豐富的DNA-Seq文庫構建產品線中找到了一款合適的產品↓ |
|
ThruPLEX Tag-Seq HV |
為什么說這款產品合適呢?我們來對標這位寶粉的幾個需求。 |
|
需求1:希望操作簡便,不要太繁瑣 |
對標1:ThruPLEX Tag-Seq HV這款試劑盒支持單管、三步操作,手動15 min,全程2 h,無需在建庫過程中轉管或純化。 |
|
|
|
我們比較了ThruPLEX HV和K、N兩家公司的試劑盒,只有ThruPLEX是單管操作、時間短、操作便捷的系統。 |
|
|
|
所以,無論新手還是老手,都能很快上手! |
|
需求2:樣本類型為FFPE DNA、cfDNA,起始量大概在幾十ng |
對標2:ThruPLEX Tag-Seq HV支持5-200 ng FFPE DNA、cfDNA起始,input volume為30μl,無需樣品濃縮。 |
|
需求3:Novaseq測序分析稀有變異 |
對標3:ThruPLEX Tag-Seq HV搭配UDI建庫,可以有效降低index hopping效應,是高通量型Illumina測序儀的“友好伙伴” |
|
ThruPLEX Tag-Seq HV莖環形接頭上還包含7位堿基的固定型UMI,雙端總共可有144種UMI連接到DNA分子兩端,以識別一致序列,減少擴增或者測序錯誤帶來的假陽性突變。 |
|
|
|
再舉幾個例子 |
Takara科學家采用ThruPLEX Tag-Seq HV對10 ng起始的Quan-Plex Patient-Like ctDNA標準品(AccuRef)構建文庫,腫瘤相關的基因采用IDT xGEN Pan Cancer Panel進行捕獲富集,隨后用UMIs鑒定了ctDNA標準品中特定位點的實際突變頻率。結果顯示,檢測到的突變頻率分別與預期1%、5%的等位突變頻率接近,而陰性對照組沒有在位點處檢測到任何突變。 |
|
|
|
同時,為了比較UMI與常規使用的坐標法之間的效果差異,Takara科學家先使用未去重或者僅用坐標法去重的文件分析,在預期的EGFR L858R突變附近觀察到大量的低頻及隨機等位基因頻率突變。而隨后用UMI校正、過濾數據后,清除了假陽性突變,得到了預期的突變分析結果! |
|
|
|
經過幾場對標,我們明確了ThruPLEX Tag-Seq HV能滿足那位寶粉開發cfDNA/FFPE DNA稀有突變項目的需求。 |
當然,若小伙伴們也有同等需求,ThruPLEX Tag-Seq HV定能不負所望。 |