一本到高清DVD91日韩伦理影院|无码AV中文一区国产强奸三级簧片|日韩无码色哟哟午夜福利国产一区|丁香激情五月亚洲亚洲影院123区|五月天综合久久国产精品free|亚洲免费专区日韩热在线视频|黄片看视频免费久久偷拍的视频|五月婷桃色网日韩国产一级

    1. <rt id="6skql"></rt>
        1. <form id="6skql"></form>
          <sub id="6skql"></sub>

            <rt id="6skql"></rt>

            服務(wù)熱線02152235399
            當(dāng)前位置:博客 > 單細(xì)胞

            單細(xì)胞轉(zhuǎn)錄組測(cè)序數(shù)據(jù)分析(一)

            時(shí)間:2019-09-30    |    閱讀量:31426

                   前幾期小編已經(jīng)連續(xù)分享過(guò)很多篇單細(xì)胞測(cè)序的高分文章,并介紹了單細(xì)胞分選平臺(tái)的選擇對(duì)某些類型細(xì)胞捕獲的重要性。本期開(kāi)始,小編將從數(shù)據(jù)預(yù)處理、標(biāo)準(zhǔn)化及聚類、擬時(shí)序、SCENIC分析等幾個(gè)方面放送大量數(shù)據(jù)分析干貨,帶領(lǐng)大家深入探索單細(xì)胞測(cè)序的奧秘。

            本期小編主要對(duì)scRNA-Seq的數(shù)據(jù)預(yù)處理(質(zhì)控、細(xì)胞數(shù)量判斷、多樣本數(shù)據(jù)合并)進(jìn)行介紹。

            一、數(shù)據(jù)預(yù)處理流程

            上海烈冰科技作為國(guó)內(nèi)一家同時(shí)擁有BD Rhapsody10X Genomics雙分選平臺(tái)的測(cè)序服務(wù)商,針對(duì)不同的分選平臺(tái)、建庫(kù)方法,實(shí)戰(zhàn)總結(jié)搭建出不同的數(shù)據(jù)預(yù)處理工作流程。

            BD Rhapsody數(shù)據(jù)預(yù)處理流程

            10× Genomics數(shù)據(jù)預(yù)處理流程

            二、工具介紹

            SCFastp——采用fastp軟件對(duì)下機(jī)原始數(shù)據(jù)進(jìn)行過(guò)濾過(guò)短、低質(zhì)量序列及接頭處理等操作。

            UMI_tools_whiteList——采用UMI-tools的whiteList功能建立真實(shí)細(xì)胞條碼的白名單,結(jié)合BD scanner記錄的捕獲細(xì)胞來(lái)獲得細(xì)胞數(shù)。

            UMI_Tools_Extract——利用UMI-tools的extract功能根據(jù)上游工具得到的細(xì)胞條碼白名單提取測(cè)序序列,并對(duì)這些序列進(jìn)行質(zhì)量過(guò)濾。然后使用STAR軟件將過(guò)濾后的測(cè)序序列比對(duì)到參考基因組。

            UMI_Tools_Counts——利用UMI-tools的FeatureCounts功能統(tǒng)計(jì)細(xì)胞內(nèi)基因表達(dá)水平。

            ScCountsCombine——BD Rhapsody多樣本數(shù)據(jù)合并的工具。

            CellRangerCounts——10× Genomics的數(shù)據(jù)采用cellranger count(3.1.0版本)工具進(jìn)行細(xì)胞基因表達(dá)水平統(tǒng)計(jì)。

            CellRangerAggregate——10× Genomics的數(shù)據(jù)采用cellranger aggr(3.1.0版本)工具進(jìn)行樣本數(shù)據(jù)合并。

            三、結(jié)果評(píng)估

            1. 質(zhì)控:

            單細(xì)胞測(cè)序產(chǎn)生數(shù)億的結(jié)果序列,不可避免的會(huì)出現(xiàn)低質(zhì)量的測(cè)序結(jié)果,存在各種情況的序列污染。因此序列過(guò)濾及質(zhì)量評(píng)估就變得極為重要。

            序列質(zhì)量主要通過(guò)測(cè)序質(zhì)量值Q20/Q30的占比來(lái)表征,即堿基測(cè)序結(jié)果的錯(cuò)誤率在1% / 0.1%以下的比例。理想的測(cè)序結(jié)果reads的堿基質(zhì)量均高于30。


            2. 細(xì)胞數(shù)量判斷:

            主要是對(duì)細(xì)胞數(shù)量、基因表達(dá)量、測(cè)序質(zhì)量進(jìn)行整體描述。

            1) 過(guò)濾標(biāo)準(zhǔn):

            由于細(xì)胞破碎后游離RNA會(huì)釋放到環(huán)境或微孔中,并且測(cè)序中也會(huì)存在一些死細(xì)胞,導(dǎo)致數(shù)據(jù)存在background值。因此,我們需要設(shè)定一定的標(biāo)準(zhǔn)來(lái)過(guò)濾掉假細(xì)胞或死細(xì)胞。

            10× Genomics為例,細(xì)胞數(shù)量判斷主要通過(guò)分析UMI Counts-Barcode曲線斜率拐點(diǎn),當(dāng)存在多個(gè)斜率拐點(diǎn)的時(shí)候,結(jié)合預(yù)期UMI=500時(shí)的細(xì)胞數(shù)量進(jìn)行過(guò)濾。當(dāng)?shù)谝粋€(gè)斜率拐點(diǎn)低于UMI=500的時(shí)候,選擇UMI=500作為細(xì)胞的判斷的標(biāo)準(zhǔn);否則,選擇和預(yù)期細(xì)胞數(shù)量最為接近的拐點(diǎn)作為細(xì)胞判斷的位置。這樣我們能夠有效獲得真實(shí)的并且在基因數(shù)量上可以分析的數(shù)據(jù)。

            2) 定量reads數(shù)、基因表達(dá)量及細(xì)胞數(shù)量:

            a) Mean Reads per Cell:以捕獲5000個(gè)細(xì)胞、100G的測(cè)序量為標(biāo)準(zhǔn),每個(gè)細(xì)胞的reads數(shù)大約在50k左右;

            b) Median Genes per Cell:每個(gè)細(xì)胞的基因中位數(shù)取決于樣本的細(xì)胞類型,例如在成熟B、T、粒細(xì)胞數(shù)量較多的組織中,由于這些類型細(xì)胞表達(dá)的基因數(shù)普遍較少,導(dǎo)致基因中位數(shù)較低。而像腫瘤組織、或者體外培養(yǎng)的干細(xì)胞/類器官組織,它們的基因表達(dá)數(shù)較高,甚至可以超過(guò)1W,這就導(dǎo)致該類樣本基因中位數(shù)非常高。因此,我們確認(rèn)細(xì)胞數(shù)量以及基因中位數(shù)時(shí),需考慮實(shí)際組織的細(xì)胞類型組成情況。

            c) Fraction Reads in Cells:每個(gè)樣本過(guò)濾后細(xì)胞的reads數(shù)占總reads數(shù)(含背景)的百分比,反映的是測(cè)序數(shù)據(jù)的利用率。該參數(shù)的理想值應(yīng)達(dá)到80%以上。

            3.多樣本數(shù)據(jù)合并:

            Fraction of Reads Kept:多樣本進(jìn)行數(shù)據(jù)合并時(shí),各樣本根據(jù)Mapped Barcoded Reads per Cell數(shù)量計(jì)算出來(lái)的數(shù)據(jù)利用率。若各樣本間Fraction of Reads Kept數(shù)值相差很大,需要進(jìn)行Downsample處理,以數(shù)據(jù)量少的樣本為基準(zhǔn)將不同樣本中細(xì)胞測(cè)序深度標(biāo)化到同一水平,從而避免因測(cè)序深度差異導(dǎo)致的基因檢測(cè)數(shù)量、基因表達(dá)水平的差異。

            總的來(lái)說(shuō),單細(xì)胞測(cè)序數(shù)據(jù)分析的預(yù)處理會(huì)對(duì)讀取的序列進(jìn)行過(guò)濾、接頭處理等質(zhì)控工作;還會(huì)從細(xì)胞的基因表達(dá)數(shù)量、豐度及線粒體基因占比等方面對(duì)細(xì)胞進(jìn)行過(guò)濾;數(shù)據(jù)合并時(shí)需要注意各樣本數(shù)據(jù)的利用率。

            數(shù)據(jù)預(yù)處理完成后,接下來(lái)就要正式進(jìn)入分析流程了。下期小編將為大家講解scRNA-Seq中數(shù)據(jù)標(biāo)準(zhǔn)化、降維及聚類分析。





            南皮县| 平利县| 金溪县| 辰溪县| 山阴县| 拜城县| 吴忠市| 恩平市| 武胜县| 新巴尔虎左旗| 大城县| 海丰县| 政和县| 迁安市| 泰和县| 新乡市| 敦煌市| 仪征市| 婺源县| 赣榆县| 且末县| 合川市| 金川县| 黄大仙区| 平遥县| 惠州市| 康定县| 吴江市| 阳泉市| 株洲县| 望谟县| 施秉县| 贡山| 太仓市| 新巴尔虎右旗| 新宾| 蛟河市| 和田市| 行唐县| 绿春县| 卢氏县|