一本到高清DVD91日韩伦理影院|无码AV中文一区国产强奸三级簧片|日韩无码色哟哟午夜福利国产一区|丁香激情五月亚洲亚洲影院123区|五月天综合久久国产精品free|亚洲免费专区日韩热在线视频|黄片看视频免费久久偷拍的视频|五月婷桃色网日韩国产一级

    1. <rt id="6skql"></rt>
        1. <form id="6skql"></form>
          <sub id="6skql"></sub>

            <rt id="6skql"></rt>

            服務(wù)熱線02152235399
            當(dāng)前位置:博客 > 生物信息

            Tophat參數(shù)測試總結(jié)報告

            時間:2018-10-19    |    閱讀量:4459

            引言

            1.1編寫目的

            進(jìn)行該測試以及撰寫此報告有以下幾個目的

            1.通過對測試結(jié)果的分析,得到對軟件質(zhì)量的評價;

            2.分析在Illumina測序平臺下,tophat能夠獲得最大junction數(shù)目以及mapping率的參數(shù);

            3.分析在ionproton測序平臺下,tophat能夠獲得最大junction數(shù)目以及mapping率的參數(shù);

            4.嘗試找到參數(shù)與測序長度的經(jīng)驗性關(guān)系。

            1.2背景

            Tophat是一個RNA-seq數(shù)據(jù)分析工具,其核心程序是bowtie或bowtie2.可以快速的確認(rèn)exon-exon剪切拼接。其上游軟件是Bowtie,下游軟件是Cufflinks。

            理論上,Tophat是針對Illumina Genome Analyzer開發(fā)的,針對75bp以上長度的短序列進(jìn)行了優(yōu)化。該軟件是現(xiàn)在二代測序回帖軟件中使用最廣泛的軟件。

            Illumina屬于二代測序中最經(jīng)典的平臺之一。其測序長度為幾十bp。

            Ionproton屬于二代測序中較新的平臺,可以認(rèn)為是二點五代測序平臺,其測序長度平均在100個bp以上。目前我們公司使用的就是這個平臺的進(jìn)行二代測序分析。

            在目前公司的數(shù)據(jù)分析中,出現(xiàn)主要的問題是使用tophat進(jìn)行ionproton平臺分析時,默認(rèn)參數(shù)的mapping率較低,同時該參數(shù)產(chǎn)生的junction數(shù)也很低,不足以進(jìn)行差異可變剪接分析。因此,提出此次工作內(nèi)容,探索更好的參數(shù)配置,提高mapping率以及junction數(shù)目。

            1.3用戶群

            主要讀者:公司研發(fā)部,公司管理人員。

            其他讀者:項目及銷售相關(guān)人員。

            1.4 數(shù)據(jù)對象:

            Illumina數(shù)據(jù)

            Ionproton數(shù)據(jù)

            Illumina-lowliguanhu human

            Ionproton-low: congsongfeng human

            Illumina-highzhuanliping mouse

            Ionproton-high:dingning human

            1.5 測試階段

            軟件測試

            1.6測試工具

            Samtools version0.1.18;

            IGV version2.3.18

            Awk;

            1.7 參考資料

            Tophat user guide

            測試概要

            關(guān)于Tophat參數(shù)測試從2013910日開始到2013917日結(jié)束,共持續(xù)7天,一共94個測試用例,平均每個參數(shù)測試15次。

            2.1工作計劃進(jìn)展

            針對Illumina平臺:

            測試參數(shù)

            計劃開始時間

            實際開始時間

            計劃完成時間

            實際完成時間

            工作完成情況

            Anchor-length

            2013910

            2013910

            2013910

            2013910

            順利

            Max-insertion

            2013910

            2013910

            2013910

            2013910

            順利

            Max-deletion

            2013910

            2013910

            2013910

            2013910

            順利

            Splice-mismatch

            2013910

            2013910

            2013910

            2013910

            順利

            Read-mismatch

            2013911

            2013911

            2013912

            2013912

            順利

            Read-gap-length

            2013911

            2013911

            2013912

            2013912

            順利

            Read-edit-dist

            2013911

            2013911

            2013912

            2013912

            順利

            Segment-length

            2013912

            2013912

            2013912

            2013912

            順利

            針對ionproton平臺:

            測試參數(shù)

            計劃開始時間

            實際開始時間

            計劃完成時間

            實際完成時間

            工作完成情況

            Anchor-length

            2013916

            2013916

            2013916

            2013916

            順利

            Max-insertion

            2013916

            2013916

            2013916

            2013916

            順利

            Max-deletion

            2013916

            2013916

            2013916

            2013916

            順利

            Splice-mismatch

            2013916

            2013916

            2013916

            2013916

            順利

            Read-mismatch

            2013916

            2013916

            2013916

            2013916

            順利

            Read-gap-length

            2013916

            2013916

            2013916

            2013916

            順利

            Read-edit-dist

            2013916

            2013916

            2013916

            2013916

            順利

            Segment-length

            2013916

            2013916

            2013916

            2013916

            順利

            2.2測試執(zhí)行

            此次測試嚴(yán)格按照項目計劃和測試計劃執(zhí)行,按時完成了測試計劃規(guī)定的測試對象的測試。針對測試計劃制定規(guī)定的測試策略,依據(jù)測試計劃和測試用例,將網(wǎng)絡(luò)數(shù)據(jù)以及我們觀測的關(guān)鍵參數(shù)進(jìn)行了完整的測試。

            2.3測試用例

            2.3.1功能性

            測試主要實現(xiàn),包括較高的mapping率以及較多的junction數(shù)目。

            測試環(huán)境

            3.1軟硬件環(huán)境

            硬件環(huán)境

            服務(wù)器

            硬件配置

            CPUIntel Xeon 2.66GHz

            Memory90GB

            HD29TB

            軟件配置

            OSFedora release 14

            Tophat 2.0.8

            網(wǎng)絡(luò)環(huán)境

            100M LAN

            測試結(jié)果

            4.1針對Illumina測序平臺數(shù)據(jù)

            為簡化回帖工作量,從測試的數(shù)據(jù)中提取了20萬條reads數(shù)據(jù)進(jìn)行單端測試。

            通過測試,統(tǒng)計出anchor-length長度對于junction數(shù)目關(guān)系如下圖所示:

            通過測試數(shù)據(jù)可以知道對于Illumina測序平臺數(shù)據(jù)而言,當(dāng)anchor-length大于10以后,junction數(shù)目顯著降低,而在510這個范圍內(nèi)沒有顯著變化。

            通過測試數(shù)據(jù)可以知道對于Illumina測序平臺數(shù)據(jù)而言,當(dāng)anchor-length大于10以后,mapping率降低,但是可以通過豎軸可以觀測出這個mapping率的變化并不明顯。

            通過測試數(shù)據(jù)可以知道對于Illumina測序平臺數(shù)據(jù)而言,junction數(shù)目與mapping率基本成正比關(guān)系。

            通過測試數(shù)據(jù)可以知道對于Illumina測序平臺數(shù)據(jù)而言,read-mismatch數(shù)字升高與junction數(shù)目基本成反比關(guān)系,隨著read-mismatch數(shù)目變長,junction數(shù)目急速降低。

            通過測試數(shù)據(jù)可以知道對于Illumina測序平臺數(shù)據(jù)而言,read-mismatch數(shù)字升高與mapping率基本成正比關(guān)系,隨著read-mismatch數(shù)目變長,mapping率上升明顯。

            通過測試數(shù)據(jù)可以知道對于Illumina測序平臺數(shù)據(jù)而言,read-gap數(shù)字升高與mapping率基本成正比關(guān)系,隨著read-mismatch數(shù)目變長,mapping率上升。整體上升大約1.2%。

            通過測試數(shù)據(jù)可以知道對于Illumina測序平臺數(shù)據(jù)而言,segment長度升高與junction的數(shù)目關(guān)系,在二十以內(nèi)時,segment長度變長,junction數(shù)目上升明顯。隨著read-mismatch數(shù)目變長,mapping率上升。整體上升大約1.2%。

            3.2針對ionproton測序平臺數(shù)據(jù)

            為簡化回帖工作量,從測試的數(shù)據(jù)中提取了20萬條reads數(shù)據(jù)進(jìn)行單端測試。

            由于有了對于Illumina平臺的工作支持,所以針對ionproton的測試工作速度提高很多。

            由于我們統(tǒng)一了read-mismatch參數(shù),read-gap參數(shù),以及read-edit參數(shù)。所以這三個參數(shù)的測試圖都可以從上圖中看出信息。

            通過測試數(shù)據(jù)可以知道對于ionproton測序平臺數(shù)據(jù)而言,針對同一anchor-length長度而言,長度8和長度15,16的情況下junction數(shù)目可以一致,所以認(rèn)為anchor-lengthjunction數(shù)目影響不明顯。

            通過測試數(shù)據(jù)可以知道對于ionproton測序平臺數(shù)據(jù)而言,針對同一max-deletion長度而言,長度3和長度5的情況下junction數(shù)目可以一致,所以認(rèn)為max-deletionjunction數(shù)目影響不明顯。

            由于我們統(tǒng)一了max-insertion參數(shù),max-deletion參數(shù)。所以這兩個個參數(shù)的測試圖都可以從上圖中看出信息。

            通過測試數(shù)據(jù)可以知道對于ionproton測序平臺數(shù)據(jù)而言,在segment-length小于36時,可以發(fā)現(xiàn)隨著segment-length長度變長,junction數(shù)目升高。而在36以后這個數(shù)字下降,但是總體比30以內(nèi)長度的大。

            通過測試數(shù)據(jù)可以知道對于ionproton測序平臺數(shù)據(jù)而言,在segment-length小于36時,可以發(fā)現(xiàn)隨著segment-length長度變長,mapping總體目升高。而在36以后這個數(shù)字有下降的情況,但是總體比30以內(nèi)長度的大。

            五.測試結(jié)論

            通過查閱已經(jīng)有的資料,我們知道Illumina測序平臺和ionproton平臺最直觀的差別在于后者的平均測序長度比前者長;在我們測試的例子中,Illumina的測序長度在50-97bp之間,而ionproton的測序長度在50235bp之間。從此可以看出兩者的最合適參數(shù)應(yīng)該是有差別的。通過我們的參數(shù)實驗,可以知道,對于Illumina測序平臺有如下實驗結(jié)果:

            1.貼合長度越短,匹配的reads數(shù)越高,相應(yīng)的mapping率也在一定范圍內(nèi)會升高。可知,只需要在anchor-length5-10以內(nèi)進(jìn)行討論。隨著a參數(shù)的增加(從510),junction下降的數(shù)據(jù)很低,幾乎維持不變。因此可以認(rèn)為在5-9的范圍內(nèi)可以任意取值。

            2.前三個參數(shù)對于序列的discard沒有影響。

            3.隨著第一項參數(shù)的增加,junction數(shù)目下降很明顯,然而mapping率卻增加的很快。推測這個原因可能是因為更多的junction序列由于容錯而變成能夠匹配了。所以為了mapping率而言,我認(rèn)為用默認(rèn)參數(shù)就可以。

            4.第二項參數(shù)的變化對于junction數(shù)并沒有影響,對于mapping率有一些影響,但是很小??梢栽?/span>0~第三項參數(shù)之間隨意選取。

            5.第三項參數(shù)的變化對mapping率影響很小。但是對junction的影響很大,發(fā)現(xiàn)這個參數(shù)越小,junction數(shù)越高。第三個參數(shù)對于junction的影響很大,這個值越小越好,由于前兩個參數(shù)應(yīng)該小于或等于這個參數(shù),當(dāng)?shù)谌齻€參數(shù)為0時,mapping率下降非常厲害,所以不將前三個參數(shù)設(shè)置為0,

            6.當(dāng)segment-length22的時候效果最好。

            對于ionproton測序平臺而言,我們可以獲得如下結(jié)論:

            1.anchor-length,max-deletionmax-insertion,splice-mismatch參數(shù)的變化對于junction數(shù)目,mapping率影響不大。

            2.tophat的所有的參數(shù)中,read-mismatch,read-gap以及read-edit對于mapping率的影響很大,我們發(fā)現(xiàn)在這三個參數(shù)都設(shè)置為6的時候mapping率能夠提升很多,變成默認(rèn)參數(shù)情況下的兩倍的mapping率。

            3.我們發(fā)現(xiàn)segment-length參數(shù)對于junction數(shù)目變化有很大影響,其中,當(dāng)segment-length36時,相比默認(rèn)參數(shù)6074junction數(shù)目而言,此時的junction數(shù)目為9368.總體而言,提升效果是顯著的。

            六.最后測試的參數(shù)

            對于20reads的實驗樣本而言,參數(shù)及結(jié)果如下:

            測試平臺

            read-mismatch

            read-gap-length

            read-edit-dist

            a

            m

            maxinsertion

            max-deletion

            segment

            junction_num

            unmapped

            Illumina

            1

            1

            1

            8

            1

            3

            3

            22

            4957

            42902

            ionproton

            6

            6

            6

            8

            0

            5

            5

            36

            9368

            96725





            湖州市| 弥勒县| 湘西| 甘洛县| 宜丰县| 依安县| 镇巴县| 内丘县| 江阴市| 博兴县| 铜山县| 镇巴县| 成安县| 南木林县| 裕民县| 衡阳市| 修文县| 陈巴尔虎旗| 青州市| 青阳县| 兴宁市| 江口县| 永兴县| 海原县| 石阡县| 清镇市| 思南县| 宾阳县| 屏东市| 寿宁县| 阿拉善右旗| 湘阴县| 岢岚县| 东方市| 黄平县| 明星| 漳州市| 辛集市| 乌拉特前旗| 西充县| 麦盖提县|