close

SAM(Significance Analysis of Microarrays)是一種用來尋找microarray中顯著基因的統計工具,是由VB撰寫而成的Excel增益功能,由於該程式是用VB寫的,所以目前只有Windows版本可用,其它作業系統還沒有支援。在Office的版本上,也只支援到2007以前的版本,雖然在Office 2007上可以安裝成功,但是卻無法使用。

 

本篇文章只討論SAM的安裝與使用,關於演算法的部份,未來有機會再以其他文章介紹。

 

安裝:

在安裝前,首先我們要先下載軟體,我們所需要下載的有:

Excel: 下載點 (這是不能說的秘密!!呵呵呵!)

R: 下載點 http://cran.cs.pu.edu.tw/bin/windows/base/

SAM: 下載點 http://www-stat.stanford.edu/~tibs/SAM/

 

安裝順序:

 

安裝時,就照預設值進行安裝(也就是「下一步」、「下一步」、…、「完成」)即可,當然你也可以做一些變更,只是不保證程式裝完能正常運作而已。

 

安裝完畢,開發人員還很貼心的在C:\Program Files\SAMVB\Examples目錄下放進範例檔,每個範例檔都是以「回應類型(response type)」來命名,使用者可依所需的「回應類型(response type)」,查看SAM的欄位命名規則所格式。

 

資料格式

在資料格式上,在Excel中的第一列與第一行、第二行有特別的限定:

第一列(row 1): 與「回應類型(response type)」有關,不同的「回應類型(response type)」,會有不同的編碼格式,我們將會在「回應格式(response format)」中另行說明。

第一行(Column 1): 基因名稱,使用者自行參考用的。

第二行(Column 2): 基因ID,也是給使用者參考用的,不過此行所包含的資料應該是像Clone ID、Accession number或基因名稱這類唯一的識別,如此才能依這些識別連結到SAM的SOURCE網站的。當然,你也可以不要用那些識別,只是連到網站會找不到東西而已。

 

其他的儲存格中所存放的是使用者的觀測值。

 

回應格式(response format)~~待續~~

 

回應類型

說明

第一列編碼格式

Quantitative

量化分析

 

 

Two class(unpaired)

二類別不成對分析

兩組資料來自不同的來源(條件),如控制組與對照組。

 

Multiclass

多類別分析

多組來源(條件)不同的資料

 

Paired

成對分析

 

 

Survival data

存活資料分析

 

 

One class

單一類別分析

 

 

Time course, two class(unpaired)

時間序列分析,二類別不成對

 

 

Time course, two class(paired)

時間序列分析,二類別成對

 

 

Time course, one class

時間序列分析,單一類別

 

 

Pattern discovery

模型發

 

 

 

 

 

arrow
arrow
    全站熱搜

    bioinfo 發表在 痞客邦 留言(0) 人氣()