SAM(Significance Analysis of Microarrays)是一種用來尋找microarray中顯著基因的統計工具,是由VB撰寫而成的Excel增益功能,由於該程式是用VB寫的,所以目前只有Windows版本可用,其它作業系統還沒有支援。在Office的版本上,也只支援到2007以前的版本,雖然在Office 2007上可以安裝成功,但是卻無法使用。
本篇文章只討論SAM的安裝與使用,關於演算法的部份,未來有機會再以其他文章介紹。
安裝:
在安裝前,首先我們要先下載軟體,我們所需要下載的有:
Excel: 下載點 (這是不能說的秘密!!呵呵呵!)
R: 下載點 http://cran.cs.pu.edu.tw/bin/windows/base/
SAM: 下載點 http://www-stat.stanford.edu/~tibs/SAM/
安裝順序:
安裝時,就照預設值進行安裝(也就是「下一步」、「下一步」、…、「完成」)即可,當然你也可以做一些變更,只是不保證程式裝完能正常運作而已。
安裝完畢,開發人員還很貼心的在C:\Program Files\SAMVB\Examples目錄下放進範例檔,每個範例檔都是以「回應類型(response type)」來命名,使用者可依所需的「回應類型(response type)」,查看SAM的欄位命名規則所格式。
資料格式
在資料格式上,在Excel中的第一列與第一行、第二行有特別的限定:
第一列(row 1): 與「回應類型(response type)」有關,不同的「回應類型(response type)」,會有不同的編碼格式,我們將會在「回應格式(response format)」中另行說明。
第一行(Column 1): 基因名稱,使用者自行參考用的。
第二行(Column 2): 基因ID,也是給使用者參考用的,不過此行所包含的資料應該是像Clone ID、Accession number或基因名稱這類唯一的識別,如此才能依這些識別連結到SAM的SOURCE網站的。當然,你也可以不要用那些識別,只是連到網站會找不到東西而已。
其他的儲存格中所存放的是使用者的觀測值。
回應格式(response format)~~待續~~
回應類型 |
說明 |
第一列編碼格式 |
|
Quantitative |
量化分析 |
|
|
Two class(unpaired) |
二類別不成對分析 |
兩組資料來自不同的來源(條件),如控制組與對照組。 |
|
Multiclass |
多類別分析 |
多組來源(條件)不同的資料 |
|
Paired |
成對分析 |
|
|
Survival data |
存活資料分析 |
|
|
One class |
單一類別分析 |
|
|
Time course, two class(unpaired) |
時間序列分析,二類別不成對 |
|
|
Time course, two class(paired) |
時間序列分析,二類別成對 |
|
|
Time course, one class |
時間序列分析,單一類別 |
|
|
Pattern discovery |
模型發掘 |
|
|
|
|
|