データ処理

スキャンして得られた画像は、以下のステップによりデータ処理される。

スポットの発光量の定量(数値化)
ハイブリダイズしたターゲットの量を画像上のピクセル単位でデジタル化した値をスポットの領域ごとに積算し、スポットの発光量(→遺伝子の発現量)とする。

そのためのソフトウエアとして、

  1. Molecular Dynamics社のスキャナーでスキャンした画像データ(GEL形式のファイル)に関してはArrayVision(MolecularDianmics)(MTAPシステム付属品)
  2. Fujifilmのスキャナーでスキャンした画像データ(Img 形式のファイル)ArrayGaugeFujiFilm
その他、一般的なTIFF形式のファイルに関してはMicroarraySuite(Scanalytic社)を用いている。
定量化されたデータのプロセッシング
Array Gauge(Fujifilm社)で定量を行った生データに対し、使用不可能データの除去、レシオの算出のための標準化を行う際に以下の方法を採用している(なぜ標準化をしなければならないのか?)。

1. Filtering(使用不可能データの除去)
1-1 NIAS filtering

低発現量のクローンと再現性の悪いクローンを任意の設定で削除する。
例:シグナル値5以下もしくは再現性2倍以上のものは使用しない。

1-2 PRIM filtering
相関係数と遺伝子数の積を利用し、各実験データにより使用するクローンをそれぞれ選抜する。詳細はPreprocessing implementation for microarray (PRIM): an efficient method for processing cDNA microarray data. KOJI KADOTA et al. Physiol. Genomics, 4:183-188, 2001を参照

2. Normalize(レシオの算出のための標準化)
2-1 Median-normalization

中央値を利用した標準化

2-2 LOWESS-normalization (LOcally WEighted Scatter plot Smoother)
John Quackenbush's presentation | PDF
シグナル強度を利用した標準化

3.Option
3-1 glass wide normalization

ガラスにのっているクローン全てを利用して標準化する。

3-2 sector normalization
ガラス上に存在する12個のフィールドごとに標準化する。

RED(Rice Expression Database:イネ遺伝子発現データベース) に格納されているデータには PRIM -Median (sector) によるデータプロセッシングで得られたレシオを使用している。

遺伝子発現解析(散乱分布、発現クラスタリング)
スポットの発光量と対応すると考えられるそれぞれの遺伝子の発現量と生物学的意味の関連性を探る。当研究所では、つぎのソフトウェアを用いている。