非加重結合法

ウィキペディアから無料の百科事典

非加重結合法(Unweighted Pair Group Method with Arithmetic mean、UPGMAと略す)は系統樹を作製するためのボトムアップ式のクラスタ解析法である。入力データは対象の各ペア間の距離であり、有根系統樹が作製される。進化速度が一定(分子時計仮説)と仮定して有根系統樹を作成する際に用いられる[1]

原理[編集]

非加重結合法は距離行列を用いた系統推定法である距離行列法の一つであり、総枝長が最短となる樹形が最適樹であると考える最小進化原理に基づいている[2]。非加重結合法では、まず各対象がそれぞれ1つのクラスタを作っているとする。その後、段階的に最も近い(距離行列の要素が最小となる)クラスタを結合して上位のクラスタとする。2つのクラスタAとBについて、AとBそれぞれの要素すべての間の距離の平均をとって、これをAとBの間の進化距離とする。次にAとBを一纏めにして(AB)と表記し、距離行列を再作成して、最小となる要素を探索する。こうして距離行列の計算、近縁なクラスタの割り当てと統合、そして距離行列の再計算というサイクルを繰り返し行っていく。全ての系統関係と枝長が決定されると推定終了となる[1]

解析に含まれる生物間で進化速度に差がほとんど存在しない場合、非加重結合法はほぼ正確な系統樹を構築できる[1]。また、全ての系統樹において総枝長を計算する必要がない(同じ距離行列法である最小二乗法最小進化法英語版とは異なる)ため、計算効率が非常に良い点も長所である[2]。ただし、自然界において生物間で進化速度が不変であることは稀であり、同じく距離行列を用いるが進化速度一定を仮定しない近隣結合法に比べると誤った系統樹を導きやすい[2]。このため、進化速度に関係なく効果を発揮できる近隣結合法の方が一般に利用されている[1][2]

なお、近隣結合法は非加重結合法のアルゴリズムに改変を加えたものであった[3]。また、形質状態法(最尤法最大節約法など)では系統樹探索の際に出発点となる初期系統樹(Initial Tree)が必要となるが、その初期系統樹に非加重結合法で求められた系統樹が使用されることもある[2]

出典[編集]

  1. ^ a b c d 隈啓一、加藤和貴「実践的系統樹推定方法」『化学と生物』第44巻第3号、2006年、185-191頁、doi:10.1271/kagakutoseibutsu1962.44.185 閲覧は自由
  2. ^ a b c d e 松井求「分子系統解析の最前線」『JSBi Bioinformatics Review』第2巻第1号、2021年、30-57頁、doi:10.11234/jsbibr.2021.7 オープンアクセス
  3. ^ 三中信宏分子系統学:最近の進歩と今後の展望」『植物防疫』第63巻第3号、2009年、192-196頁。 

関連項目[編集]