ノート:バイオインフォマティクス

ウィキペディアから無料の百科事典

英語版Wikipediaからの翻訳[編集]

英語版Wikipediaからの翻訳(日本語の記事が英語版とかけ離れているように思われたので訳してみました)

バイオインフォマティクスと計算生物学は、応用数学、情報学、統計学、計算機科学の技術応用によって、生物学の問題を解こうとする分野である。計算生物学の研究はシステムズバイオロジーと重なることが多い。主な研究対象分野は、配列アラインメント、遺伝子発見、ゲノムアセンブリ、タンパク質構造アラインメント、タンパク質構造予測、遺伝子発現とタンパク質間相互作用の予測、進化のモデリングなどである。

Bioinformatics and computational biology involve the use of techniques from applied mathematics, informatics, statistics, and computer science to solve biological problems. Research in computational biology often overlaps with systems biology. Major research efforts in the field include sequence alignment, gene finding, genome assembly, protein structure alignment, protein structure prediction, prediction of gene expression and protein-protein interactions, and the modeling of evolution.

バイオインフォマティクスと計算科学という言葉は同義に用いられることが多い。しかし、「バイオインフォマティクス」は、生物学的データの管理と解析を対象とするアルゴリズム、計算、統計の技術、形式的、および実際的問題を解くための理論の創出と発展が中心となっている。一方、「計算生物学」は特定の生物学的問題に対する仮説に基づき、コンピュータを使って行う研究で、実験とシミュレーションのデータを用いて行われ、その大目標は生物学的知識の発見と発展に置かれている。同様の区別がNIHにおけるバイオインフォマティクスと計算生物学の作業定義でも行われているが、こちらでは仮説ベース研究の計算生物学と技術ベース研究のバイオインフォマティクスの間における開発と知識の強い結びつきが強調されている。計算生物学は、あまり知られて知られてはいないが同じように重要な分野である計算生化学と計算物理化学を含んでいる。

The terms bioinformatics and computational biology are often used interchangeably. However bioinformatics more properly refers to the creation and advancement of algorithms, computational and statistical techniques, and theory to solve formal and practical problems posed by or inspired from the management and analysis of biological data. Computational biology, on the other hand, refers to hypothesis-driven investigation of a specific biological problem using computers, carried out with experimental and simulated data, with the primary goal of discovery and the advancement of biological knowledge. A similar distinction is made by National Institutes of Health in their working definitions of Bioinformatics and Computational Biology, where it is further emphasized that there is a tight coupling of developments and knowledge between the more hypothesis-driven research in computational biology and technique-driven research in bioinformatics. Computational biology also includes lesser known but equally important subdisciplines such as computational biochemistry and computational biophysics.

バイオインフォマティクスと計算生物学の共通点は、数学の道具を使い、ジェノミクス(データマイニングの分野とも重なる)などハイスループットの生物学技術から産生されるノイズの多いデータから有用データを抽出することである。バイオインフォマティクスの代表的問題は、ショットガンDNAシーケンシングによる断片的な高品質DNAシーケンスのアセンブリであり、計算生物学の代表的問題は、mRNAマイクロアレイや質量分析のデータを用いた共通の遺伝子制御仮説の統計的検定であろう。

A common thread in projects in bioinformatics and computational biology is the use of mathematical tools to extract useful information from noisy data produced by high-throughput biological techniques such as genomics (The field of data mining overlaps with computational biology in this regard). A representative problem in bioinformatics is the assembly of high-quality DNA sequences from fragmentary "shotgun" DNA sequencing, while in computational biology, a representative problem might be statistical testing of a hypothesis of common gene regulation using data from mRNA microarrays or mass spectrometry.

主な研究領域 Major Research Areas

配列解析 Sequence analysis

  主な記事: 配列アラインメントと配列データベース

   Main articles: Sequence alignment and Sequence database 

1977年にファージΦ-X174が配列決定されて以来、より多くの生物のDNA配列が解読され、電子的なデータベースに納められてきた。このデータはタンパク質をコードする遺伝子や制御配列を決定するために解析される。同種内あるいは種間の遺伝子比較によって、タンパク質機能や種間の類似性を示すことが出来る(分子機構を用いた系統樹構築による)。データの増加に伴って、遙か以前からDNA配列を手作業で解析することは不可能になった。こんにちでは、数十億塩基を含んだ数千に及ぶ生物のゲノム検索にはコンピュータプログラム用いられる。これらのプログラムは、関連するが非同一の配列を同定できるように、配列中の変異(塩基の交換、欠失、挿入)を許容しうる。この配列アラインメントの改変法の一つが、配列決定そのものにも用いられている。いわゆるショットガンシーケンシング技術(この技術は、たとえばゲノム研究所(TIGR)によって初の細菌ゲノムHaemophilus influenza配列決定に用いられた)は、順序づけられた配列のリストをもたず、代わりに多数の短いDNA断片(各600-800塩基)配列を用いる。これら断片の末端は重なっており、正しくアラインメントされれば完全なゲノムとなる。ショットガンシーケンシングを使うと配列データを素早く得られるが、より大きなゲノムの場合、断片アセンブルは極めて複雑な作業となりうる。ヒトゲノムプロジェクトの場合、数ヶ月のCPU時間(circa-2000 vintage DEC alphaコンピュータ)を要した。現在、ショットガンシーケンシングは現実的にはすべてのゲノム配列決定方法の選択肢であり、ゲノムアセンブリアルゴリズムは不可欠なバイオインフォマティクス研究領域のひとつである。

Since the Phage Φ-X174 was sequenced in 1977, the DNA sequences of more and more organisms have been decoded and stored in electronic databases. This data is analyzed to determine genes that code for proteins, as well as regulatory sequences. A comparison of genes within a species or between different species can show similarities between protein functions, or relations between species (the use of molecular systematics to construct phylogenetic trees). With the growing amount of data, it long ago became impractical to analyze DNA sequences manually. Today, computer programs are used to search the genome of thousands of organisms, containing billions of nucleotides. These programs can compensate for mutations (exchanged, deleted or inserted bases) in the DNA sequence, in order to identify sequences that are related, but not identical. A variant of this sequence alignment is used in the sequencing process itself. The so-called shotgun sequencing technique (which was used, for example, by The Institute for Genomic Research to sequence the first bacterial genome, Haemophilus influenza) does not give a sequential list of nucleotides, but instead the sequences of thousands of small DNA fragments (each about 600-800 nucleotides long). The ends of these fragments overlap and, when aligned in the right way, make up the complete genome. Shotgun sequencing yields sequence data quickly, but the task of assembling the fragments can be quite complicated for larger genomes. In the case of the Human Genome Project, it took several months of CPU time (on a circa-2000 vintage DEC Alpha computer) to assemble the fragments. Shotgun sequencing is the method of choice for virtually all genomes sequenced today, and genome assembly algorithms are a critical area of bioinformatics research.

配列解析におけるバイオインフォマティクスのもう一つの面は、ゲノム中の遺伝子と制御配列の自動検索である。ゲノム中のすべての塩基が遺伝子というわけではない。高等生物のゲノム中においては、DNAの大部分の意義は明らかでない。いわゆる「ジャンクDNA」は、未同定の機能因子を含んでいる。バイオインフォマティクスは、タンパク質同定のためにDNA配列を用いるなど、ゲノムプロジェクトとプロテオームプロジェクトの間のギャップを埋める助けになる。

Another aspect of bioinformatics in sequence analysis is the automatic search for genes and regulatory sequences within a genome. Not all of the nucleotides within a genome are genes. Within the genome of higher organisms, large parts of the DNA do not serve any obvious purpose. This so-called junk DNA may, however, contain unrecognized functional elements. Bioinformatics helps to bridge the gap between genome and proteome projects--for example, in the use of DNA sequences for protein identification.

参考: 配列解析、配列プロファイリングツール、配列モチーフ。 See also: sequence analysis, sequence profiling tool, sequence motif.

未翻訳部分のタイトル一覧[編集]

ゲノムアノテーション Genome annotation 計算進化生物学 Computational evolutionary biology より複雑な生命の木を再構築する将来にわたる仕事 Future work endeavours to reconstruct the now more complex tree of life. 生物多様性の測定 Measuring biodiversity

遺伝子発現解析 Analysis of gene expression 制御解析 Analysis of regulation タンパク質発現解析 Analysis of protein expression 癌における変異解析 Analysis of mutations in cancer タンパク質構造予測 Prediction of protein structure 比較ゲノム学 Comparative genomics 生物系のモデル化 Modeling biological systems ハイスループットイメージ解析 High-throughput image analysis ソフトウェアツール Software tools

参考 See also

   * Biomedical informatics    * Biologically-inspired computing    * Biocybernetics    * Computational biomodeling    * Computational genomics    * List of Bioinformatics Software Projects    * List of Bioinformatics Research Groups    * List of publications in bioinformatics    * Molecular modelling    * Morphometrics    * Metabolic network modelling    * Natural computation    * Protein-protein interaction prediction    * Biosynthetic phylogeny 


関連分野 Related fields

   * applied mathematics — biology — computer science — informatics — mathematical biology — theoretical biology — Scientific computing — cheminformatics — neuroinformatics — computational science — Systems biology — Statistics 


外部リンク External links

   * Wikiomics.org: bioinformatics wiki for users and developers of bioinformatics worldwide. Focused on practical questions and pointers towards both academic publications and software resources (opened November 2005). 

主な学会 * Major Societies

   * The International Society for Computational Biology 

主な組織 * Major Organizations

         o Bioinformatics Organization (Bioinformatics.Org): The Open-Access Institute          o EMBnet is a science-based group of collaborating nodes throughout Europe and a number of nodes outside Europe          o UCSC Center for Biomolecular Science and Engineering          o Laurence H. Baker Center for Bioinformatics and Biological Statistics at Iowa State University          o Swiss Institute of Bioinformatics          o European Bioinformatics Institute          o European Molecular Biology Laboratory          o Genetic Information Research Institute          o National Center for Biotechnology Information          o Open Bioinformatics Foundation: umbrella non-profit organization supporting certain open-source projects in bioinformatics          o National Center for Biomedical Ontology          o South African National Bioinformatics Institute          o US Department of Energy Joint Genome Institute 

商業ベンダー

   * Commercial vendors          o atragene[EU]          o BioXpr[EU]          o Biowisdom[EU]          o Bsi[Canada]          o Genomining[EU]          o Gensodi[EU]          o IBM Healthcare and life sciences[US]          o IT.Omics[EU]          o Rosetta[US] 

包括的、確認済、第3者コースリスト * Comprehensive, Reviewed, Third-Party Course Lists

         o A long list of courses world wide.          o Training courses at the European Bioinformatics Institute.          o Courses given about Ensembl. 

主なジャーナル * Major Journals

         o Statistical Applications in Genetic and Molecular Biology          o The International Journal of Biostatistics          o PLoS Computational Biology          o Evolutionary Bioinformatics Online          o Nature Molecular Systems Biology          o Bioinformatics journal          o BMC Bioinformatics journal          o International Journal of Biological Sciences          o Cancer Informatics Open Access journal          o Online Journal of Bioinformatics          o EMBnet.News Online Journal          o Genome Research 

その他の重要サイト * Other Important Sites

         o The Collection of Biostatistics Research Archive          o Books and articles on Bioinformatics from O'Reilly          o Genome Canada: Canadian Bioinformatics Help Desk          o Human Genome Project and Bioinformatics          o Barry Smith's biomedical ontology site          o Virtual Insitute of Microbial Stress and Survival (VIMSS) 

編集[編集]

できる限りでカットいたしましたが、私が読み進めたところもかなり怪しいところが多かった。’’’全文’’’、最初から別人が書き直してしまっても構いません。2A00:1828:1000:2217:0:0:0:2 2024年4月9日 (火) 09:29 (UTC)[返信]