生命科学と情報科学の融合領域。DNA / RNA / タンパク質配列解析、ゲノム比較、創薬、医療AI 等で使われる。NVIDIA Parabricks / AlphaFold 3 が業界標準ツール。
バイオインフォマティクス(Bioinformatics)は、生命科学と情報科学の融合領域である。DNA / RNA / タンパク質の配列解析、ゲノム比較、構造予測、薬物相互作用、患者データ統合解析等を計算機で実行する分野。1990 年代のヒトゲノム計画で基盤が確立、2024 年の DeepMind AlphaFold 3 リリースで AI 統合が一気に加速、2026 年現在は創薬・個別化医療・農業育種・パンデミック対応の中核技術となっている。
| ツール | 提供 | 価格 |
|---|---|---|
| AlphaFold 3 | DeepMind / Google | OSS / 学術無償、商用要契約 |
| ESMFold | Meta AI | OSS、HuggingFace 配布 |
| RoseTTAFold | Baker Lab | OSS |
| OmegaFold | Helix Bio | OSS |
| Boltz-1 | MIT / Recursion | OSS(2024-) |
| ツール | 形態 | 用途 |
|---|
| NVIDIA Parabricks | クラウド / オンプレ | $99/h、Whole Genome 30x を 1 時間 |
| GATK | OSS(Broad Institute) | 業界標準、Variant Calling |
| BWA / Bowtie2 | OSS | 配列アラインメント |
| samtools / bcftools | OSS | BAM/VCF 操作 |
| ANNOVAR | 学術無償 | バリアント注釈 |
| BCBio | OSS | パイプライン統合 |
| ツール | 提供 |
|---|---|
| BioBERT / PubMedBERT | OSS、医学論文特化 |
| ChemBERTa | OSS、化学式特化 |
| Galactica(Meta) | OSS、科学全般 |
| OpenFold | OSS、AlphaFold 軽量版 |
| 言語 | ライブラリ | 用途 |
|---|---|---|
| Python | BioPython / Biotite | 配列処理 |
| Python | scanpy | シングルセル RNA-seq |
| R | Bioconductor | 統計 + ゲノミクス |
| Julia | BioJulia | 高速数値計算 |
| Rust | needletail / rust-bio | 高性能パイプライン |
| 領域 | 例 |
|---|---|
| 創薬 | AlphaFold で薬剤標的構造予測、Recursion / Insilico Medicine |
| 個別化医療 | 患者ゲノムから最適治療選定、Foundation Medicine / Tempus |
| 感染症対応 | COVID-19 変異株追跡、Nextstrain / GISAID |
| 農業育種 | 作物ゲノム編集、CRISPR/Cas9 ターゲット予測 |
| 法医学 | DNA 鑑定、JPA Genomics / Othram |
| 進化生物学 | 系統樹推定、Mesquite / IQ-TREE |
| 古代 DNA | ネアンデルタール解析、Max Planck IEA |
| 形式 | 用途 | サイズ |
|---|---|---|
| FASTA | 配列データ | 数 MB-GB |
| FASTQ | 配列 + 品質スコア | 数 GB-TB |
| BAM/SAM | アラインメント済み | 数 GB-TB |
| VCF | バリアント情報 | 数十 MB-GB |
| PDB | タンパク質 3D 構造 | 数 KB-MB |
| mzML | 質量分析データ | 数 MB-GB |
| HDF5 | 大規模数値データ | 数 GB-TB |
| 用語 | 違い |
|---|---|
| 計算生物学(Computational Biology) | 数理モデル中心、バイオインフォは情報処理中心 |
| システムバイオロジー | 生命システム全体、バイオインフォはデータ解析 |
| ヘルステック | 医療 IT 全般、バイオインフォはその研究側 |
| ケモインフォマティクス | 化学・創薬特化 |
Q1: 個人で AlphaFold は試せる? A: 可。Google Colab Pro($10/月)+ T4 GPU で短いタンパク質なら 30 分以内に予測完了。AlphaFold 3 は商用ライセンスが厳しく、AlphaFold 2 オープンソース版が個人向け実験には現実的。
Q2: バイオインフォマティクス専攻の就職先は? A: 製薬(武田 / アステラス / Roche)、AI 創薬スタートアップ(Recursion / Insilico)、ゲノム解析企業(Tempus / Foundation Medicine)、研究機関、農業育種、CRO、コンサル等。米国年収 $150k-$300k。
Q3: 自作 PC でバイオインフォマティクス学習する場合の最適構成は? A: Ryzen 9 9950X + 64 GB RAM + RTX 4090 + NVMe 4 TB(¥520,000)が最強コスパ。ストレージは外付け 16-30 TB を増設して NGS データ保管。