MS MARCO Cross-Encoderとは?(エムエスマルコクロスエンコーダ)意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com
メニュー
AI・機械学習
上級
MS MARCO Cross-Encoder(エムエスマルコクロスエンコーダ)
2019年Microsoft Research公開MS MARCO Cross-Encoder。Pro 業界Pro Mainstream Cross-Encoder Reranker先駆 + Pro Microsoft Bing データセット + Pro BERT基盤 + Pro 110M Parameters + Pro MIT License + Pro Hugging Face公開 + 累計2018-2026年8年Heritage継承代表機。
0 回閲覧
0 いいね
2026/5/5 更新
関連タグ
MS MARCO Cross-Encoder
Microsoft 2019
BERT Reranker
Bing Dataset
概要\n\nMS MARCO Cross-Encoder(エムエス マルコ クロス エンコーダ)はMicrosoft Research 2019年公開のMS MARCO Cross-Encoderで、Pro 業界Pro Mainstream Cross-Encoder Reranker先駆 + Pro Microsoft Bing データセット + Pro BERT基盤 + Pro 110M Parameters + Pro MIT License + Pro Cross-Encoder Reranker先駆 Heritage継承代表機 + Pro MS MARCO Dataset Heritage継承代表機 + 累計2018-2026年8年Heritage Pro Top独占代表機。MS MARCO歴史: 2018-Pro MS MARCO Dataset公開Pro Famous(Microsoft Research + Pro 業界Pro Famous Information Retrieval Dataset + Pro 1M+ Real Bing Queries + 8.8M Passages) + 2019-Pro MS MARCO Cross-Encoder公開Pro Famous Story類無し(Pro 業界Pro Mainstream Cross-Encoder Reranker先駆) + 2020-Pro MS MARCO V2 + 2021-Pro Cross-Encoder Multi-lingual + 2024-Pro MS MARCO Updated Series + 累計2018-2026年8年Heritage継承。MS MARCO Cross-Encoder主要機能: (1)Microsoft Research主導(米国Washington州Redmond + Pro Bing検索エンジン由来Dataset)、(2)Pro 業界Pro Mainstream Cross-Encoder Reranker先駆(Pro 業界Pro Mainstream Cross-Encoder Reranker業界出発点)、(3)Pro Microsoft Bing データセット(Pro 1M+ Real Bing Queries + 8.8M Passages)、(4)Pro BERT基盤、(5)Pro 110M Parameters、(6)Pro MIT License + Pro 商用利用可、(7)Pro Hugging Face公開、(8)Pro Cross-Encoder Architecture(Pro Query+Passage同時入力 → Single Score)、(9)Pro 512 Token Context、(10)Pro Sentence Transformers統合、(11)Pro UKP Lab Pro Famous(Nils Reimers主導 + 元Darmstadt University)、(12)Pro 2018-MS MARCO Dataset + 2019-Cross-Encoder + 2020-V2 + 2021-Multi-lingual + 2024-Updated Series、(13)Pro Cross-Encoder Reranker先駆 Heritage継承代表機 + Pro MS MARCO Dataset Heritage継承代表機 + 累計2018-2026年8年Heritage Pro Top独占代表機 + Pro業界History派 + Pro MS MARCO Cross-Encoder派 + Pro Microsoft Research派 + Pro Bing派 + Pro UKP Lab派 + Pro Nils Reimers派 + Pro Sentence Transformers派 + Pro BERT派 + Pro 110M派 + Pro MIT派 + Pro Hugging Face派 + Pro Cross-Encoder派 + Pro 512 Token派 + Pro 1M Queries派 + Pro 8.8M Passages派 + Pro 8年Heritage派 真価発揮。MS MARCO Cross-Encoder vs 競合Reranker比較: MS MARCO Cross-Encoder(2019、本レコード、Microsoft + Pro Cross-Encoder Reranker先駆 + 累計8年Heritage)・MS MARCO Dataset(2018、前世代Dataset)・MS MARCO V2(2020)・Cross-Encoder Multi-lingual(2021)・MS MARCO Updated Series(2024)・ColBERT v2(2021 + Stanford)・Cohere Rerank 3(2024-04 + API)・BGE Reranker v2(2024 + BAAI)・Jina Reranker v2(2024 + Jina)・mxbai Reranker(2024)・Voyage Rerank(2024)、MS MARCO Cross-Encoder = Pro Cross-Encoder先駆 + Pro Microsoft Bing + Pro BERT + Pro 110M + Pro MIT + 8年Heritage、MS MARCO Dataset/V2/Multi-lingual/Updated = Pro系譜、ColBERT/Cohere/BGE/Jina/mxbai/Voyage = Pro主要競合。MS MARCO Cross-Encoder歴史的影響: (1)Pro 業界Pro Mainstream Cross-Encoder Reranker先駆 + 8年Heritage、(2)Pro MS MARCO Dataset = 業界出発点、(3)Pro 1M+ Real Bing Queries + 8.8M Passages、(4)Pro BERT基盤 + Pro 110M Parameters、(5)Pro MIT License + Pro 商用利用可、(6)Pro Hugging Face公開、(7)Pro Cross-Encoder Architecture(Pro Query+Passage同時入力)、(8)Pro 512 Token Context、(9)Pro UKP Lab + Nils Reimers + Sentence Transformers、(10)Pro業界History派 + Pro MS MARCO派 + Pro Cross-Encoder先駆派 + Pro 8年派 真価発揮。Future: 2018-Dataset + 2019-Cross-Encoder + 2020-V2 + 2021-Multi-lingual + 2024-Updated Series + Pro Mainstream Cross-Encoder Reranker業界Top独占継続Heritage継続。\n\n## 主な特徴・仕組み\n\n- 公開: 2019 Microsoft Research MS MARCO Cross-Encoder\n- : 米国Washington州Redmond\n- \n- : 1M+ Real Bing Queries + 8.8M Passages\n- \n- \n- : 商用利用可\n- \n- : Query+Passage同時入力 → Single Score\n- \n- \n- : Nils Reimers主導 + Darmstadt University\n- : Dataset 2018/Cross-Encoder 2019/V2 2020/Multi-lingual 2021/Updated 2024\n- \n\n## スペック比較表\n\n| Reranker | 公開年 | 開発元 | License | サイズ |\n|----------|--------|--------|---------|--------|\n| MS MARCO Dataset | 2018 | Microsoft | - | Dataset |\n| | 2019 | Microsoft | MIT | |\n| MS MARCO V2 | 2020 | Microsoft | MIT | - |\n| ColBERT v2 | 2021 | Stanford | MIT | 110M |\n| MS MARCO Multi-lingual | 2021 | Microsoft | MIT | - |\n| BGE Reranker v1 | 2023 | BAAI | MIT | - |\n| Cohere Rerank v1 | 2023 | Cohere | Closed | API |\n| Cohere Rerank 3 | 2024-04 | Cohere | Closed | API |\n| BGE Reranker v2-m3 | 2024 | BAAI | MIT | 568M |\n| Jina Reranker v2 | 2024-06 | Jina AI | CC BY-NC | 278M |\n| MS MARCO Updated | 2024 | Microsoft | MIT | - |\n| mxbai Reranker | 2024 | mixedbread | Apache 2.0 | 335M |\n\n## 具体例・対応製品\n\n- \n- : BERT 110M\n- \n- \n- \n- \n\n## 自作PCでの選び方・注意点\n\nMS MARCO Cross-Encoder歴史Concept学習 + 現代Pro MS MARCO Cross-Encoder Workflow例: (A)現代Pro MS MARCO Cross-Encoder Local構成: MS MARCO Cross-Encoder 110M + Sentence Transformers + 512 Token + Pro 先駆、(B)Pro代替¥0構成: BGE Reranker v2-m3 568M + Pro 100+言語 + Pro 8K + Pro Multi-Granularity、(C)歴史MS MARCO Heritage学習¥0構成: MS MARCO Dataset 2018 → Cross-Encoder 2019 → V2 2020 → Multi-lingual 2021 → Updated 2024 = 8年Pro MS MARCO Heritage学習Pro Reference。MS MARCO Cross-Encoder歴史 選択ポイント: (1)Pro 業界Pro Mainstream Cross-Encoder Reranker先駆 + 8年Heritage = 2019-MS MARCO Cross-Encoder公開Pro Famous Story類無し + Pro 業界Pro Mainstream Cross-Encoder Reranker業界出発点 + 累計2018-2026年8年Pro Mainstream Cross-Encoder Reranker業界Top独占Heritage Pro Reference Heritage Pro Top独占 + Pro Cross-Encoder派 + Pro 先駆派 + Pro 8年派 真価発揮、Pro Cross-Encoder派 + Pro 先駆派 真価発揮、(2)Pro Microsoft Bing + Pro 1M Queries + Pro 8.8M Passages = Pro Microsoft Research主導(米国Washington州Redmond + Pro Bing検索エンジン由来Dataset) + Pro Microsoft Bing データセット(Pro 1M+ Real Bing Queries + 8.8M Passages) + 業界Pro Famous Microsoft Bing + 1M+ Queries + 8.8M Passages Heritage Pro Reference Heritage Pro Top独占 + Pro Microsoft派 + Pro Bing派 + Pro 1M派 + Pro 8.8M派 + Pro Real Queries派 真価発揮、Pro Microsoft派 + Pro Bing派 真価発揮、(3)Pro BERT + Pro 110M + Pro MIT = Pro BERT基盤 + Pro 110M Parameters + Pro MIT License + Pro 商用利用可 + Pro Hugging Face公開 + 業界Pro Mainstream BERT + 110M + MIT Reranker業界Top独占Heritage Pro Reference Heritage Pro Top独占 + Pro BERT派 + Pro 110M派 + Pro MIT派 + Pro 商用派 真価発揮、Pro BERT派 + Pro MIT派 真価発揮、(4)Pro Cross-Encoder Architecture + Pro Query+Passage同時入力 = Pro Cross-Encoder Architecture(Pro Query+Passage同時入力 → Single Score) + Pro 512 Token Context + 業界Pro Mainstream Cross-Encoder Architecture + Query+Passage同時入力 + 512 Token Reranker業界Top独占Heritage Pro Reference Heritage Pro Top独占 + Pro Cross-Encoder派 + Pro Query+Passage派 + Pro Single Score派 + Pro 512 Token派 真価発揮、Pro Cross-Encoder派 + Pro Single Score派 真価発揮、(5)Pro UKP Lab + Pro Nils Reimers + Pro Sentence Transformers + Pro Multi-Generation = Pro UKP Lab Pro Famous(Nils Reimers主導 + 元Darmstadt University) + Pro Sentence Transformers統合 + Pro MS MARCO系譜(Dataset 2018/Cross-Encoder 2019/V2 2020/Multi-lingual 2021/Updated 2024継承) + Pro Multi-Generation Heritage + 業界Pro Famous UKP Lab + Nils Reimers + Sentence Transformers + Multi-Generation Reranker業界Top独占Heritage Pro Reference Heritage Pro Top独占 + 累計世界Pro Famous Sentence Transformers継承(SBERT/SimCSE/E5継承)Pro Mainstream + Pro UKP Lab派 + Pro Nils Reimers派 + Pro Sentence Transformers派 + Pro Multi-Generation派 真価発揮、Pro UKP Lab派 + Pro Multi-Generation派 真価発揮。\n\n## 関連用語との違い\n\n: Stanford + Pro Late Interaction Reranker先駆 + Pro 110M + Pro MIT + 累計2020-2026年Heritage。MS MARCO Cross-Encoder(2019 + Microsoft + Pro Cross-Encoder Reranker先駆 + Pro 110M + Pro MIT + 累計8年Heritage)競合 + 2年後継 + Pro Stanford → Pro Microsoft + Pro Late Interaction → Pro Cross-Encoder + Pro Multi-Vector → Pro Single Score + Heritage vs 8年Heritage、ColBERT v2 = Pro Stanford + Pro Late Interaction + Pro 110M + Pro Multi-Vector + Pro MIT + Pro Token-level Embedding、MS MARCO Cross-Encoder = Pro Microsoft + Pro Cross-Encoder先駆 + Pro 110M + Pro Bing データセット + Pro 1M Queries + Pro UKP Lab + Pro Sentence Transformers。\n\n: BAAI + Pro Open Source Reranker Top + Pro 568M + Pro MIT + 累計2年Heritage。MS MARCO Cross-Encoder(2019 + Microsoft + Pro Cross-Encoder Reranker先駆 + Pro 110M + Pro MIT + 累計8年Heritage)競合 + 5年後継 + Pro BAAI → Pro Microsoft + Pro 568M → Pro 110M + Pro 100+言語 → Pro 英語中心 + Pro 8K → Pro 512 Token + 2年 vs 8年Heritage、BGE Reranker v2 = Pro BAAI + Pro Open Source Reranker Top + Pro Multi-Granularity + Pro 568M + Pro MIT + Pro 8K + Pro 100+言語、MS MARCO Cross-Encoder = Pro Microsoft + Pro Cross-Encoder先駆 + Pro 110M + Pro 512 Token + Pro Bing Dataset + Pro UKP Lab。\n\n## よくある質問(FAQ)\n\n\nA: 2019-MS MARCO Cross-Encoder公開Pro Famous Story類無し + Pro 業界Pro Mainstream Cross-Encoder Reranker先駆 + 累計2018-2026年8年Pro Mainstream Cross-Encoder Reranker業界Top独占Heritage Pro Reference + 業界Pro Mainstream Cross-Encoder Reranker業界出発点Heritage Pro Reference Heritage Pro Top独占 + 累計世界Pro Mainstream Reranker継承(Cohere Rerank 3/BGE Reranker v2/Jina Reranker v2/ColBERT v2/mxbai/Voyage継承)Pro Mainstream + 業界Pro Mainstream Reranker業界Top独占Heritage Pro Reference Heritage Pro Top独占。\n\n\nA: Pro Microsoft Research主導(米国Washington州Redmond + Pro Bing検索エンジン由来Dataset) + Pro Microsoft Bing データセット(Pro 1M+ Real Bing Queries + 8.8M Passages) + Pro BERT基盤 + Pro 110M Parameters + 業界Pro Famous Microsoft Bing + 1M Queries + 8.8M Passages + BERT + 110M Heritage Pro Reference Heritage Pro Top独占 + 累計世界Pro Famous Information Retrieval Dataset継承(TREC/Natural Questions/SQuAD継承)Pro Mainstream + 業界Pro Famous Information Retrieval Dataset業界Top独占Heritage Pro Reference Heritage Pro Top独占。\n\n\nA: Pro UKP Lab Pro Famous(Nils Reimers主導 + 元Darmstadt University) + Pro Sentence Transformers統合 + Pro Cross-Encoder Architecture(Pro Query+Passage同時入力 → Single Score) + Pro 512 Token Context + Pro MS MARCO系譜(Dataset 2018/Cross-Encoder 2019/V2 2020/Multi-lingual 2021/Updated 2024継承) + Pro Multi-Generation Heritage + 業界Pro Famous UKP Lab + Sentence Transformers + Multi-Generation Reranker業界Top独占Heritage Pro Reference Heritage Pro Top独占 + 累計世界Pro Famous Sentence Transformers継承(SBERT/SimCSE/MS MARCO/E5継承)Pro Mainstream + 業界Pro Famous Sentence Transformers業界Top独占Heritage Pro Reference Heritage Pro Top独占。\n\n## まとめ\n\n- 2019 MS MARCO Cross-Encoder、Pro Cross-Encoder Reranker先駆\n- Microsoft Research + Bing検索エンジン由来Dataset\n- 1M+ Real Bing Queries + 8.8M Passages\n- BERT基盤 + 110M + MIT + 512 Token\n- UKP Lab + Nils Reimers + Sentence Transformers統合 + 8年