Published: June 26, 2025
1
33
197
GeminiのWebアプリは安全性/速度重視の簡易リトリーバ+ワンショット要約構成が多く、取得した断片が「問いに十分な情報(sufficient context)を含まないままLLMに渡る頻度が高いんよな。一方で、 GPT系 (o3, o4-mini) + Bing Browseは、クエリ分解→複数検索→再ランク→再検索という多段構成(LevelRAG 系)を使ってるから、十分な文脈を満たすまで取捨選択して、それからモデルに渡す仕組み。だから誤答・幻覚が減る。 なので、o3で一次要約とクエリ最適化をしてからGeminiのdeepreserchに渡すのが現状最強なんよな。いいとこ取りできるので。これ感覚で言ってるわけではなく、ちゃんと仕組みを理解して言ってたんよね。
