枝垂れ桜's Twitter Thread

GeminiのWebアプリは安全性／速度重視の簡易リトリーバ＋ワンショット要約構成が多く、取得した断片が「問いに十分な情報（sufficient context）を含まないままLLMに渡る頻度が高いんよな。一方で、 GPT系 (o3, o4-mini) + Bing Browseは、クエリ分解→複数検索→再ランク→再検索という多段構成（LevelRAG 系)を使ってるから、十分な文脈を満たすまで取捨選択して、それからモデルに渡す仕組み。だから誤答・幻覚が減る。なので、o3で一次要約とクエリ最適化をしてからGeminiのdeepreserchに渡すのが現状最強なんよな。いいとこ取りできるので。これ感覚で言ってるわけではなく、ちゃんと仕組みを理解して言ってたんよね。

Share this thread

Read on Twitter

Navigate thread