Published: January 28, 2025
0
33
383
DeepSeek-R1の作り方が分かりやすい。 例えると、それなりに賢いやつ(DeepSeek-V3-Base)に、数学の問題を解かせて論理的思考力を鍛え(DeepSeek-R1-Zero)、そのあとコミュ力を教え込んで人にも分かりやすい説明ができるようになっている(DeepSeek-R1) https://zenn.dev/asap/articles...
DeepSeek-R1の作り方が分かりやすい。 例えると、それなりに賢いやつ(DeepSeek-V3-Base)に、数学の問題を解かせて論理的思考力を鍛え(DeepSeek-R1-Zero)、そのあとコミュ力を教え込んで人にも分かりやすい説明ができるようになっている(DeepSeek-R1) https://zenn.dev/asap/articles...