
安野貴博 @ 新刊『1%の革命』が2/6発売予定です!
takahiroanno
Published: January 28, 2025
48
505
3.6k
DeepSeek R1で、吐き出される思考過程を人間にとってわかりやすくしろ!って訓練したら、わかりやすくなったけど純粋な思考能力は下がったという話(言語一貫性報酬の話)、味わい深い 人間も同じな気がする。何言ってるのかよくわからないけどめっちゃ賢い人っているじゃん。
takahiroanno
DeepSeek R1で、吐き出される思考過程を人間にとってわかりやすくしろ!って訓練したら、わかりやすくなったけど純粋な思考能力は下がったという話(言語一貫性報酬の話)、味わい深い 人間も同じな気がする。何言ってるのかよくわからないけどめっちゃ賢い人っているじゃん。