DeepSeek-R1強化學習引領推理巔峰國產AI發(fā)起“諾曼底登陸”
2025年的AI大戰(zhàn),比預想的更快來到。 1月20日,在 DeepSeek-V3 發(fā)布僅僅26天后,深度求索公司再次發(fā)布了深度推理版本的 DeepSeek-R1。 而該版本被認為全面對標 OpenAI 發(fā)布的大模型 o1,以及更輕量,但推理更快捷的 o1-mini。
2025年的AI大戰(zhàn),比預想的更快來到。 1月20日,在 DeepSeek-V3 發(fā)布僅僅26天后,深度求索公司再次發(fā)布了深度推理版本的 DeepSeek-R1。 而該版本被認為全面對標 OpenAI 發(fā)布的大模型 o1,以及更輕量,但推理更快捷的 o1-mini。