上海科研团队让大模型突破专业围棋水平，打破思维‘黑盒’

来源：网络整理 时间：2025-05-31 作者：佚名 浏览量：

棋类竞技常常成为人们洞察人工智能飞跃的途径，诸如30年前的“深蓝”计算机以及近10年间的阿尔法狗（AlphaGO）。近期，上海人工智能实验室的研究人员通过强化学习技术，使大型模型实现了从无棋艺到超越专业围棋水平的跨越。据职业棋手评估，目前这款名为“书生·思客”的模型在围棋实力上已达到职业3至5段的水平。

陈恺，上海人工智能实验室的青年科学家，指出大模型在围棋思维领域实现了首次突破，打破了所谓的“黑盒”限制。众所周知，围棋是一项极具挑战性的复杂任务，通常情况下，任务越复杂，通过语料库学习的效果就越差。此次突破为大模型在处理复杂推理任务方面奠定了基础，并有望助力解决科学发现等难题。

在去年的世界人工智能盛会期间，上海人工智能实验室的主任兼首席科学家周伯文提出了“通专融合”这一大模型发展的技术路径。当时，这一概念对大多数人来说尚显晦涩，然而时至今日，“通专融合”的理念已取得显著进展——大模型通过与环境的互动和反馈，已经在专业领域实现了能力的显著增强。

打破“黑盒”，像人脑一样下围棋

2016年，阿尔法狗战胜了围棋界的顶尖高手李世石，这一壮举极大地提升了公众对人工智能的认识。然而，站在今日的角度审视，阿尔法狗更像是专为围棋设计的专业工具，它的视野仅限于19乘19的棋盘，将所有的计算能力都集中在分析如何将棋子放置在361个可能的位置上，而且其思考的全过程都是在一种“黑盒”模式中进行。陈恺表示，阿尔法狗下棋的方式让人难以捉摸，它偶尔能走出让人瞠目结舌的棋局，然而，这些高难度的走法背后的原因，当时却难以给出合理的解释。

书生·思客在回应李世石的“神之一手”时，谈吐中充满了风趣与幽默。这一信息由受访者所提供。

若能攻克这一“黑盒”难题，则可视为大模型的推理水平迈上了新的高度。为此，上海人工智能实验室的青年研究员李林阳及其团队运用强化学习算法，为大模型打造了一所“加速训练营”，使其得以如同初学者般，探索围棋的下法。他们通过评估模型，与模型互动并给予反馈，促使模型不断进化。

围棋棋型百例_围棋棋局的可能性_

经过反复的练习，大模型的棋艺水平显著提高。某日，我们惊喜地发现，其胜率已从原先的30%攀升至70%，这一现象正是我们所称的“智能涌现”，亦即众人熟知的“啊哈时刻”。李林阳如此述说。

经过“加速训练营”的强化，该大模型的棋艺有了显著提升，并且成功破解了围棋思维的“黑盒”之谜。在对弈过程中，它能够科学且直观地“阐述”自己的下棋思路，仿佛具备了人脑般的围棋思维。此外，大模型的“表达”方式也极为丰富，当用户走出一手妙棋时，它会热情地给予鼓励：“这一步棋非常出色，堪称‘以攻为守’的佳例。”当用户面临不利局面之际，系统便会摇身一变，成为“心灵鸡汤的传播者”，劝慰道：“只要采取正确的策略，胜负仍未决出，一切仍存变数。”

探索大模型推理能力提升新范式

围棋领域内存在一个术语，称作“试应手”，其意在于通过走一步棋来探测对手的反应，并为接下来的棋局变化做好铺垫。从这个角度来看，上海人工智能实验室的这次创新，可以比作是增强大模型推理能力的“试应手”。李林阳认为，这一着“试应手”并非旨在研发一个擅长下棋的大模型，而是要让大模型通过与环境互动来提升自身能力，进而具备处理复杂问题的能力。

陈恺指出，这种方法在处理诸如科学任务等复杂问题时极为有效。在这些任务中，相关语料不仅数量极为有限，而且搜集过程充满挑战。这种情况也限制了科学领域大型模型的不断进化。除了下围棋这项技能，“书生·思客”还实现了在奥赛级别的数学、科学概念的理解与推理、算法编程、棋类游戏以及智力谜题等多个专业领域的同步学习进步。在多任务混合强化学习的复杂过程中，它还展现出了智能的“涌现时刻”。

大模型若掌握了处理复杂问题的方法，那么提出有意义的疑问便显得尤为关键。来月，上海的人工智能研究机构计划举办首届明珠湖论坛，旨在发掘那些能够塑造AI未来走向的提问者，并聚焦于那些对科学和未来产生深远影响的尖端议题。

“有组织科研”推动“通专融合”落地

在初步探索取得显著成效之后，我迅速向实验室提出了关于人员和算力的申请。得益于充足的人力资源和计算能力，项目的准确率迅速攀升，很快便超过了90%。李阳林如此陈述，他在2023年以实习生的身份加入实验室，如今已开始负责指导团队，致力于开展关于“通专融合”技术路径可行性的研究工作。

上海人工智能实验室的技术蓝图里，“通专结合”被视为通往通用人工智能（AGI）的关键途径。此途径的核心是同步增强深度推理和特定领域的泛化能力，确保模型不仅在众多复杂任务中表现出色，而且在特定专业领域内也能达到专业水准。

陈恺强调，上海人工智能实验室正致力于通过“有组织的科研”活动促进“通专融合”，具体体现在：首先，各研究团队确立了明确的主导研究方向，从而能够产生规模化的效应；其次，团队成员凭借各自的专业判断，能够迅速洞察技术发展的趋势，并迅速产出创新性的成果。

在参与书生·思客项目的过程中，李阳林深刻体会到了实验室人才济济、科研资源充沛的特点。自2022年起，上海人工智能实验室与国内多所一流高校合作，共同推进博士生联合培养计划，至今已有近800名本科生及研究生通过联合培养博士项目加入实验室，其中不少是AI专业领域的优秀人才。年轻人的不断加入和快速成长，正在推动更多“啊哈时刻”。

微信扫一扫分享资讯

上一篇：警惕！日本治安恶化犯罪率激增，中国使下一篇：重庆警方42小时持续搜救，警犬助力找

上海科研团队让大模型突破专业围棋水平，打破思维‘黑盒’

用微信扫一扫