美国卡内基梅隆大学艾丹·张CMU人工智能研究进展

当艾丹·张来到卡内基梅隆大学时,他怀揣着对人工智能的浓厚好奇,并渴望探索这一领域的边界。这份兴趣驱使他投身于一项尤为复杂的挑战:如何改进模型生成与优化代码的方式。他的目标是提升代码生成的准确性、效率与适应性,从而帮助开发者更快速、更可靠地构建软件。

张在卡内基梅隆大学的科研之旅始于语言技术研究所(Language Technologies Institute)的一个实验室。他很快融入了实验室的每周例会,并在博士导师的指导下开展研究。如今,作为计算机科学学院人工智能方向的一名大二学生,他通过学校的“夏季本科生研究奖学金”(SURF)项目,在研究道路上取得了扎实进展。

“我一直被大型语言模型的工作方式深深吸引,”张分享道,“机器竟能以近乎人类的方式交流,这太不可思议了。我总想弄明白这背后的可能。”

一种更智能的机器编程教学法
张的SURF项目聚焦于代码生成这一人工智能前沿领域,其核心在于训练大语言模型根据自然语言提示生成可执行代码。然而,他并未完全依赖传统训练范式,而是积极探索一种多轮强化学习方法——使模型能够像人类调试代码一样,从反馈中迭代学习、持续优化。

“编码本质上是一个多步骤的过程,”他解释道,“你编写代码、进行测试、获得反馈、不断改进。我们试图教会模型掌握同样的思路——不仅奖励它们一次就写对,更鼓励它们通过多轮尝试实现进步。”

该项目旨在构建一个性能超越现有模型的先进代码生成系统,以验证这种新型训练方法的有效性与优越性。

挑战与意料之外的发现
尽管多轮强化学习前景广阔,张在实验中发现,现有模型往往难以通过反馈实现实质性改进。

“它们很容易陷入循环,”他指出,“即使经过多轮反馈,进步也十分有限。就像模型在早期就固化了某种结论,难以跳出已有框架。”

张认为,这种局限可能源于模型现有的训练目标——它们被过度优化为“首次即正确”,却未充分学习如何吸纳反馈、持续迭代与动态调整。

从研究走向实际影响
张对模型“幻觉”问题——即模型生成看似合理但实际错误或误导性信息的现象——始终抱有研究热情,甚至考虑将其转化为创业方向。

“如果我们能开发出一种产品,有效检测并过滤大语言模型中的幻觉,那将具有重要的实际意义,”他表示。

无论未来是选择创业,还是继续深耕学术,张都深深感激卡内基梅隆大学所提供的平台与资源。

“没有卡内基梅隆,这一切都无从谈起,”他感慨道,“导师的支持、实验室的设施、身边充满启发的同学们——所有这些共同塑造了我目前的方向。”

眼下,张正持续完善他的模型,并准备将研究成果整理提交至学术会议。而他已开始眺望更远的未来:

“我希望自己的研究能产生实际影响——无论是通过创业,还是投入工业界的前沿探索。我相信,这个项目是一个坚实而宝贵的起点。”