Project Oscar：人工智能助力开源项目维护，简化重复性任务

Last updated: 2024/07/22 at 11:38 上午

孙婷婷-LowCode低码时代 5月 ago

开源软件支撑了我们日常使用的众多技术，从网络浏览器到操作系统，并且促成了一个充满活力的开发者社区，推动创新的发生。

维护开源项目涉及大量重复性任务，如错误分类和代码审查，这些任务往往耗时耗力。传统上，开源软件项目严重依赖志愿者开发者，这限制了他们投入新想法和新功能的时间。

Google 推出了名为 Project Oscar 的开源贡献者代理架构，旨在减少维护开源软件项目时的手动劳动。Oscar 代理旨在简化管理问题、拉取请求（PR）和论坛问题的工作，这些工作通常消耗大量时间和资源。随着项目的扩大，维护者往往难以跟踪所有相关的上下文和文档，从而影响项目管理的效率。

目前，开源维护工作通常涉及手动处理收到的问题、将查询与现有文档匹配以及管理变更列表（CL）或拉取请求（PR）。

这一过程可能效率低下且容易出错，导致重复劳动和响应延迟。虽然已有工具如 @gopherbot 可以通过自动化某些任务提供帮助，但这些工具往往需要编码配置，这对所有贡献者来说都可能不够友好。

Oscar 引入了一种新颖的方法，利用大语言模型（LLM）来提升开源项目维护的效率。与试图自动化代码编写过程的传统方法不同，Oscar 主要关注减少那些重复且较少吸引人的任务。Oscar 通过创建利用 LLM 行自然语言输入的语义分析的代理，将这些输入转化为可操作的确定性任务。

Oscar 的架构具有三个主要功能：

1. 索引和呈现项目上下文：Oscar 利用 LLM 对项目文档、问题报告和论坛讨论进行嵌入，将这些数据存储在向量数据库中。当有新问题报告时，系统能够检索并呈现高度相关的现有上下文，并快速识别重复或相关的问题。这种即时互动可以节省维护者大量时间，并提高问题分类的效率。

2. 用自然语言控制工具：Oscar 计划允许维护者通过自然语言命令与各种确定性工具进行交互。维护者无需学习特定的 API 或命令，只需用自然语言描述他们的意图，LLM 会将这些描述转化为适当的工具操作。这种方法简化了与项目管理工具的互动，使其更易于使用，并减少了学习曲线。

3. 分析问题报告和 CL/PR：系统旨在对收到的报告进行更深入的语义分析，以对其进行分类、建议标签或请求额外信息。例如，如果报告中缺乏可重现的示例，代理可以提示报告者提供更多详细信息。这一功能确保了报告的完整性和可操作性，有助于更快地解决问题。

Oscar 的初始原型 @gabyhelp bot 在 Go 项目的问题跟踪器中展示了这些功能。该机器人成功地与贡献者互动，提供了相关链接和上下文，并显示出在开源维护中更广泛应用的潜力。

总的来说，Google 的 Project Oscar 有望通过自动化开源维护中那些不那么吸引人的任务，彻底改变开源项目管理的方式。通过将 LLM 与确定性工具集成，Oscar 解决了高效管理问题和拉取请求的需求，最终旨在减少维护者的工作负担，并使更多的贡献者成为高效的维护者。随着 Oscar 的进一步发展，它在改进和简化维护流程方面的能力展现出极大的潜力。

本文由LowCode低码时代根据公开资料整理，如有侵权请联系删除。

– END –