最近我向 BananaSlice 提交了一个 PR(#11),为其增加了可配置的 Gemini 兼容 API 端点功能。整个过程让我深刻感受到:AI Agent 不仅让人能更快地写代码,也让开源软件的利用方式发生了改变。

过去的问题:差那么一点点
我想很多人都有过这样的经历:找到一个开源工具,功能框架很吸引人,但总差那么一两个小功能才能完全满足自己的使用场景。就拿 BananaSlice 来说,它本身是一个利用 Gemini 的图形 API 来快速编辑图片工具,但它只支持官方的 Gemini API 端点。如果想用自己的代理或者第三方兼容服务(比如 aihubmix 这类平台),就没法用了。
过去碰到这种情况,要么自己 Fork 下来硬啃代码,要么就得换工具。但问题在于——开源项目使用的编程语言五花八门,而一个人不可能精通所有语言。为了一个”差一点点”的需求去学一门新语言或深入一个不熟悉的代码库,成本上完全不划算。
AI Agent 改变了什么
AI Agent 的出现让这个困境有了根本性的改观。当改动比较小时,直接用 AI 来实现,完全不需要自己去深挖那门不熟悉的语言或框架。
以 BananaSlice 为例:项目的核心技术栈是Rust+TypeScript,TypeScipt 我看的懂一点,然而我并不是 Rust 开发者。如果放在两年前,我大概率会直接放弃——为一个简单的配置功能去熟悉 Rust,花的时间远比功能本身的价值大得多。
但这次我用 Opencode + DeepSeek,直接描述了需求(支持自定义 Base URL 和 Model ID),Agent 自动完成了代码修改、前端 UI 添加、数据持久化等全部工作。整个过程我只需要审查生成的代码是否都与我要的功能相关,并测试功能是否正常即可。
从提交到被项目所有者合并,整个过程非常顺畅。项目所有者在回复中说:”一直想加这个功能,但一直没有时间。”——这正是开源项目的常态:维护者精力有限,很多好的改进需求因为没人力去实现而被搁置。
不止是”能用”,更是”贡献”
更有意思的是,AI Agent 让”为自己修功能”和”为项目做贡献”这两件事合一了。
改动完成后,很自然地就可以把 PR 提交给原项目。对于开源项目来说,这意味着:
- 用户能快速得到自己需要的功能
- 项目本身也得到了改进,功能更加完善
- 所有用户都能从中受益
过去因为语言障碍或学习成本放弃的那些”差一点点”,现在完全可以通过 AI 快速补齐,同时把改进回馈给社区,帮助软件迭代更快。
总结
AI Agent 让开源软件的利用门槛降到了前所未有的低点。不再需要精通一门语言才能参与或改造一个项目,只要需求明确、改动合理,AI 能帮你完成从代码实现到 PR 提交的整个流程。
这不仅提高了个人效率,也加速了整个开源生态的演进。以后看到心仪的开源项目但差那么一两个功能时,不妨让 AI Agent 试试——说不定你的 PR 就是项目需要的那个推动力。