近期又换了一批常用的 AI 工具,有惊喜也有无语,记录一下真实感受。
Multica:赛博牛马管理大师
Multica 最近的更新让人眼前一亮。开发速度一直很快,相比上次提到它,现在已新加入了定时任务和团队功能,可以直接设置定时触发让 Agent 干活,还能和团队成员一起协作。
对于个人开发者来说,Multica 这种”AI 原生任务管理平台”的思路确实走得挺前。只要一次配置,可以不需要再在多个工具之间来回切换,通过同意的平台就能进行任务的设置分配和执行。同时回查也比直接看Agent软件的记录更方便。
MiniMax:逐渐显出劣势
在前公司的时候一直用的是Minimax的Plan,便宜,量够用,能完成我需要的任务。但是最近逐渐感觉不那么好用了,尤其是有了Deepseek v4 后,对比明显。
首先是上下文长度,其实我要处理的都是较短的脚本,理论上不需要太长的上下问,但是当想让Agent完全自主进行一轮调试时,因为要读大量的运行日志,Minimax就经常超长度退出了… 而 DeepSeek V4 的百万上下文加持下,不说能一次做对,起码能完成把任务做完,然后我就可以根据具体的执行日志再去排查剩余的问题。
其次是问题准确率,虽然这个相当玄学,但是最近的深度学习环境配置过程中,Minimax一次性配置对的概率确实不高,而 Deepseek 虽说配出的环境不一定合适,但起码都能跑。
当然模型都是可以随着时间改进的,还是保持关注,不过近期我可能就不怎么会继续用Minimax了…
Google One:真香
这个倒是要好好夸一下。Google One 订阅现在包含了 NotebookLM 和多模态 Gemini 的访问权限,对于经常看文献的人来说简直是神器。
NotebookLM 处理 各种的能力非常强,区别于之前用过的一些RAG,它能非常准确的根据上传论文中的信息,来回答你对论文的具体。同时Google内部的多模态整合还能让我通过Notebooklm直接绘制示意图,这让我理解论文快了非常多(深度学习论文经常写公式,看起来很费劲)。一个订阅把写论文、看文献、查资料的需求全包了,性价比确实高(如果是日区号,最低档的订阅甚至比国内厂商的会员都便宜…)。
Gemini-cli:KPI 产物?
最后必须吐槽一下 Gemini-cli。如前所述,Google旗下的Notebooklm,Gemini 模型本身效果都非常出色,但他们做的 CLI 工具做得实在太敷衍了。
工具调用体验很差,经常出现调了没反应或者返回格式不对的情况。输出速度也慢,同样是流式输出,比同类工具慢了一大截。整个体验下来,感觉就是猪队友拖累了队内大C的感觉,让人怀疑这玩意是不是别人有,我们也得有的KPI产物。不说好用,连距离能用都还有距离。
以上是近期使用 AI 工具的一些真实感受。有好用的工具,也有让人想吐槽的,希望这些产品都能越做越好吧。