我的头像,印象中用了有10好几年了,自从我开始做生物信息工作之后,我就想过给它加一些复杂度,半边加上电路板的纹路,另外半边使用DNA的纹路,中间用一种过度效果连接起来,象征生物到信息的转化,这样贴合我的工作领域。但是奈何我并不怎么会P图,实现不了想要的效果。不过今年新出的图像编辑模型,让实现我的想法有了希望。
其实在最早图像生成模型开始火,网上开始出现各种AI美女图的时候,我就把我能用得上的开源和商业模型都试了个遍,试图画出一个至少实现DNA到电路板纹路过度的图,最后只有Gemini给的图形比较能看,现在成为了博客的Banner。
今年,我无意中在微信里看到了阿里qwen-image-edit的介绍,才知道原来还有专门用来进行图像编辑的模型,可以把不同的元素拼在一起生成新图。这正适合实现我更新图形的想法。于是从Github找到了一个简单的前端(我感觉我这个需求,犯不着上comfyui那么复杂),然后自己Fork了一份,加上了模型选择和多图输入。然后就开始修改我的头像了。
正式开始修改图像前,我先用我修改的小工具测试了下qwen-image-edit和wan2.5-i2i-preview的效果,实测还是万象效果更好,因此后面的工作都是用万象完成的。
一步到位的尝试
qwen-image-edit项目 的例子中,编辑的功能还是相当强大的,从替换衣服、修改文字、图形融合都可以。因此我期待的是,只要我给出描述,就能一次性的完成修改。但果然,宣传是宣传,使用是使用,卖家秀和买家秀始终是不一样的。
下面是我的一步到位尝试的效果图合集,第一排最左侧是我的头像原图,其余的是我自己写简单的Prompt得到的三个效果图。我的Prompt大致是下面这样的简单描述。
图1是一个标,我现在想将这个图标的形状,变成由特定的纹路组成的形状,图形左半边是电路板上的图样纹路,右侧则是DNA双螺旋的纹路
尝试了几次后,发现出来的结果与预期差太远,于是我借助ChatGPT来优化Prompt,得到的Prompt大致是下面这样的
在严格保持原始图标整体轮廓、比例、结构完全不变的前提下,对图标进行纹理重构。
该图标由异形字母 S 与 W 组成,其中 S 由上下羽毛状弧形构成,W 位于中央,整体呈环形动态结构。
修改要求:
图标左半部分(包括对应的 S 与 W 区域轮廓)填充为精细的电路板纹路:
包含 PCB 走线、芯片焊盘、微型电子线路
线条清晰、科技感强、具有工程精度
图标右半部分(包括对应的 S 与 W 区域轮廓)填充为DNA 双螺旋结构纹路:
可见规则的双螺旋扭转
包含碱基阶梯结构,具有生物科技与生命科学质感
整体风格要求:
所有纹理仅作为填充纹路,不得改变原有外轮廓
左右两种纹理在中轴处自然过渡,但不混杂
保持图标的简洁性与可识别性,适合作为科技 / 生物信息 / AI 相关品牌 Logo
背景保持纯色或透明
高对比度、矢量感、干净、专业
输出为清晰、现代、可用于品牌视觉系统的图标效果。
有了这个更专业的Prompt后,就能得到第二排那样,极大程度接近我想要效果的图了,但是过程中发生两个问题:
- 原图形有2个弧形颜色较浅,模型似乎大部分时候不会去修改这部分
- 模型没法很好区分我描述的上半部分和下半部分,毕竟这俩部分不是严格的上下,也不是严格的左右…

分步走
在一次性无法完成任务后,我最终选择了分布完成(得,难怪专业工作流要comfyui)。首先我自行改变原图的颜色,避免模型修改遗漏,之后我自行把要分别着色的两部分拆分开,避免模型识别不了我说的两部分,导致纹路修改不准确。
最后我自己拿到两部分结果后,再拼起来。这个过程中,还出现了下半部分绘制DNA纹路时,模型没法正确着色的问题,因此还又加了最后一步的着色。

小结
虽然过程不是很顺利,最终的效果不说100%达到我的预期,也完成了85%吧。而且这个过程比我想的快得多,不算改工具的时间的话,图形部分实际上只试了2小时左右。我之前看过给Vup做图的Naing老师的工作直播,做一个小图样并没有那么简单… 尤其我要的这种电路板和DNA纹路本身有点复杂的情况。用模型能有现在的效果,我已经挺知足了…