关于 Paper Banana

它服务的不是“画图灵感”阶段 而是论文图还不够清楚的阶段

Paper Banana 想解决的是科研写作里最常见的一段空档:论文内容已经越来越清晰,但图表还停留在草稿、截图、PPT 或风格混乱的状态。我们不把图表当作通用图像生成任务,而是把它看成论文论证的一部分,需要结构、统一性和足够经得起审稿的表达清晰度。

这里复用了首页里的几张代表性作品图

多智能体迭代优化规划框架

多智能体迭代优化规划框架

编程与图像维度性能对比图

编程与图像维度性能对比图

风格优化后的发表级方法论示意图

风格优化后的发表级方法论示意图

Paper Banana 是什么,不是什么

这个页面不再重复首页卖点,而是把产品边界讲清楚,避免预期错位。

它不是一个通用 AI 画图工作台

Paper Banana 的重点不是开放式视觉创作,而是方法图、统计图、概念解释图,以及论文里那些需要重做和统一风格的技术图表。

它也不是科研判断的替代品

它能帮你把结构表达得更清楚,但不会替你决定实验设计、叙事逻辑或结论是否成立。论文质量仍然要靠作者自己把关。

它更像一条图表工作流,不是单一模型入口

产品的核心不只是生成一张图,而是把理解、规划、风格、渲染和复查拆开处理,让结果更接近论文图,而不是一张好看但不够贴题的图像。

界面背后的产品原则

大多数图像工具优先考虑视觉自由度,Paper Banana 优先考虑科研表达。

结构优先于装饰

框、箭头、分组、标签和阅读顺序的重要性高于装饰效果。如果图好看但不好懂,它就是失败的。

整篇论文的统一性很重要

研究论文通常不只一张图。Paper Banana 关注的是方法图、结果图和解释图能否看起来属于同一篇论文。

反复修改是常态,不是例外

导师、合作者和 reviewer 一定会提修改意见。好的工作流应该让“生成更好的版本”足够便宜,而不是每次都从头重画。

5-stage workflow

为什么要用多智能体流程

单个 prompt 可以生成图像,但往往不能稳定地同时完成这些任务:理解方法段落、规划图表结构、贴近论文风格,并严格复查自己的结果。Paper Banana 把这些任务拆成多个阶段处理,就是为了提高可用性和稳定性。

01

Retriever

先找到更像论文图的视觉参考,让生成不是凭空开始,而是有学术语境可依。

02

Planner

把文本或数据转成明确的作图方案,包括组件、层级、连接关系、流向和重点。

03

Stylist

把图表推向更符合投稿场景的视觉状态,包括字体、间距、对比度和整体平衡。

04

Visualizer

真正产出图表结果。对于量化图表,优先通过可执行绘图逻辑而不是纯视觉猜测来生成。

05

Critic

检查结果是否忠实、易读、完整;如果不够好,就推动下一轮修正。

它最适合出现在论文流程的哪个阶段

Paper Banana 最有价值的时刻,通常不是研究刚开始的时候,而是研究已经成形、图表却还在拖后腿的时候。

写作中期

尽早把方法图和结果图放进稿子里,让论文在写作阶段就更容易讨论和迭代。

统一和清理阶段

把来自 PPT、截图或多位合作者的图整理成更统一、更像论文的一套视觉结果。

投稿前最后一轮

在截稿前让图表质量、可读性和一致性追上论文正文,而不是最后几天才开始救火。

未发表的研究内容应该始终属于你

论文文本、实验数据和图表输入只用于当前生成任务,不应变成训练资产。Paper Banana 面向的是那些经常处理未发表、敏感或尚不适合外流内容的研究者。

如果论文已经讲清楚了,图表也应该一样清楚

需要立即做图时直接进入生成器;如果你想先判断哪种工作流更合适,再去看功能页。