多数 AI 写作工具仅根据训练期间学到的知识来生成文章。斯坦福 OVAL 实验室开发的 STORM 采用了更严谨的方法:它通过多视角提问、网络搜索和信息整合来从头研究主题,产出结构完整的文章。
STORM 的灵感来自于产出高品质维基百科文章的写作过程,它模拟了研究和写作的工作流程。它识别主题的不同观点,从每个角度提出有针对性的问题,收集和评估来源,并产出带有适当引用的全面文章。结果是内容基于真实来源而非模型参数。
系统组件
| 组件 | 功能 |
|---|---|
| 视角选择器 | 识别主题的多样化观点 |
| 问题生成器 | 为网络搜索创建有针对性的问题 |
| 网络搜索器 | 执行搜索并检索相关来源 |
| 大纲构建器 | 以逻辑流程组织结构 |
| 章节撰写器 | 起草每个章节并附带内联引用 |
| 文章组装器 | 合并章节并格式化输出 |
研究与写作管线
flowchart LR
A[主题] --> B[视角发现]
B --> C[多视角问答]
C --> D[网络搜索与来源收集]
D --> E[来源评估]
E --> F[大纲生成]
F --> G[逐章撰写]
G --> H[引用集成]
H --> I[文章组装]
I --> J[最终文章]
C -.->|迭代| C
D -.->|迭代| C管线是迭代的。在视角发现之后,系统提出问题并搜索答案,利用新信息生成更有针对性的问题。这种递归深入确保了对主题的全面覆盖。
质量指标
| 指标 | STORM | GPT-4 直接生成 | Wikipedia 基准 |
|---|---|---|---|
| 事实准确度 | 89% | 72% | 94% |
| 来源质量 | 4.2/5 | 2.8/5 | 4.5/5 |
| 组织结构 | 4.3/5 | 3.5/5 | 4.4/5 |
| 覆盖完整性 | 88% | 65% | 92% |
| 引用准确度 | 91% | 54% | 97% |
如需更多信息,请访问 STORM GitHub 仓库 和 STORM 研究论文。
常见问题
Q:STORM 可以撰写任何主题吗? A:它最适合有大量网络覆盖的完善主题。冷门主题的结果可能有限。
Q:生成一篇文章需要多长时间? A:一篇 2000 字的文章通常需要 5-15 分钟,取决于主题复杂度和网络搜索速度。
Q:STORM 使用特定的 LLM 吗? A:它与模型无关,可通过提供者接口与 GPT-4、Claude、Llama 和其他 LLM 搭配使用。
Q:我可以自定义文章结构吗? A:可以,你可以提供大纲模板,或让 STORM 自动生成一个。
Q:来源会自动验证吗? A:系统会评估来源可信度,但不会验证每个主张。建议进行人工审查。
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!