Streamdown:Vercel 的流式 Markdown 渲染器
LLM 驱动聊天界面的兴起造成了一个独特的用户体验问题:看着文本逐字符出现令人兴奋,但看着部分渲染的 Markdown 闪烁和跳动却令人沮丧。当 LLM 生成代码块、表格或嵌套列表时,标准的 Markdown 渲染器无法处理 Token 的增量到达。它们等待完整的输出,然后一次性渲染全部 …
LLM 驱动聊天界面的兴起造成了一个独特的用户体验问题:看着文本逐字符出现令人兴奋,但看着部分渲染的 Markdown 闪烁和跳动却令人沮丧。当 LLM 生成代码块、表格或嵌套列表时,标准的 Markdown 渲染器无法处理 Token 的增量到达。它们等待完整的输出,然后一次性渲染全部 …
创建演示文稿是开发人员的常见任务,然而主流工具——PowerPoint、Google Slides 和 Keynote——在以终端为中心的工作流程中显得沉重且格格不入。presenterm(GitHub 上的 mfontanini/presenterm)提供了一个引人注目的替代方案:一个将 …
基于文本的图表生成已彻底改变了开发人员创建和维护可视化文档的方式,而 Mermaid(GitHub 上的 mermaid-js/mermaid)正是开创这种方法的库。通过允许使用简单、人类可读的文本语法定义图表,Mermaid 使图表创建变得像编写 Markdown 一样容易——并使图表能 …
Markdown 已成为网络上写作的事实标准,为整个互联网上的文档、博客文章、评论和技术沟通提供支持。markdown-it(GitHub 上的 markdown-it/markdown-it)是一个 JavaScript 库,为这个生态系统的很大一部分提供动力,提供了一个快速、可扩展且符 …
任何文档理解 AI 管道的第一步都是将原始文档转换为机器可读的文本。这个看似简单的任务充满了挑战:具有复杂布局的 PDF、无可提取文本的扫描文档、包含合并单元格的 Excel 文件、包含嵌入图片的 PowerPoint 演示文稿。MarkItDown,微软的开源文档转换工具,正面应对这些挑 …
PDF 文档仍然是知识传播最常见的格式之一,然而它们也是最难以程序化处理的格式。跨页面的表格、多栏布局、数学方程式、页眉和页脚都共同导致了简单提取工具的失败。Marker 以深度学习方法应对这一挑战,像人类读者一样理解文档结构——通过识别视觉布局模式,而不仅仅是遵循文本顺序。