Categories

AI

FunClip:开源 AI 音频剪辑与处理工具
AI

FunClip:开源 AI 音频剪辑与处理工具

音频编辑通常需要手动检查波形并进行精确裁剪,以隔离所需的片段。由 ModelScope 团队开发的 FunClip 改变了这一点,它应用 AI 驱动的语音识别和内容理解来自动化音频剪辑任务。 FunClip 构建在 ModelScope 的 AI 模型生态系统之上,能够转录音频、根据关键字 …

FastAPI MCP:将 FastAPI 端点暴露为 MCP 工具
AI

FastAPI MCP:将 FastAPI 端点暴露为 MCP 工具

如果你有一个 FastAPI 应用程序,那么你就拥有了一个 AI 代理工具的潜在宝库。由 tadata-org 创建的 FastAPI MCP,可自动将你现有的 FastAPI 端点转换为 MCP 兼容的工具,AI 助手可以发现并调用这些工具,无需对你的应用程序进行任何代码修改。 该工具通 …

ExLlamaV3:高性能 LLM 推理引擎
AI

ExLlamaV3:高性能 LLM 推理引擎

在消费级硬件上运行大型语言模型需要高效的推理引擎,从可用的 GPU 内存中榨取每一滴性能。由 turboderp 团队开发的 ExLlamaV3 是可用的最快推理引擎之一,特别是使用 EXL3 量化格式时。 ExLlamaV3 通过优化 CUDA 内核、高效内存管理和量化感知计算的组合来实 …

edge-tts:使用 Microsoft Edge 在线服务的 Python TTS
AI

edge-tts:使用 Microsoft Edge 在线服务的 Python TTS

高质量的文本转语音通常需要昂贵的云端 API 或复杂的本地模型设置。由 rany2 创建的 Edge-TTS 采取了一个巧妙的方法:它接入 Microsoft Edge 内建的在线 TTS 服务,提供对数百种自然声音的免费访问,涵盖数十种语言。 该工具是一个简单的 Python CLI,可 …

BCEmbedding:网易的双语跨模态嵌入模型
AI

BCEmbedding:网易的双语跨模态嵌入模型

嵌入模型是现代语义搜索和检索增强生成(RAG)系统的基础。由网易有道开发的 BCEmbedding 脱颖而出,提供了特别针对双语中英文和跨模态检索任务优化的最先进性能。 该模型擅长理解跨语言和模态的语义关系。无论你是用英文查询搜索中文文档、从文字描述中检索图像,还是构建双语 RAG 管线 …

AutoCut:AI 驱动的自动视频剪辑
AI

AutoCut:AI 驱动的自动视频剪辑

视频编辑是最耗时的人工密集型创意任务之一,但 AI 正在改变这一现状。AutoCut 是一个充分利用 AI 能力的开源视频编辑工具,特别专注于通过 AI 驱动的分析自动编辑 Talking-head 视频和播客。 由 lianghang 开发的 AutoCut 使用语音识别、说话人识别和内 …

TAG
CATEGORIES