Post

博客

SoloSoft 关于软件工程、Hugo、网站性能与多语言内容发布的技术文章。

Everyone Can Use English:开源 AI 驱动英语学习平台
开源项目

Everyone Can Use English:开源 AI 驱动英语学习平台

AI 与语言学习的交集代表了现代机器学习最有前景的应用之一。个性化辅导、实时发音反馈和上下文翻译——这些在十年前还是科幻小说中的能力,现在在技术上已经可以实现。Everyone Can Use English 由 ZuodaoTech 开发,将这些能力集成到一个专为中文用户学习英语而设计的 …

Chat2Graph:以图为本的多代理协作原生系统
AI

Chat2Graph:以图为本的多代理协作原生系统

多代理 AI 范式已激发了开发者和研究者的想象力。这个愿景引人入胜:专业代理协同工作,各自贡献独特的能力来解决单一代理无法单独处理的复杂问题。但构建这样的系统已被证明是困难的。代理之间的通信、共享上下文、任务分解和推理可追溯性都带来了严峻的工程挑战。Chat2Graph 由 TuGraph …

Auto-Editor:开源自动视频编辑工具,通过静音检测进行剪辑
开源项目

Auto-Editor:开源自动视频编辑工具,通过静音检测进行剪辑

制作长视频的内容创作者——教程、播客、讲座、游戏实况、访谈——都面临一个共同的后期制作挑战:移除空白片段。思考中的停顿、句子之间的静默、犹豫以及场景之间的空档时间都需要剪掉才能产出精致的最终成品。手动编辑这些片段既繁琐又耗时,而且容易出错。

A2A:Google 的代理间通信协议,现归 Linux 基金会管辖
AI

A2A:Google 的代理间通信协议,现归 Linux 基金会管辖

AI 代理生态系统正在经历一场寒武纪大爆发。用于构建代理的框架——LangChain、CrewAI、AutoGen、Semantic Kernel、Vertex AI Agent Builder——正在迅速增加,每个都有自己的内部通信模式、数据格式和能力宣传机制。这种碎片化造成了一个根本性 …

VoxCPM2:OpenBMB 免分词器多语言语音合成模型
AI

VoxCPM2:OpenBMB 免分词器多语言语音合成模型

VoxCPM2 是由 OpenBMB 开发的免分词器文本转语音 (TTS) 模型;OpenBMB 是隶属于清华大学与北京人工智能研究院 (BAAI) 的开源 AI 研究社区。VoxCPM2 拥有 20 亿个参数,直接在连续语音表征上运作,跳脱传统需要离散音频分词器的框架,避免音质下降。

Verifiers:用于训练 LLM 代理的模块化 RL 环境库
AI

Verifiers:用于训练 LLM 代理的模块化 RL 环境库

Verifiers 是由 PrimeIntellect-ai 开发的模块化 Python 库,提供一个全面框架,用于创建专为训练 LLM 代理而设计的强化学习环境。专为从事基于 RL 的 LLM 对齐与代理优化的研究人员与实务工作者设计,Verifiers 提供一个干净、可组合的 API, …

TAG
CATEGORIES