Tags

计算机视觉

Detectron2:Meta 的目标检测与分割平台
AI

Detectron2:Meta 的目标检测与分割平台

目标检测在过去十年中经历了显著的演进,从手工设计的特征发展到能够以超越人类的准确性识别和定位目标的深度神经网络。Detectron2 站在这股演进的最前沿——Meta AI 的开源平台,实现了用于目标检测、分割和姿态估计的最先进算法。

GOT-OCR2.0:迈向 OCR-2.0 的通用 OCR 理论与统一端到端模型
AI

GOT-OCR2.0:迈向 OCR-2.0 的通用 OCR 理论与统一端到端模型

光学字符识别(OCR)几十年来一直被视为已解决的问题——对于具有简单文本的清晰扫描文档而言。但真实世界的视觉内容远更杂乱多样。带有复杂符号的数学方程、具有不规则单元格结构的表格、带有专门符号的乐谱,以及招牌和标签上的场景文本,都挑战了假设干净、线性文本在均匀背景上的传统 OCR 方法。

LayoutParser:用于文档图像分析的统一开源工具包
AI

LayoutParser:用于文档图像分析的统一开源工具包

LayoutParser 是为了终结文档处理混乱而建立的开源深度学习工具包。它提供了用于文档图像分析任务的统一接口,包括布局检测、OCR 集成和视觉信息提取。 仓库:github.com/Layout-Parser/layout-parser 核心功能 功能 描述 后端选项 布局检测 检测 …

Bunnings在Google活动展示AI购物助理,零售业迎来新变革
零售科技

Bunnings在Google活动展示AI购物助理,零售业迎来新变革

这项AI购物助理的核心技术是什么? 答案很直接:计算机视觉加上自然语言处理(NLP)的深度整合。Bunnings的AI助理不是单纯的聊天机器人,它结合了Google Cloud的Vision AI与Vertex AI,让顾客可以通过手机App或店内设备,用语音或文字描述需求,例如「我需要一 …

苹果2027智能眼镜泄密四款框架风格测试预示穿戴装置新纪元
科技趋势

苹果2027智能眼镜泄密四款框架风格测试预示穿戴装置新纪元

为什么苹果选择从「框架风格」开始定义智能眼镜? 直接回答:因为苹果深知,智能眼镜要成功,首要条件是「让人愿意戴出门」。 技术再炫,若外观笨重、不符合日常审美,注定只能是小众极客的玩具。从泄露的四款风格——大胆矩形、纤细矩形、经典圆形/椭圆、紧凑椭圆——可以看出,苹果的策略是覆盖从商务专业、 …

Pluckk获千万美元投资揭示D2C农食科技平台如何重塑全球供应链
农业科技

Pluckk获千万美元投资揭示D2C农食科技平台如何重塑全球供应链

为什么一家印度农产品D2C平台能吸引中东资本持续加码? 答案很简单:因为Pluckk正在解决全球食品供应链中最昂贵的问题——品质不一致与需求不确定性。 当多数生鲜电商还在烧钱补贴物流时,Pluckk已经将AI算法植入从农场到配送的每个环节。这不是另一个“蔬果外送”故事,而是一场以数据重新定 …

TAG
CATEGORIES