Skip to content

Latest commit

 

History

History
43 lines (31 loc) · 1.42 KB

vision_infer.md

File metadata and controls

43 lines (31 loc) · 1.42 KB

UI目标检测

Vision-infer

简介

在CPU下能快速推理的UI检测模型

模型性能

  • 基于YOLOX 目标检测框架,训练阶段修改了部分超参数, 识别目标为UI中常见的图片和图标,文本可由OCR获得详见文本识别,在开放测试集中平均准确超过90%

  • ONNX Optimizer转换,用i7-9750H CPU推理时间105ms, 可转为TensorRT 用GPU进一步加速推理

使用说明

1.下载预训练的UI目标检测模型ui-det-v2 到指定的目录, 修改vision-ui/config.py文件,替换IMAGE_INFER_MODEL_PATH。

2.运行vision-ui/services/image_infer.py调试代码,结果文件保存在指定的infer_result_path目录,查看效果。

3.启动服务

4.通过Http协议请求,参数"url"表示图像文件的下载链接

curl -H "Content-Type:application/json" -X POST --data '{"url":"http://XXX/imagename.png"}' http://localhost:9092/vision/ui-infer

服务返回

{
  "code":0, 
  "data":[
    {
        'elem_det_region': [41.2695, 118.5093, 67.1008, 162.8195], # 矩形方框表示 [x1, y1, x2, y2]
        'elem_det_type': 'icon', # 元素类型,icon/image
        'probability': 0.9590860605239868
    }
  ]
}