Vision-infer
在CPU下能快速推理的UI检测模型
-
基于YOLOX 目标检测框架,训练阶段修改了部分超参数, 识别目标为UI中常见的图片和图标,文本可由OCR获得详见文本识别,在开放测试集中平均准确超过90%
-
经ONNX Optimizer转换,用i7-9750H CPU推理时间105ms, 可转为TensorRT 用GPU进一步加速推理
1.下载预训练的UI目标检测模型ui-det-v2 到指定的目录, 修改vision-ui/config.py文件,替换IMAGE_INFER_MODEL_PATH。
2.运行vision-ui/services/image_infer.py调试代码,结果文件保存在指定的infer_result_path目录,查看效果。
3.启动服务
4.通过Http协议请求,参数"url"表示图像文件的下载链接
curl -H "Content-Type:application/json" -X POST --data '{"url":"http://XXX/imagename.png"}' http://localhost:9092/vision/ui-infer
服务返回
{
"code":0,
"data":[
{
'elem_det_region': [41.2695, 118.5093, 67.1008, 162.8195], # 矩形方框表示 [x1, y1, x2, y2]
'elem_det_type': 'icon', # 元素类型,icon/image
'probability': 0.9590860605239868
}
]
}