Skip to content

README_Chineses

Zhehua-Hu edited this page Mar 1, 2017 · 24 revisions

Enchain: 数据集全周期管理工具

数据集全周期

基于深度学习应用的数据集的全生命周期通常包括:

  • 关于数据集需求,规模,投入等的讨论或规划
  • 采集设备集成与测试
  • 相关人员培训
  • 数据集产生与管理流程如下

第一阶段:图像预处理

  • 图像采集

    可以直接由采集设备存储为图像,也可以使用Enchain将视频变为图像序列

  • 图像挑选

    通过某些条件,选择适合标注的图像

  • 任务分配

    通常方法是培训专门的标注人员进行分配或众包,目前也有通过游戏或验证码参与者标注的例子

第二阶段:图像标注

常见的标注种类如下:

  • 使用矩形或椭圆标注

    常用于分类或检测任务,通常标注文件为xml,使用VOC格式

  • 使用多边型等异形边框标注,有些任务需要像素级标注

    常用于语义分割、定位测距等任务

目前Enchain中标注功能未开发,推荐使用如下软件:

对于每位标注人员,

第三阶段:数据集管理


下文将结合Enchain讲解使用步骤

Windows用户三步安装流程

  • Step1: 可执行文件下载

  • Step2: 下载支持库

  • Step3: windows 系统添加环境变量

    • 在控制面板搜索 ”环境变量”
    • 选择 “编辑系统环境变量”
    • "高级" -> "环境变量 -> "系统变量"
    • "新建"->
      • 变量名:ENCHAINPATH
Clone this wiki locally