先定义几个关键字: 任务:用户一次上传的数据集并发起的automl任务,比如一次ocr任务,一次图像分类任务. 模型:一次任务中,需要运行的多个模型,比如ocr任务,需要ctpn模型,需要crnn模型. 单模型:一个模型只需要单个节点即可(只适合小数据集): 分布式模型:一个模型需要多个节点才能运行(适合大数据集). 目前有2个角度的考虑,从而造成问题探讨方向的不同,这里主要有数据集角度和任务角度. 基于数据集角度 基于数据集角度考虑,希望数据集被所有的任务复用.任务之间,只要使用到同一个数据集…