做了一些简单机器学习任务后,发现必须要对数据集有足够的了解才能动手做一些事,这是无法避免的,否则可能连在干嘛都不知道,而一些官方例程并不会对数据集做过多解释,你甚至连它长什么样都不知道... 以sklearn的手写数字识别为例,例子中,一句 digits = datasets.load_digits() 就拿到数据了,然后又几句 images_and_labels = list(zip(digits.images, digits.target)) for index, (image, label…