众所周知,计算机领域论文是要以实验为基础的,而实验的原料就是数据.不管是在图像,文字或者语音领域,开源的数据都十分宝贵和重要.这里主要收集各领域的一些常用的公开数据集. 计算机视觉: [ImageNet] [Caltech Pedestrian Dataset] 简介:行人检测数据集 网址:https://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/ 细节: (1)摄像头位于车上 (2)图片模糊 (3)行人少而小,大多数图片不…