这段时间对于图像哈希进行了研究,之前相关的算法总结文件中也提到了一些数据集。想了解的朋友戳这里:http://blog.csdn.net/ying_xu/article/details/50532185
这里对图像领域常用的数据集的获取做一个总结,具体的数据集的详细信息和使用方法都可以在链接中学习到,先就不赘述了。
1. The 【CIFAR-10】 dataset
http://www.cs.toronto.edu/~kriz/cifar.html
2. 【IAPR TC-12】 Benchmark
http://www.imageclef.org/photodata
3. The 【MIRFLICKR】 RetrievalEvaluation
http://press.liacs.nl/mirflickr/
4. 【SUN Database】: Scene Categorization Benchmark
http://vision.princeton.edu/projects/2010/SUN/
5. The 【MNIST】 DATABASE ofhandwritten digits
http://yann.lecun.com/exdb/mnist/
6. TEXMEX: 【ANN_SIFT10K】,【ANN_SIFT1M】, 【ANN_GIST1M】, 【ANN_SIFT1B】
http://corpus-texmex.irisa.fr/
并可以找到Matlab读取.fvecs, .ivecs和.bvecs后缀的mat文件
7. 【Tiny】 Images Dataset
http://horatio.cs.nyu.edu/mit/tiny/data/index.html
8. 【Photo Tourism】 (Exploring photo collection in 3D)
http://phototour.cs.washington.edu/
9. 【NUS-WIDE】
A Real-World Web Image Database from National University ofSingapore
http://lms.comp.nus.edu.sg/research/NUS-WIDE.htm
这个也可以参考下哦
http://www.datatang.com/data/13693
10. The 【INRIA】 Holidaydataset
http://lear.inrialpes.fr/~jegou/data.php#holidays
11. 【LabelMe】
http://labelme2.csail.mit.edu/Release3.0/browserTools/php/dataset.php
这个可以需要自己使用matlab代码运行下载或者在线使用。
可以参考一下这个链接的数据:The LabelMe-12-50k dataset
http://www.ais.uni-bonn.de/download/datasets.html
12. 【ILSVRC2010】
http://www.image-net.org/challenges/LSVRC/2010/
13. 【Caltech-256】
http://www.vision.caltech.edu/Image_Datasets/Caltech256/#Benchmarks
这个比Caltech-101改进许多,建议可以使用256
也附上Caltech-101的链接:
http://www.vision.caltech.edu/Image_Datasets/Caltech101/
根据之前总结的算法中用到的主要就是以上这些,欢迎补充~