本发明涉及图像的技术领域,更具体地,涉及一种基于颜色特征和词袋特征的票据图像分类方法。本发明利用了计算机视觉中经典的Bag of Words的思路,即先对训练样本中提取每张票据的SIFT特征点并生成128维特征描述符,然后进行K均值聚类获得K个视觉单词,并对每一类票据统计其视觉单词出现次数形成该类的视觉单词直方图作为特征,最后融入颜色特征形成总的特征向量,送入SVM分类器进行训练,得到票据分类器模型。因为词袋模型并没有用到票据图像的颜色特征,故本方法加入了图像的全局主颜色特征,进一步提升票据分类器的性能。本发明仅需极少量训练样本且无需人工设计额外特征就能训练出票据分类器模型,而且分类器分类速度快,准确率高。
展开▼