coreBugZJ

此 blog 已弃。

相似图片搜索的原理（转）

　　这种技术的原理是什么？计算机怎么知道两张图片相似呢？

　　根据Neal Krawetz博士的解释，原理非常简单易懂。我们可以用一个快速算法，就达到基本的效果。

　　这里的关键技术叫做"感知哈希算法"（Perceptual hash algorithm），它的作用是对每张图片生成一个"指纹"（fingerprint）字符串，然后比较不同图片的指纹。结果越接近，就说明图片越相似。

　　下面是一个最简单的实现：

　　第一步，缩小尺寸。

　　将图片缩小到8x8的尺寸，总共64个像素。这一步的作用是去除图片的细节，只保留结构、明暗等基本信息，摒弃不同尺寸、比例带来的图片差异。

　　第二步，简化色彩。

　　将缩小后的图片，转为64级灰度。也就是说，所有像素点总共只有64种颜色。

　　第三步，计算平均值。

　　计算所有64个像素的灰度平均值。

　　第四步，比较像素的灰度。

　　将每个像素的灰度，与平均值进行比较。大于或等于平均值，记为1；小于平均值，记为0。

　　第五步，计算哈希值。

　　将上一步的比较结果，组合在一起，就构成了一个64位的整数，这就是这张图片的指纹。组合的次序并不重要，只要保证所有图片都采用同样次序就行了。

= = 8f373714acfcf4d0

　　得到指纹以后，就可以对比不同的图片，看看64位中有多少位是不一样的。在理论上，这等同于计算"汉明距离"（Hamming distance）。如果不相同的数据位不超过5，就说明两张图片很相似；如果大于10，就说明这是两张不同的图片。

　　具体的代码实现，可以参见Wote用python语言写的imgHash.py。代码很短，只有53行。使用的时候，第一个参数是基准图片，第二个参数是用来比较的其他图片所在的目录，返回结果是两张图片之间不相同的数据位数量（汉明距离）。

　　这种算法的优点是简单快速，不受图片大小缩放的影响，缺点是图片的内容不能变更。如果在图片上加几个文字，它就认不出来了。所以，它的最佳用途是根据缩略图，找出原图。

　　实际应用中，往往采用更强大的pHash算法和SIFT算法，它们能够识别图片的变形。只要变形程度不超过25%，它们就能匹配原图。这些算法虽然更复杂，但是原理与上面的简便算法是一样的，就是先将图片转化成Hash字符串，然后再进行比较。

posted on 2011-11-03 11:39 coreBugZJ 阅读(546) 评论(0) 编辑收藏引用所属分类: VideoImage 、技术视野

只有注册用户登录后才能发表评论。


相关文章: LZW 编码解码代码数字图像处理上机之五：图像平滑和锐化数字图像处理上机之四：灰度图快速傅里叶变换（ FFT IFFT 一维二维）运动轨迹捕捉数字图像处理上机之三：直方图均衡化数字图像处理上机之二：图像放大缩小旋转和平移处理尝试 OpenCV 摄像头与 Windows 消息机制相似图片搜索的原理（转）图像插值算法（转）数字图像处理上机之一：BMP图像文件读写和图像显示

网站导航: 博客园博客园最新博文博问管理

coreBugZJ

My Links

Blog Stats

常用链接

留言簿(10)

随笔分类(458)

随笔档案(268)

相册

ACM

AI

LaTeX

安全

编程语言

好有道理

技术

开源

科学

数学

图形图像

文化

问题（练习＆有趣）

资源

最新随笔

搜索

最新评论

阅读排行榜

评论排行榜

相似图片搜索的原理（转）

coreBugZJ

My Links

Blog Stats

常用链接

留言簿(10)

随笔分类(458)

随笔档案(268)

相册

ACM

AI

LaTeX

安全

编程语言

好有道理

技术

开源

科学

数学

图形图像

文化

问题（练习＆有趣）

资源

最新随笔

搜索

最新评论

阅读排行榜

评论排行榜

相似图片搜索的原理 （转）

相似图片搜索的原理（转）