笔迹鉴定(一)


笔迹鉴定(一)

  1. 特征提取:特征提取是手写体汉字识别最关键的环节。

    1.1纹理特征:纹理是一种不依赖于颜色或亮度变化的反映图像中同质现象的视觉特征,刻画了图像像素邻域灰度空间分布的规律。它是所有物体表面都具有的内在特征,不同物体具有不同的纹理,如云彩,树木,砖,织物等都有各自的纹理特征。

    • 根据每个人不同的书写习惯,会产生自己的书写纹理特征,通过纹理特征能够区分不同书写人的笔迹。

    • 文本图像作为一种特殊的图像,其纹理具有很强的方向性和以行为周期的准准确性,基于空间/频率域联合分析的方法可以描述纹理表面灰度级的整体周期,适合于描述文本图像的纹理。频率域可以将纹理的局部特性和全局特性有机的结合起来。

      • 频域特征:Gabor滤波器可以在频域上不同尺度、不同方向上提取相关特征,Gabor滤波器是一个用于边缘检测的线性滤波器,可以在频域的不同尺度,不同方向上提取相关特征。

      • gabor算子由一个高斯函数和一个余弦函数调制而成。gabor算子由六个参数控制,其中三个与余弦函数有关,两个与高斯函数有关。

      • cv.getGaborKernel函数可以定义内核,它接受内核大小、高斯标准差、波的方向、波长、空间比和相位等参数。

      • 滤波公式:
        $ g(x, y ; \lambda, \theta, \psi, \sigma, \gamma)=\exp \left(-\frac{x^{\prime 2}+\gamma^{2} y^{2}}{2 \sigma^{2}}\right) \exp \left(i\left(2 \pi \frac{x^{\prime}}{\lambda}+\psi\right)\right) $​

      • (1) x,y分别表示像素坐标位置;
        (2) λ表示滤波的波长
        (3) θ表示Gabor核函数图像的倾斜角度;
        (4) ψ表示相位偏移量,取值范围是-180~180;
        (5) σ表示高斯函数的标准差;
        (6) γ表示长宽比,决定这Gabor核函数图像的椭圆率。

    • ksize Size of the filter returned. 滤波器的大小(图片尺寸)
      sigma(σ) Standard deviation of the gaussian envelope. 高斯函数标准差
      theta(θ) Orientation of the normal to the parallel stripes of a Gabor function. 高斯函数:垂直于Gabor函数平行条纹的方向。
      lambd(λ) Wavelength of the sinusoidal factor. 正弦因子的波长
      gamma(γ) Spatial aspect ratio. 高斯函数宽高比
      psi(ψ) Phase offset. 相位偏差
      ktype Type of filter coefficients. It can be CV_32F or CV_64F . 滤波器系数的类型
    不同参数下测试,ksize:111,sigam:5,theta:90,lambd:10,gamma:1.2
    
    <img src="https://leng-mypic.oss-cn-beijing.aliyuncs.com/image-20210817132433303.png" style="zoom:50%;" />
    
    ksize:111,sigam:10,theta:90,lambd:10,gamma:1.2
    
    <img src="https://leng-mypic.oss-cn-beijing.aliyuncs.com/image-20210817132709822.png" style="zoom:50%;" />
    
    ![6张对比图](https://leng-mypic.oss-cn-beijing.aliyuncs.com/image-20210817134252871.png)
    
    • 空间分布特征:

      • 灰度协方差矩阵:用于匹配图像,匹配一个图像是否包含于另一个图像中。在文字识别中,可以用作找两份文字是否出于同一个人写的,或者某个偏旁部首是否与文字中的相似。
  2. 文献

  • Writer Identification and Verification,书写人识别与验证

    • 手写体生物识别需要在多个观察层次上具有广泛的知识
    • 良好的生物特征具备普遍性、独特性、永久性和可收集性
    • 四个导致书写变异的因素:
      • 仿射变换,是书写人自愿控制的。大小、平移、旋转和剪切的变换是笔迹识别中令人讨厌的问题。
      • 神经生物学变异性,局部环境和生理状态决定了在书写时所花费的精力。
      • 手写过程中的瞬时系统状态,也就是笔顺,笔顺会对图像产生明显的影响
      • 异体字变异,特定于书写者的字符形状现象,也就是每个人对某个特定字会有自己独特的写法
  • 8: Handwriting Identification: a Direction Review,笔迹鉴定:一个方向的回看?

    • 书写者识别是从一组书写者中识别作者的过程

    • 而书写者验证是确定两个手写样本是由相同的书写者还是由不同的书写者书写的任务。

    • 基于笔迹的书写者身份的证明基于三个传统步骤:数据采集和预处理、特征提取和分类

      • 首先对手写文本进行预处理(如二值化、分段和规范化)

        • 第一步,先将彩色图像转变灰度图像,

          • 平均法:将同一个像素位置3个RGB值进行平均
          • 最大最小平均:取同一个像素位置的RGB中亮度最大的和最小的进行平均。
          • 加权平均:这是最流行的方法。几个加权系数0.3,0.59,0.11是根据人的亮度感知系统调节出来的参数,是个广泛使用的标准化参数。
        • 二值化处理:

          • 最简单的做法:给定一个阈值,让小于这个阈值的灰度值为0,大于等于这个阈值的设为255,这样在图像上显示出来的就是衣服黑白图像
          • 最常见的二值处理方法:是计算像素的平均值K,扫描图像的每个像素值如像素值大于K像素值设为255(白色),值小于等于K像素值设为0(黑色)。该方法相比方法一,阈值的选取稍微有点智商,可以解释。但是使用平均值作为二值化阈值同样有个致命的缺点,可能导致部分对象像素或者背景像素丢失。二值化结果不能真实反映源图像信息。
          • 使用直方图来寻找二值化阈值:直方图方法选择二值化阈值主要是发现图像的两个最高的峰,然后在阈值取值在两个峰之间的峰谷最低处。
            • 直方图是图像中像素强度分布的图形表达方式。它统计了每一个强度值所具有的像素个数。
        • 分段处理:好像就是边缘检测

          • 边缘检测的实质是采用某种算法来提取出图像中对象与背景间的交界线。我们将边缘定义为图像中灰度发生急剧变化的区域边界。图像灰度的变化情况可以用图像灰度分布的梯度来反映。

          • 步骤

            • 滤波:边缘检测算法主要是基于图像强度的一阶和二阶导数,但导数的计算对噪声很敏感,因此必须使用滤波器来改善与噪声有关的边缘检测器的性能。需要指出,大多数滤波器在降低噪声的同时也导致了边缘强度的损失,因此,增强边缘和降低噪声之间需要折中。
            • 增加:增强边缘的基础是确定图像各点邻域强度的变化值。增强算法可以将邻域(或局部)强度值有显著变化的点突显出来。边缘增强一般是通过计算梯度幅值来完成的。
            • 检测:在图像中有许多点的梯度幅值比较大,而这些点在特定的应用领域中并不都是边缘,所以应该用某种方法来确定哪些点是边缘点。最简单的边缘检测判据是梯度幅值阈值判据。
            • 定位:如果某一应用场合要求确定边缘位置,则边缘的位置可在子像素分辨率上来估计,边缘的方位也可以被估计出来。在边缘检测算法中,前三个步骤用得十分普遍。这是因为大多数场合下,仅仅需要边缘检测器指出边缘出现在图像某一像素点的附近,而没有必要指出边缘的精确位置或方向。
          • 阈值越低,能够检测出的边线越多,结果也越容易受到图片噪声的影响,并且越容易从图像中挑出不相关的特性。与此相反,一个高的阈值将会遗失细的或者短的线段。

        • 图像标准化处理:

          • image_standardization $ =\frac{\mathrm{x}-\mu}{\text { adjusted_stddev }}$​​,u是图像均值,X表示图像矩阵
          • adjusted_stddev =max(σ,1.0N)=\max \left(\sigma, \frac{1.0}{\sqrt{\mathrm{N}}}\right)​​​,第一个是方差,N为图像X的像素数量
          • 标准化处理结果
      • 第二,通过特征提取一组鉴别特征来表示手写文本

      • 第三,做出分类决策

        • 欧几里得距离
        • 神经网络
        • SVM
    • 在线笔迹:包括速度、加速度、笔压、书写方向和笔划顺序


文章作者: 小冷同学
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 小冷同学 !
用户交流区

温馨提示: 遵纪守法, 友善评论!