服务器之家:专注于服务器技术及软件下载分享
分类导航

PHP教程|ASP.NET教程|Java教程|ASP教程|编程技术|正则表达式|C/C++|IOS|C#|Swift|Android|VB|R语言|JavaScript|易语言|vb.net|

服务器之家 - 编程语言 - IOS - iOS身份证号码识别示例

iOS身份证号码识别示例

2021-03-05 16:55wythetan IOS

本篇文章主要介绍了iOS身份证号码识别示例,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧

一、前言

身份证识别,又称ocr技术。ocr技术是光学字符识别的缩写,是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。

因为项目需要,所以这些天查阅了相关资料,想在网上看看有没有大神封装的现成的demo可以用。但是无果,网上关于ocr这一块的资料很少,比较靠谱的都是要收费的,而且价格也不便宜。但是在天朝,收费感觉心里不爽,所以就决定自己研究一番。

先上一个最终实现的效果(如果mac不是retain屏幕的,分辨率会有影响,需要在真机上调试)

iOS身份证号码识别示例

二、需要用到的技术

搜了很多资料,发现要进行身份证号码的识别,需要用到以下几种技术:

图像处理技术

包括灰度化处理,二值化,腐蚀,轮廊检测等等。

1、灰度化处理:图片灰度化处理就是将指定图片每个像素点的rgb三个分量通过一定的算法计算出该像素点的灰度值,使图像只含亮度而不含色彩信息。

iOS身份证号码识别示例

2、二值化:二值化处理就是将经过灰度化处理的图片转换为只包含黑色和白色两种颜色的图像,他们之间没有其他灰度的变化。在二值图中用255便是白色,0表示黑色。

iOS身份证号码识别示例

3、腐蚀:图片的腐蚀就是将得到的二值图中的黑色块进行放大。即连接图片中相邻黑色像素点的元素。通过腐蚀可以把身份证上的身份证号码连接在一起形成一个矩形区域。

iOS身份证号码识别示例

4、轮廊检测:图片经过腐蚀操作后相邻点会连接在一起形成一个大的区域,这个时候通过轮廊检测就可以把每个大的区域找出来,这样就可以定位到身份证上面号码的区域。

iOS身份证号码识别示例

5、文字识别技术

通过识别图像,将图像信息转化为可以使用的计算机输入技术。比如下面这张包含一串数字的图片,通过ocr识别技术可以将图片中包含的数字信息以字符串的方式输出。

iOS身份证号码识别示例

三、开源框架opencv和tesseractocrios

opencv(完成图像处理技术)

opencv是一个开源的跨平台计算机视觉和机器学习库,通俗点的说,就是他给计算机提供了一双眼睛,一双可以从图片中获取信息的眼镜,从而完成人脸识别、身份证识别、去红眼、追踪移动物体等等的图像相关的功能。

tesseractocrios(完成文字识别技术)

tesseract是目前可用的最准确的开源ocr引擎,可以读取各种格式的图片并将他们转换成各种语言文本。而tesseractocrios则是针对ios平台封装的tesseract引擎库。

四、实战演示

创建一个ios项目

用cocopods导入上面两个库

由于opencv库文件比较大,所以时间会稍微久一点,耐心等待就是。

iOS身份证号码识别示例

导入完成之后运行项目,会发现报如下错误

iOS身份证号码识别示例

由于导入的库不支持bitcode机制,需要关掉,在工程->targets->build setting-> enable bitcode设置为no就ok。

iOS身份证号码识别示例

导入tesseractocrios需要的语言包

tesseractocrios库中没有自带的语言包,需要我们自己手动导入,我们这里直接到tesseract-ocr网站,tessdata即是我们需要用到的语言包。下载下来的语言包有400多兆。这里我们只需要用到英语语言包,所以就只导入eng.traineddata就ok,其他的都删掉。

导入语言包种需要注意几点:

  • 语言包需要放在tessdata目录下。tesseractocrios中查找语言包是在tessdata目录下进行查找的,所以我们不能单独把eng.traineddata导入项目中,而需要放在tessdata目录下导入项目中。
  • 将tessdata导入xcode项目,需要勾选create folder refrences。上面已经提到了语言包需要放在tessdata目录下,所以导入文件到xcode的时候需要创建文件夹的形式,而不是创建组的形式。如下图:

iOS身份证号码识别示例

创建一个recogizecardmanager用来管理身份证识别相关的代码。

由于opencv和tesseractocrios库都是基于c++编写的,所以需要把recogizecardmanager.m后缀的.m改成.mm

iOS身份证号码识别示例

recogizecardmanager中的代码

.h文件

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
#import <foundation/foundation.h>
@class uiimage;
 
typedef void (^compleateblock)(nsstring *text);
 
@interface recogizecardmanager : nsobject
 
/**
* 初始化一个单例
*
* @return 返回一个recogizecardmanager的实例对象
*/
+ (instancetype)recognizecardmanager;
 
/**
* 根据身份证照片得到身份证号码
*
* @param cardimage 传入的身份证照片
* @param compleate 识别完成后的回调
*/
- (void)recognizecardwithimage:(uiimage *)cardimage compleate:(compleateblock)compleate;
 
@end

.m文件

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
#import "recogizecardmanager.h"
#import <opencv2/opencv.hpp>
#import <opencv2/imgproc/types_c.h>
#import <opencv2/imgcodecs/ios.h>
#import <tesseractocr/tesseractocr.h>
 
@implementation recogizecardmanager
 
+ (instancetype)recognizecardmanager {
  static recogizecardmanager *recognizecardmanager = nil;
  static dispatch_once_t oncetoken;
  dispatch_once(&oncetoken, ^{
    recognizecardmanager = [[recogizecardmanager alloc] init];
  });
  return recognizecardmanager;
}
 
- (void)recognizecardwithimage:(uiimage *)cardimage compleate:(compleateblock)compleate {
  //扫描身份证图片,并进行预处理,定位号码区域图片并返回
  uiimage *numberimage = [self opencvscancard:cardimage];
  if (numberimage == nil) {
    compleate(nil);
  }
  //利用tesseractocr识别文字
  [self tesseractrecognizeimage:numberimage compleate:^(nsstring *numbaertext) {
    compleate(numbaertext);
  }];
}
 
//扫描身份证图片,并进行预处理,定位号码区域图片并返回
- (uiimage *)opencvscancard:(uiimage *)image {
 
  //将uiimage转换成mat
  cv::mat resultimage;
  uiimagetomat(image, resultimage);
  //转为灰度图
  cvtcolor(resultimage, resultimage, cv::color_bgr2gray);
  //利用阈值二值化
  cv::threshold(resultimage, resultimage, 100, 255, cv_thresh_binary);
  //腐蚀,填充(腐蚀是让黑色点变大)
  cv::mat erodeelement = getstructuringelement(cv::morph_rect, cv::size(26,26));
  cv::erode(resultimage, resultimage, erodeelement);
  //轮廊检测
  std::vector<std::vector<cv::point>> contours;//定义一个容器来存储所有检测到的轮廊
  cv::findcontours(resultimage, contours, cv_retr_tree, cv_chain_approx_simple, cvpoint(0, 0));
  //取出身份证号码区域
  std::vector<cv::rect> rects;
  cv::rect numberrect = cv::rect(0,0,0,0);
  std::vector<std::vector<cv::point>>::const_iterator itcontours = contours.begin();
  for ( ; itcontours != contours.end(); ++itcontours) {
    cv::rect rect = cv::boundingrect(*itcontours);
    rects.push_back(rect);
    //算法原理
    if (rect.width > numberrect.width && rect.width > rect.height * 5) {
      numberrect = rect;
    }
  
  //身份证号码定位失败
  if (numberrect.width == 0 || numberrect.height == 0) {
    return nil;
  }
  //定位成功成功,去原图截取身份证号码区域,并转换成灰度图、进行二值化处理
  cv::mat matimage;
  uiimagetomat(image, matimage);
  resultimage = matimage(numberrect);
  cvtcolor(resultimage, resultimage, cv::color_bgr2gray);
  cv::threshold(resultimage, resultimage, 80, 255, cv_thresh_binary);
  //将mat转换成uiimage
  uiimage *numberimage = mattouiimage(resultimage);
  return numberimage;
}
 
//利用tesseractocr识别文字
- (void)tesseractrecognizeimage:(uiimage *)image compleate:(compleateblock)compleate {
 
  dispatch_async(dispatch_get_global_queue(dispatch_queue_priority_background, 0), ^{
    g8tesseract *tesseract = [[g8tesseract alloc] initwithlanguage:@"eng"];
    tesseract.image = [image g8_blackandwhite];
    tesseract.image = image;
    // start the recognition
    [tesseract recognize];
    //执行回调
    compleate(tesseract.recognizedtext);
  });
}

recognizecardviewcontroller代码

故事版布局界面

iOS身份证号码识别示例

.m文件

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
#import "recognizecardviewcontroller.h"
#import "recogizecardmanager.h"
 
@interface recognizecardviewcontroller ()<uinavigationcontrollerdelegate, uiimagepickercontrollerdelegate>{
  uiimagepickercontroller *imgagepickcontroller;
}
 
@property (weak, nonatomic) iboutlet uiimageview *imgview;
@property (weak, nonatomic) iboutlet uilabel *textlabel;
- (ibaction)cameraaction:(id)sender;
- (ibaction)photoaction:(id)sender;
 
@end
 
@implementation recognizecardviewcontroller
 
- (void)viewdidload {
  [super viewdidload];
 
  self.imgview.contentmode = uiviewcontentmodescaleaspectfit;
 
  imgagepickcontroller = [[uiimagepickercontroller alloc] init];
  imgagepickcontroller.delegate = self;
  imgagepickcontroller.modaltransitionstyle = uimodaltransitionstylefliphorizontal;
  imgagepickcontroller.allowsediting = yes;
}
 
- (void)didreceivememorywarning {
  [super didreceivememorywarning];
  // dispose of any resources that can be recreated.
}
 
//拍照
- (ibaction)cameraaction:(id)sender {
 
  //判断是否可以打开照相机
  if ([uiimagepickercontroller issourcetypeavailable:uiimagepickercontrollersourcetypecamera]) {
    imgagepickcontroller.sourcetype = uiimagepickercontrollersourcetypecamera;
    //设置摄像头模式(拍照,录制视频)为拍照
    imgagepickcontroller.cameracapturemode = uiimagepickercontrollercameracapturemodephoto;
    [self presentviewcontroller:imgagepickcontroller animated:yes completion:nil];
  } else {
    uialertview *alert = [[uialertview alloc] initwithtitle:@"提示" message:@"设备不能打开相机" delegate:self cancelbuttontitle:@"知道了" otherbuttontitles: nil];
    [alert show];
  }
}
 
//相册
- (ibaction)photoaction:(id)sender {
  imgagepickcontroller.sourcetype = uiimagepickercontrollersourcetypephotolibrary;
  [self presentviewcontroller:imgagepickcontroller animated:yes completion:nil];
}
 
#pragma mark - uiimagepickercontrollerdelegate
//适用获取所有媒体资源,只需判断资源类型
- (void)imagepickercontroller:(uiimagepickercontroller *)picker didfinishpickingmediawithinfo:(nsdictionary<nsstring *,id> *)info{
  nsstring *mediatype=[info objectforkey:uiimagepickercontrollermediatype];
  uiimage *srcimage = nil;
  //判断资源类型
  if ([mediatype isequaltostring:@"public.image"]){
    srcimage = info[uiimagepickercontrollereditedimage];
    self.imgview.image = srcimage;
    //识别身份证
    self.textlabel.text = @"图片插入成功,正在识别中...";
    [[recogizecardmanager recognizecardmanager] recognizecardwithimage:srcimage compleate:^(nsstring *text) {
      if (text != nil) {
        self.textlabel.text = [nsstring stringwithformat:@"识别结果:%@",text];
      }else {
        self.textlabel.text = @"请选择照片";
        uialertview *alert = [[uialertview alloc] initwithtitle:@"提示" message:@"照片识别失败,请选择清晰、没有复杂背景的身份证照片重试!" delegate:self cancelbuttontitle:@"知道了" otherbuttontitles: nil];
        [alert show];
      }
    }];
  }
  [self dismissviewcontrolleranimated:yes completion:nil];
}
 
//进入拍摄页面点击取消按钮
- (void)imagepickercontrollerdidcancel:(uiimagepickercontroller *)picker {
  [self dismissviewcontrolleranimated:yes completion:nil];
}
 
@end

总结

通过上面的实验,该程序对身份证识别的正确率几乎可以达到90%,剩下的10%主要取决于图像的预处理,预处理程序是整个识别系统的关键所在。该系统的原理同样也适用于获取身份证上其他的信息,也可以应用于银行卡、车牌号等的识别。

识别的正确率

主要取决于腐蚀、取出身份证号码区域(轮廊提取)的算法这几个关键点。

1、腐蚀: 腐蚀的参数很重要。

2、取出身份证号码区域的算法(轮廊提取): 所有的处理都是为了在图片中定位到身份证号码的区域,轮廊提取就是这样一个操作。筛选轮廊图的算法很重要但是也是个难点。要提取身份证号码区域的轮廊,算法的原理就是该轮廊的宽度是所有中最宽的,且宽度的长度必须大于高度的5倍。

不过这个算法还是存在不少问题。有的时候可能图片背景比较复杂会影响到轮廊的检测,基于这个问题:

  • 一方面可以通过对图片的预处理来进行优化,减少对检测身份证号码区域的干扰
  • 第二个方面就是优化算法。

识别速度

使用tesseractocrios对比较清晰的文字进行识别速度是比较快的,我试过用一张未经处理的写着数字的图片来处理,识别速度小于5s。但经过二值图处理之后识别的速度就降低了,我认为可以对二值化处理后的图片进一步处理,比如对二值图进行细化描出骨架,然后在对骨架做均匀的膨胀处理,这样得到的身份证号码可能会清晰很多。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。

原文链接:http://www.jianshu.com/p/ac4c4536ca3e#

延伸 · 阅读

精彩推荐
  • IOSIOS开发之字典转字符串的实例详解

    IOS开发之字典转字符串的实例详解

    这篇文章主要介绍了IOS开发之字典转字符串的实例详解的相关资料,希望通过本文能帮助到大家,让大家掌握这样的方法,需要的朋友可以参考下...

    苦练内功5832021-04-01
  • IOS解析iOS开发中的FirstResponder第一响应对象

    解析iOS开发中的FirstResponder第一响应对象

    这篇文章主要介绍了解析iOS开发中的FirstResponder第一响应对象,包括View的FirstResponder的释放问题,需要的朋友可以参考下...

    一片枫叶4662020-12-25
  • IOSiOS 雷达效果实例详解

    iOS 雷达效果实例详解

    这篇文章主要介绍了iOS 雷达效果实例详解的相关资料,需要的朋友可以参考下...

    SimpleWorld11022021-01-28
  • IOSiOS通过逆向理解Block的内存模型

    iOS通过逆向理解Block的内存模型

    自从对 iOS 的逆向初窥门径后,我也经常通过它来分析一些比较大的应用,参考一下这些应用中某些功能的实现。这个探索的过程乐趣多多,不仅能满足自...

    Swiftyper12832021-03-03
  • IOSiOS中tableview 两级cell的展开与收回的示例代码

    iOS中tableview 两级cell的展开与收回的示例代码

    本篇文章主要介绍了iOS中tableview 两级cell的展开与收回的示例代码,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧...

    J_Kang3862021-04-22
  • IOSiOS布局渲染之UIView方法的调用时机详解

    iOS布局渲染之UIView方法的调用时机详解

    在你刚开始开发 iOS 应用时,最难避免或者是调试的就是和布局相关的问题,下面这篇文章主要给大家介绍了关于iOS布局渲染之UIView方法调用时机的相关资料...

    windtersharp7642021-05-04
  • IOS关于iOS自适应cell行高的那些事儿

    关于iOS自适应cell行高的那些事儿

    这篇文章主要给大家介绍了关于iOS自适应cell行高的那些事儿,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的...

    daisy6092021-05-17
  • IOSIOS 屏幕适配方案实现缩放window的示例代码

    IOS 屏幕适配方案实现缩放window的示例代码

    这篇文章主要介绍了IOS 屏幕适配方案实现缩放window的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要...

    xiari5772021-06-01