Skip to content
February 22, 2008 / tninja1980msn

识别验证码图片中的文字

今天写了个程序,帮别人识别网站验证码图片中的英文字母和数字。

该图片见下图1.png,由4个字母或者数字组成,加上点状和雪花状噪音

识别分三个步骤:
1、除去图片中噪音
2、从左到右切割出四个字母(或者数字)
3、将这些字母数字与26×2+10个字母数字构成的库中图片进行比对,选择得分最高的

难点:
1、图片中存在不同字体的文字和数字。这点要求比对算法能比较智能化
2、文字和数字存在缩放。这点通过标准化图片大小解决

最后我完成的识别程序大概有60~70%的准确率,然而某些字母识别的效果不太好,比如8和B会误识别,C和G也容易误识别。

Advertisements

3 Comments

Leave a Comment
  1. / Feb 25 2008 4:24 am

    这个都能写程序来识别啊?用什么写的啊?

  2. 亚茜 / Feb 26 2008 11:30 pm

    好牛哦~

  3. / Feb 29 2008 1:16 am

    再优化优化,可以卖软件了~

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: