久久久久久久视色,久久电影免费精品,中文亚洲欧美乱码在线观看,在线免费播放AV片

<center id="vfaef"><input id="vfaef"><table id="vfaef"></table></input></center>

<p id="vfaef"><kbd id="vfaef"></kbd></p>

<pre id="vfaef"><u id="vfaef"></u></pre>

<thead id="vfaef"><input id="vfaef"></input></thead>

<bdo id="0cxxr"></bdo>

<sub id="0cxxr"></sub>

當(dāng)前位置：站長(zhǎng)資訊網(wǎng) > 編程知識(shí) > 正文

php如何實(shí)現(xiàn)驗(yàn)證碼的識(shí)別

2020-09-01 分類(lèi)：編程知識(shí) 閱讀(792) 評(píng)論(0)

php實(shí)現(xiàn)驗(yàn)證碼識(shí)別的方法：首先將圖片二值化，并將值保存到二維數(shù)組里；然后通過(guò)循環(huán)，求出每一個(gè)數(shù)字的位置；接著計(jì)算出數(shù)字在二維數(shù)組里的位置，并拼接數(shù)字；最后將字符串與每一個(gè)字模的字符串進(jìn)行比較識(shí)別即可。

php如何實(shí)現(xiàn)驗(yàn)證碼的識(shí)別

推薦：《PHP視頻教程》

但是原文的介紹比較簡(jiǎn)單，而且沒(méi)提到算法的具體實(shí)現(xiàn)過(guò)程。詳細(xì)過(guò)程轉(zhuǎn)自：

http://www.poboke.com/study/php-verification-code-identification-primary.html

所以本文以一個(gè)實(shí)際例子來(lái)演示php識(shí)別驗(yàn)證碼的過(guò)程，并提交驗(yàn)證碼到服務(wù)器驗(yàn)證。

第一部分：驗(yàn)證碼的識(shí)別

近期研究一些突破驗(yàn)證碼方面的知識(shí)，記錄下來(lái)。一方面算是對(duì)這幾天學(xué)習(xí)知識(shí)的總結(jié)幫助自己理解；另一方面希望對(duì)研究這方面的技術(shù)同學(xué)有所幫助；另外也希望引起網(wǎng)站管理者的注意，在提供驗(yàn)證碼時(shí)多些考慮進(jìn)去。由于剛剛接觸這方面的知識(shí)，理解比較淺顯，有錯(cuò)誤再所難免，歡迎拍磚。

驗(yàn)證碼的作用：有效防止某個(gè)黑客對(duì)某一個(gè)特定注冊(cè)用戶用特定程序暴力破解方式進(jìn)行不斷的登陸嘗試。其實(shí)現(xiàn)代的驗(yàn)證碼一般是防止機(jī)器批量注冊(cè)的，防止機(jī)器批量發(fā)帖回復(fù)。目前，不少網(wǎng)站為了防止用戶利用機(jī)器人自動(dòng)注冊(cè)、登錄、灌水，都采用了驗(yàn)證碼技術(shù)。

所謂驗(yàn)證碼，就是將一串隨機(jī)產(chǎn)生的數(shù)字或符號(hào)，生成一幅圖片，圖片里加上一些干擾象素（防止OCR），由用戶肉眼識(shí)別其中的驗(yàn)證碼信息，輸入表單提交網(wǎng)站驗(yàn)證，驗(yàn)證成功后才能使用某項(xiàng)功能。

我們最常見(jiàn)的驗(yàn)證碼：
1、四位數(shù)字，隨機(jī)的一數(shù)字字符串，最原始的驗(yàn)證碼，驗(yàn)證作用幾乎為零。
2、隨機(jī)數(shù)字圖片驗(yàn)證碼。圖片上的字符比較中規(guī)中矩，有的可能加入一些隨機(jī)干擾素，還有一些是隨機(jī)字符顏色，驗(yàn)證作用比上一個(gè)好。沒(méi)有基本圖形圖像學(xué)知識(shí)的人，不可破！
3、各種圖片格式的隨機(jī)數(shù)字+隨機(jī)大寫(xiě)英文字母+隨機(jī)干擾像素+隨機(jī)位置。
4、漢字是注冊(cè)目前最新的驗(yàn)證碼，隨機(jī)生成，打起來(lái)更難了,影響用戶體驗(yàn)，所以，一般應(yīng)用的比較少。

簡(jiǎn)單起見(jiàn)，我們這次說(shuō)明的主要對(duì)象是第1種類(lèi)型的，我們先看幾種網(wǎng)上比較常見(jiàn)的驗(yàn)證碼圖片。 php如何實(shí)現(xiàn)驗(yàn)證碼的識(shí)別
這四種樣式，基本上能代表2中所提到的驗(yàn)證碼類(lèi)型，初步看起來(lái)第一個(gè)圖片最容易破解，第二個(gè)次之，第三個(gè)更難,第四個(gè)最難。
真實(shí)情況呢？其實(shí)這三種圖片破解難度相同。

第一個(gè)圖片，最容易，圖片背景和數(shù)字都使用相同的顏色，字符規(guī)整，字符位置統(tǒng)一。本篇文章，就一這種類(lèi)型驗(yàn)證碼為例說(shuō)明，其它的圖片，同學(xué)們自己搞。
第二個(gè)圖片，看似不容易，其實(shí)仔細(xì)研究會(huì)發(fā)現(xiàn)其規(guī)則，背景色和干擾素?zé)o論怎么變化，驗(yàn)證字符字符規(guī)整，顏色相同，所以排除干擾素非常容易，只要是非字符色素全部排除即可。
第三個(gè)圖片，看似更復(fù)雜，處理上面提到背景色和干擾素一直變化外，驗(yàn)證字符的顏色也在變化，并且各個(gè)字符的顏色也各不相同。
第四個(gè)圖片，除了第三個(gè)圖片上提到的特征外，又在文字上加了兩條直線干擾率，看似困難其實(shí)，很容易去掉。

下面以萬(wàn)網(wǎng)的“通用網(wǎng)址查詢”來(lái)說(shuō)明驗(yàn)證碼的識(shí)別過(guò)程。
打開(kāi)萬(wàn)網(wǎng)：http://www.net.cn ，網(wǎng)站右邊側(cè)邊欄有一個(gè)“通用網(wǎng)址查詢”：
php如何實(shí)現(xiàn)驗(yàn)證碼的識(shí)別
可以看出，這是第一種驗(yàn)證碼，為了讓人眼能夠識(shí)別出數(shù)字，所以驗(yàn)證碼圖片的數(shù)字顏色和背景顏色的色差是比較大的，所以其RBG值也相差很大，可以通過(guò)判斷每個(gè)像素的RGB值來(lái)區(qū)分?jǐn)?shù)字和背景。

驗(yàn)證碼識(shí)別一般分為以下幾個(gè)步驟：

一、取出字模
識(shí)別驗(yàn)證碼，畢竟不是專(zhuān)業(yè)的OCR識(shí)別，并且，由于各個(gè)網(wǎng)站的驗(yàn)證碼各不相同，所以，最常見(jiàn)的方法就是就是建立這個(gè)驗(yàn)證碼的特征碼庫(kù)。去字模時(shí)，我們需要多下載幾張圖片，使這些圖片中，包括所有的字符，我們這里的圖片里只有數(shù)字，所以，只要收集到包括0-9的數(shù)字圖片即可。

1、多刷新幾次驗(yàn)證碼，將驗(yàn)證碼圖片保存起來(lái)，要搜集齊0-9的圖片。
php如何實(shí)現(xiàn)驗(yàn)證碼的識(shí)別

2、用圖片處理軟件打開(kāi)圖片，我用的是Fireworks，按住ctrl+8可以將圖片的視圖放大8倍，這樣就能很清楚地觀察到圖片的每個(gè)像素。
php如何實(shí)現(xiàn)驗(yàn)證碼的識(shí)別
可以發(fā)現(xiàn)，每個(gè)數(shù)字的寬是6px，高是10px，數(shù)字的間隔是4px，第一個(gè)數(shù)字左邊偏移了2px，頂部偏移了0px。這些數(shù)字后面都是要用到的。

3、將每個(gè)數(shù)字截出來(lái)保存為圖片，大小為6*10。
php如何實(shí)現(xiàn)驗(yàn)證碼的識(shí)別

二、圖片二值化
二值化就是把圖片上的驗(yàn)證數(shù)字上每個(gè)象素用數(shù)字1表示，其它部分用0表示。把要識(shí)別的圖片，進(jìn)行二值化，將數(shù)據(jù)保存到二維數(shù)組里，得到圖片特征數(shù)組。

1、首先要將數(shù)字和背景色和干擾色區(qū)分開(kāi)來(lái)，用屏幕取色器觀察顏色的規(guī)律。
php如何實(shí)現(xiàn)驗(yàn)證碼的識(shí)別
可以得出一個(gè)結(jié)論：背景顏色的R、G、B值都是大于200的，而數(shù)字的顏色的R、G、B值的某一項(xiàng)有可能小于200，因此可以很容易區(qū)分。

2、下面的php代碼只是為了演示二維數(shù)組，為了直觀看出數(shù)字，所以把1和0改為了0和-：

echo '&lt;br&gt;&lt;img src="v1.jpg"&gt;&lt;br&gt;&lt;br&gt;';

getHec("v1.jpg");

function getHec($imagePath) {
    $res = imagecreatefromjpeg($imagePath);
    $size = getimagesize($imagePath);
    
    for ($i = 0; $i &lt; $size[1]; ++$i) {
        for ($j = 0; $j &lt; $size[0]; ++$j) {
            $rgb = imagecolorat($res, $j, $i);
            $rgbarray = imagecolorsforindex($res, $rgb);
            if ($rgbarray['red'] &lt; 200 || $rgbarray['green']&lt;200 || $rgbarray['blue'] &lt; 200) {
                echo "0";
            }else{
                echo "-";
            }
        }
        echo "&lt;br&gt;";
    }
} 

結(jié)果如下圖所示：
php如何實(shí)現(xiàn)驗(yàn)證碼的識(shí)別
如果圖片的背景顏色比較復(fù)雜，處理方法也是一樣的，總能找到臨界值來(lái)區(qū)分，具體要靠自己觀察了。

三、數(shù)字字模二值化
計(jì)算出每個(gè)數(shù)字字模的二值化的數(shù)據(jù)，記錄下這些數(shù)據(jù)，當(dāng)作key即可。

1、將0-9的數(shù)字字模圖片進(jìn)行二值化，逐個(gè)取出圖片的像個(gè)像素的顏色，然后獲取每個(gè)像素的R、G、B值，再進(jìn)行判斷，代碼如下：

for($i=0;$i&lt;10;$i++){
    echo"'$i'=&gt;'";
    echogetHec("$i.jpg")."',&lt;br&gt;";
}

functiongetHec($imagePath){
    $res=imagecreatefromjpeg($imagePath);
    $size=getimagesize($imagePath);
    
    for($i=0;$i&lt;$size[1];++$i){
        for($j=0;$j&lt;$size[0];++$j){
            $rgb=imagecolorat($res,$j,$i);
            $rgbarray=imagecolorsforindex($res,$rgb);
            if($rgbarray['red']&lt;200||$rgbarray['green']&lt;200||$rgbarray['blue']&lt;200){
                echo"1";
            }else{
                echo"0";
            }
        }
    }
}

輸出結(jié)果：

'0'=&gt;'011110100001100001100001100001100001100001100001100001011110',
'1'=&gt;'001000111000001000001000001000001000001000001000001000111110',
'2'=&gt;'011110100001100001000001000010000100001000010000110011111111',
'3'=&gt;'011110100001100001000010001100000010000001100001100001011110',
'4'=&gt;'000100000100001100010100100100100100111111000100001100001111',
'5'=&gt;'111111100000100000101110110001000001000001100001100001011110',
'6'=&gt;'001110010001100000100000101110110001100001100001100001011110',
'7'=&gt;'111111100010100010000100000100001000001000001000001000001000',
'8'=&gt;'011110100001100001100001011110010010100001100001100001011110',
'9'=&gt;'011100100010100001100001100011011101000001000001100010011100',

四、對(duì)照樣本
把步驟二中的圖片特征碼和步驟三中的驗(yàn)證碼的字模進(jìn)行對(duì)比，得到驗(yàn)證圖片上的數(shù)字。

算法過(guò)程（代碼見(jiàn)附件）：
1、將圖片二值化后的值保存到二維數(shù)組里。
2、通過(guò)循環(huán)，求出每一個(gè)數(shù)字的位置，要用到前面得到的數(shù)字的寬、高、間隔、左邊偏移、頂部偏移。
例如：第i個(gè)數(shù)字左邊偏移 =（數(shù)字寬 + 間隔）* i + 左邊偏移。（w h x y）
3、知道了數(shù)字的偏移位置，就可以計(jì)算出數(shù)字在二維數(shù)組里的位置，通過(guò)循環(huán)將數(shù)字的6*10=60個(gè)數(shù)據(jù)取出來(lái)拼接在一起，就形成了與數(shù)字字模類(lèi)似的字符串。
4、將字符串與每一個(gè)字模的字符串比較，求其相似度，取最高的相似度對(duì)應(yīng)的數(shù)字，或者相似度達(dá)到95%以上就可以斷定是某個(gè)數(shù)字。
5、識(shí)別結(jié)果如下：
php如何實(shí)現(xiàn)驗(yàn)證碼的識(shí)別

使用目前這種方法，對(duì)驗(yàn)證碼的識(shí)別基本上可以做到100%。
通過(guò)以上步驟，您可能說(shuō)了，并沒(méi)有發(fā)現(xiàn)如何取出干擾素??！其實(shí)取出干擾素的方法很簡(jiǎn)單，干擾素的一個(gè)重要特征是，不能影響驗(yàn)證碼的顯示效果，所以制作干擾素時(shí)它的RGB可能低于或者高于某個(gè)特定值，比如我給的例子中的圖片，干擾素的RGB各項(xiàng)值是不會(huì)小于200的，所以，這樣我們就很容易去掉干擾素了。

源碼下載:http://yunpan.cn/cmJCkEnyGij3t 訪問(wèn)密碼 d2ba

贊(0)

標(biāo)簽：AI app css DB2 php set word Yout 影響用戶體驗(yàn)服務(wù)器機(jī)器人用戶體驗(yàn)

相關(guān)推薦

?

網(wǎng)站地圖滬ICP備18035694號(hào)-2

滬公網(wǎng)安備31011702889846號(hào)