久久久久久久视色,久久电影免费精品,中文亚洲欧美乱码在线观看,在线免费播放AV片

<center id="vfaef"><input id="vfaef"><table id="vfaef"></table></input></center>

    <p id="vfaef"><kbd id="vfaef"></kbd></p>

    
    
    <pre id="vfaef"><u id="vfaef"></u></pre>

      <thead id="vfaef"><input id="vfaef"></input></thead>

    1. 站長資訊網(wǎng)
      最全最豐富的資訊網(wǎng)站

      php如何實(shí)現(xiàn)驗(yàn)證碼的識別

      php實(shí)現(xiàn)驗(yàn)證碼識別的方法:首先將圖片二值化,并將值保存到二維數(shù)組里;然后通過循環(huán),求出每一個(gè)數(shù)字的位置;接著計(jì)算出數(shù)字在二維數(shù)組里的位置,并拼接數(shù)字;最后將字符串與每一個(gè)字模的字符串進(jìn)行比較識別即可。

      php如何實(shí)現(xiàn)驗(yàn)證碼的識別

      推薦:《PHP視頻教程》

      但是原文的介紹比較簡單,而且沒提到算法的具體實(shí)現(xiàn)過程。詳細(xì)過程轉(zhuǎn)自:

      http://www.poboke.com/study/php-verification-code-identification-primary.html

      所以本文以一個(gè)實(shí)際例子來演示php識別驗(yàn)證碼的過程,并提交驗(yàn)證碼到服務(wù)器驗(yàn)證。

      第一部分:驗(yàn)證碼的識別

      近期研究一些突破驗(yàn)證碼方面的知識,記錄下來。一方面算是對這幾天學(xué)習(xí)知識的總結(jié)幫助自己理解;另一方面希望對研究這方面的技術(shù)同學(xué)有所幫助;另外也希望引起網(wǎng)站管理者的注意,在提供驗(yàn)證碼時(shí)多些考慮進(jìn)去。由于剛剛接觸這方面的知識,理解比較淺顯,有錯(cuò)誤再所難免,歡迎拍磚。

      驗(yàn)證碼的作用:有效防止某個(gè)黑客對某一個(gè)特定注冊用戶用特定程序暴力破解方式進(jìn)行不斷的登陸嘗試。其實(shí)現(xiàn)代的驗(yàn)證碼一般是防止機(jī)器批量注冊的,防止機(jī)器批量發(fā)帖回復(fù)。目前,不少網(wǎng)站為了防止用戶利用機(jī)器人自動注冊、登錄、灌水,都采用了驗(yàn)證碼技術(shù)。

      所謂驗(yàn)證碼,就是將一串隨機(jī)產(chǎn)生的數(shù)字或符號,生成一幅圖片,圖片里加上一些干擾象素(防止OCR),由用戶肉眼識別其中的驗(yàn)證碼信息,輸入表單提交網(wǎng)站驗(yàn)證,驗(yàn)證成功后才能使用某項(xiàng)功能。

      我們最常見的驗(yàn)證碼:
      1、四位數(shù)字,隨機(jī)的一數(shù)字字符串,最原始的驗(yàn)證碼,驗(yàn)證作用幾乎為零。
      2、隨機(jī)數(shù)字圖片驗(yàn)證碼。圖片上的字符比較中規(guī)中矩,有的可能加入一些隨機(jī)干擾素,還有一些是隨機(jī)字符顏色,驗(yàn)證作用比上一個(gè)好。沒有基本圖形圖像學(xué)知識的人,不可破!
      3、各種圖片格式的隨機(jī)數(shù)字+隨機(jī)大寫英文字母+隨機(jī)干擾像素+隨機(jī)位置。
      4、漢字是注冊目前最新的驗(yàn)證碼,隨機(jī)生成,打起來更難了,影響用戶體驗(yàn),所以,一般應(yīng)用的比較少。

      簡單起見,我們這次說明的主要對象是第1種類型的,我們先看幾種網(wǎng)上比較常見的驗(yàn)證碼圖片。 php如何實(shí)現(xiàn)驗(yàn)證碼的識別
      這四種樣式,基本上能代表2中所提到的驗(yàn)證碼類型,初步看起來第一個(gè)圖片最容易破解,第二個(gè)次之,第三個(gè)更難,第四個(gè)最難。
      真實(shí)情況呢?其實(shí)這三種圖片破解難度相同。

      第一個(gè)圖片,最容易,圖片背景和數(shù)字都使用相同的顏色,字符規(guī)整,字符位置統(tǒng)一。本篇文章,就一這種類型驗(yàn)證碼為例說明,其它的圖片,同學(xué)們自己搞。
      第二個(gè)圖片,看似不容易,其實(shí)仔細(xì)研究會發(fā)現(xiàn)其規(guī)則,背景色和干擾素?zé)o論怎么變化,驗(yàn)證字符字符規(guī)整,顏色相同,所以排除干擾素非常容易,只要是非字符色素全部排除即可。
      第三個(gè)圖片,看似更復(fù)雜,處理上面提到背景色和干擾素一直變化外,驗(yàn)證字符的顏色也在變化,并且各個(gè)字符的顏色也各不相同。
      第四個(gè)圖片,除了第三個(gè)圖片上提到的特征外,又在文字上加了兩條直線干擾率,看似困難其實(shí),很容易去掉。

      下面以萬網(wǎng)的“通用網(wǎng)址查詢”來說明驗(yàn)證碼的識別過程。
      打開萬網(wǎng):http://www.net.cn ,網(wǎng)站右邊側(cè)邊欄有一個(gè)“通用網(wǎng)址查詢”:
      php如何實(shí)現(xiàn)驗(yàn)證碼的識別
      可以看出,這是第一種驗(yàn)證碼,為了讓人眼能夠識別出數(shù)字,所以驗(yàn)證碼圖片的數(shù)字顏色和背景顏色的色差是比較大的,所以其RBG值也相差很大,可以通過判斷每個(gè)像素的RGB值來區(qū)分?jǐn)?shù)字和背景。

      驗(yàn)證碼識別一般分為以下幾個(gè)步驟:

      一、取出字模
      識別驗(yàn)證碼,畢竟不是專業(yè)的OCR識別,并且,由于各個(gè)網(wǎng)站的驗(yàn)證碼各不相同,所以,最常見的方法就是就是建立這個(gè)驗(yàn)證碼的特征碼庫。去字模時(shí),我們需要多下載幾張圖片,使這些圖片中,包括所有的字符,我們這里的圖片里只有數(shù)字,所以,只要收集到包括0-9的數(shù)字圖片即可。

      1、多刷新幾次驗(yàn)證碼,將驗(yàn)證碼圖片保存起來,要搜集齊0-9的圖片。
      php如何實(shí)現(xiàn)驗(yàn)證碼的識別

      2、用圖片處理軟件打開圖片,我用的是Fireworks,按住ctrl+8可以將圖片的視圖放大8倍,這樣就能很清楚地觀察到圖片的每個(gè)像素。
      php如何實(shí)現(xiàn)驗(yàn)證碼的識別
      可以發(fā)現(xiàn),每個(gè)數(shù)字的寬是6px,高是10px,數(shù)字的間隔是4px,第一個(gè)數(shù)字左邊偏移了2px,頂部偏移了0px。這些數(shù)字后面都是要用到的。

      3、將每個(gè)數(shù)字截出來保存為圖片,大小為6*10。
      php如何實(shí)現(xiàn)驗(yàn)證碼的識別

      二、圖片二值化
      二值化就是把圖片上的驗(yàn)證數(shù)字上每個(gè)象素用數(shù)字1表示,其它部分用0表示。把要識別的圖片,進(jìn)行二值化,將數(shù)據(jù)保存到二維數(shù)組里,得到圖片特征數(shù)組。

      1、首先要將數(shù)字和背景色和干擾色區(qū)分開來,用屏幕取色器觀察顏色的規(guī)律。
      php如何實(shí)現(xiàn)驗(yàn)證碼的識別
      可以得出一個(gè)結(jié)論:背景顏色的R、G、B值都是大于200的,而數(shù)字的顏色的R、G、B值的某一項(xiàng)有可能小于200,因此可以很容易區(qū)分。

      2、下面的php代碼只是為了演示二維數(shù)組,為了直觀看出數(shù)字,所以把1和0改為了0和-:

      1

      2

      3

      4

      5

      6

      7

      8

      9

      10

      11

      12

      13

      14

      15

      16

      17

      18

      19

      20

      21

      echo '&lt;br&gt;&lt;img src="v1.jpg"&gt;&lt;br&gt;&lt;br&gt;';

      getHec("v1.jpg");

      function getHec($imagePath) {

      $res = imagecreatefromjpeg($imagePath);

      $size = getimagesize($imagePath);

      for ($i = 0; $i &lt; $size[1]; ++$i) {

      for ($j = 0; $j &lt; $size[0]; ++$j) {

      $rgb = imagecolorat($res, $j, $i);

      $rgbarray = imagecolorsforindex($res, $rgb);

      if ($rgbarray['red'] &lt; 200 || $rgbarray['green']&lt;200 || $rgbarray['blue'] &lt; 200) {

      echo "0";

      }else{

      echo "-";

      }

      }

      echo "&lt;br&gt;";

      }

      }

      結(jié)果如下圖所示:
      php如何實(shí)現(xiàn)驗(yàn)證碼的識別
      如果圖片的背景顏色比較復(fù)雜,處理方法也是一樣的,總能找到臨界值來區(qū)分,具體要靠自己觀察了。

      三、數(shù)字字模二值化
      計(jì)算出每個(gè)數(shù)字字模的二值化的數(shù)據(jù),記錄下這些數(shù)據(jù),當(dāng)作key即可。

      1、將0-9的數(shù)字字模圖片進(jìn)行二值化,逐個(gè)取出圖片的像個(gè)像素的顏色,然后獲取每個(gè)像素的R、G、B值,再進(jìn)行判斷,代碼如下:

      1

      2

      3

      4

      5

      6

      7

      8

      9

      10

      11

      12

      13

      14

      15

      16

      17

      18

      19

      20

      21

      for($i=0;$i&lt;10;$i++){

      echo"'$i'=&gt;'";

      echogetHec("$i.jpg")."',&lt;br&gt;";

      }

      functiongetHec($imagePath){

      $res=imagecreatefromjpeg($imagePath);

      $size=getimagesize($imagePath);

      for($i=0;$i&lt;$size[1];++$i){

      for($j=0;$j&lt;$size[0];++$j){

      $rgb=imagecolorat($res,$j,$i);

      $rgbarray=imagecolorsforindex($res,$rgb);

      if($rgbarray['red']&lt;200||$rgbarray['green']&lt;200||$rgbarray['blue']&lt;200){

      echo"1";

      }else{

      echo"0";

      }

      }

      }

      }

      輸出結(jié)果:

      1

      2

      3

      4

      5

      6

      7

      8

      9

      10

      '0'=&gt;'011110100001100001100001100001100001100001100001100001011110',

      '1'=&gt;'001000111000001000001000001000001000001000001000001000111110',

      '2'=&gt;'011110100001100001000001000010000100001000010000110011111111',

      '3'=&gt;'011110100001100001000010001100000010000001100001100001011110',

      '4'=&gt;'000100000100001100010100100100100100111111000100001100001111',

      '5'=&gt;'111111100000100000101110110001000001000001100001100001011110',

      '6'=&gt;'001110010001100000100000101110110001100001100001100001011110',

      '7'=&gt;'111111100010100010000100000100001000001000001000001000001000',

      '8'=&gt;'011110100001100001100001011110010010100001100001100001011110',

      '9'=&gt;'011100100010100001100001100011011101000001000001100010011100',

      四、對照樣本
      把步驟二中的圖片特征碼和步驟三中的驗(yàn)證碼的字模進(jìn)行對比,得到驗(yàn)證圖片上的數(shù)字。

      算法過程(代碼見附件):
      1、將圖片二值化后的值保存到二維數(shù)組里。
      2、通過循環(huán),求出每一個(gè)數(shù)字的位置,要用到前面得到的數(shù)字的寬、高、間隔、左邊偏移、頂部偏移。
      例如:第i個(gè)數(shù)字左邊偏移 =(數(shù)字寬 + 間隔)* i + 左邊偏移。(w h x y)
      3、知道了數(shù)字的偏移位置,就可以計(jì)算出數(shù)字在二維數(shù)組里的位置,通過循環(huán)將數(shù)字的6*10=60個(gè)數(shù)據(jù)取出來拼接在一起,就形成了與數(shù)字字模類似的字符串。
      4、將字符串與每一個(gè)字模的字符串比較,求其相似度,取最高的相似度對應(yīng)的數(shù)字,或者相似度達(dá)到95%以上就可以斷定是某個(gè)數(shù)字。
      5、識別結(jié)果如下:
      php如何實(shí)現(xiàn)驗(yàn)證碼的識別

      使用目前這種方法,對驗(yàn)證碼的識別基本上可以做到100%。
      通過以上步驟,您可能說了,并沒有發(fā)現(xiàn)如何取出干擾素?。∑鋵?shí)取出干擾素的方法很簡單,干擾素的一個(gè)重要特征是,不能影響驗(yàn)證碼的顯示效果,所以制作干擾素時(shí)它的RGB可能低于或者高于某個(gè)特定值,比如我給的例子中的圖片,干擾素的RGB各項(xiàng)值是不會小于200的,所以,這樣我們就很容易去掉干擾素了。

      源碼下載:http://yunpan.cn/cmJCkEnyGij3t 訪問密碼 d2ba

      贊(0)
      分享到: 更多 (0)
      網(wǎng)站地圖   滬ICP備18035694號-2    滬公網(wǎng)安備31011702889846號