逆向-爬虫-简单图形验证码 yuan lang 2024-03-21 爬虫-js逆向 简单图形验证码 MAC1234# 准备1. brew install tesseract2. pip install pytesseract3. 去往https://github.com/tesseract-ocr/tessdata下载中文数据集chi_sim.traineddata,把它放到这目录下: /usr/local/Cellar/tesseract/3.05.01/share/tessdata 使用: 1234567import pytesseractfrom PIL import Image# open imageimage = Image.open('test.png')code = pytesseract.image_to_string(image, lang='chi_sim')print(code) 总结:验证码处理步骤 灰度化 二值化(涉及到找阀值 类间方差) 去干扰线 降噪 (高斯降噪) 切割 识别