记录一次机器学习之 CNN 验证码识别的尝试

任职的时候验证码识别这里的工作是AI 工程师专职同事做的, 虽然当时要来了模型但是现在也改不懂 😮‍💨

已离职也不太好打扰,遂顺手学习一下 :)

虽然几年前跟着 tutorial 走了一遍 tensorflow 的 CNN,早就忘得差不多了

跟着专业同事的路子,学习及实践一下 pytorch

mind map

细节

记得他们常说 GPU 训练 CPU 跑模型
也是,除了吹牛逼哪里会有应用场景需要 GPU 跑验证码识别

目前样本数据量还小,现在还是用 mac 本的 CPU 边跑边迭代基础工具链。
后续计划阿里云按小时买 GPU 服务器进行训练

conclusion

  • 第一天,重温基础知识 && 迭代基础工具链
    • pyside 6 写了一个验证码辅助打码工具
      • pyqt6 是第三方,pyside6是 QT 亲儿子
    • 尝试训练 =》有模型训练代码也卵用 :(
  • 第二天,35%(max 35/100)的识别成功率。
    • 打码量积累到 1000 级别的 train 量
  • 第三天,迭代基础工具链
    • 调参后识别成功率 59% (max 59/100)
  • 结束 96% 以上识别率

准确率

工具链