OCR 识别老验证码,老算式验证码,集装箱号 C#/JavaScript&HTML5
作者:V君 发布于:2016-9-10 3:25 Saturday 分类:挖坑经验
最近 这些天 在负责集装箱拖运相关的项目,
需要从某些行业平台上取得集装箱信息.
还要在手机网页识别集装箱号.
在运营攻关得到接口之前, 只能肮脏地模拟浏览器请求来拉取信息了,
看到上古时期的验证码当时就噗了一下然后解决掉了.
做法很简单:
1)先从验证码URL拉回图像数据
2)载入成GDI+对象之后做预处理
用了AForge的灰阶滤镜, yuanbao 的降噪算法, 外加自己补刀去掉漏网的噪点
3)再塞给Tesseract就可以吃了
Type 1: 纯数字 -- 秒破
Type 2: 简单算式 -- 取到文本后用正则提取一下操作数和运算符, 也是秒破
Type 3: 字母和数字 这就不是很理想了, 应该是官方识别库的锅比如总是把 3 识别成 J ...
其实可以自己训练识别库的, 但是不能花太多时间折腾了. 就让程序多重试几次吧~
这个demo的源代码已经放在SVN了Git了, 写的很不严谨仅供参考...
你需要下载识别库tessdata放在bin文件夹才能使OCR组件Tesseract工作
接下来是重头戏 , 集装箱号识别.
司机端是用x信, 里面的WebView似乎不能直接访问摄像头拉取实时图像来对柜号进行扫一扫.
起初打算拍照之后上传回到服务器再慢慢OCR, 但咱却意外地发现了Tesseract的js版!
现在不支持Canvas的手机应该不多了, 手机端完成识别的话只需要往回传文本啦!
做了个经过阉割的迷你示例, 可以直接在浏览器上运行.
标签: 软件开发 javascript C# 图像处理 OCR
blogger
Google Web Translator
热门日志
随机日志
最新日志
最新评论
- V君
@Quartz:(出现)... - Quartz
怎么不见人了呢... - V君
@Soar:DHCP 协议相... - V君
@Soar:当然是非... - Soar
@V君:谢谢 有空... - Soar
搞一个 1230v3+B85... - V君
@Soar:另外,也可... - V君
@Soar:iscsi服务端... - Soar
难怪这么卡,尤其... - Soar
clone了源码,提示...
分类
存档
- 2024年5月(1)
- 2023年7月(1)
- 2023年5月(1)
- 2022年11月(1)
- 2022年10月(1)
- 2022年9月(1)
- 2022年8月(1)
- 2022年7月(1)
- 2022年6月(1)
- 2022年5月(2)
- 2022年4月(1)
- 2022年3月(1)
- 2022年2月(1)
- 2022年1月(1)
- 2021年12月(1)
- 2021年11月(1)
- 2021年10月(1)
- 2021年9月(1)
- 2021年8月(1)
- 2021年7月(1)
- 2021年6月(1)
- 2021年5月(1)
- 2021年4月(1)
- 2021年3月(1)
- 2021年2月(1)
- 2021年1月(1)
- 2020年12月(1)
- 2020年11月(1)
- 2020年10月(2)
- 2020年9月(1)
- 2020年8月(1)
- 2020年7月(1)
- 2020年6月(1)
- 2020年5月(1)
- 2020年4月(2)
- 2020年3月(3)
- 2020年2月(1)
- 2020年1月(1)
- 2019年12月(1)
- 2019年11月(1)
- 2019年10月(1)
- 2019年9月(1)
- 2019年8月(2)
- 2019年7月(1)
- 2019年6月(1)
- 2019年5月(1)
- 2019年4月(1)
- 2019年3月(1)
- 2019年2月(1)
- 2019年1月(2)
- 2018年12月(2)
- 2018年11月(1)
- 2018年10月(3)
- 2018年9月(4)
- 2018年8月(6)
- 2018年7月(4)
- 2018年6月(1)
- 2018年5月(2)
- 2018年4月(2)
- 2018年3月(3)
- 2018年2月(1)
- 2018年1月(1)
- 2017年12月(1)
- 2017年10月(2)
- 2017年9月(1)
- 2017年8月(2)
- 2017年7月(1)
- 2017年6月(5)
- 2017年5月(2)
- 2017年4月(2)
- 2017年3月(3)
- 2017年2月(2)
- 2017年1月(2)
- 2016年12月(3)
- 2016年11月(2)
- 2016年10月(3)
- 2016年9月(4)
- 2016年8月(2)
- 2016年7月(4)
- 2016年6月(3)
- 2016年5月(1)
- 2016年4月(4)
- 2016年3月(3)
- 2016年2月(1)
- 2016年1月(5)
- 2015年12月(4)
- 2015年11月(5)
- 2015年10月(1)
- 2015年9月(6)
- 2015年8月(4)
- 2015年7月(1)
- 2015年6月(6)
- 2015年5月(3)
- 2015年4月(3)
- 2015年3月(2)
- 2015年2月(1)
- 2015年1月(3)
- 2014年12月(1)
- 2014年11月(1)
- 2014年10月(1)
- 2014年9月(3)
- 2014年8月(1)
- 2014年7月(1)
- 2014年6月(1)
- 2014年5月(3)
- 2014年4月(1)
- 2014年3月(1)
- 2014年2月(2)
- 2014年1月(1)
- 2013年12月(2)
- 2013年11月(2)
- 2013年10月(1)
- 2013年9月(3)
- 2013年8月(14)
- 2013年7月(7)
- 2013年4月(1)
- 2013年3月(4)
- 2013年2月(6)
- 2013年1月(6)
- 2012年12月(8)
- 2012年11月(6)
发表评论: