全部产品
云市场

OCR 使用方法

更新时间:2019-09-18 15:39:30

目录

ocr

要使用ocr模块,需要使用ocr
ocr模块是用来向用户提供一系列ocr识别相关的SDK,包括图片、身份证、发票等识别。

text

text(image_path,engine=’aliyun’)

  • image_path : 图片路径
  • engine : 引擎选择,可选值:aliyun、google
  • app_code : 针对引擎’aliyun’需要,请登录aliyun.com购买后使用

有关app_code:

  1. 如何购买
  2. ocr够买链接如下:https://market.aliyun.com/products/57124001/cmapi023866.html
  3. 如何查看

文字识别

  1. from rpa.core import *
  2. from rpa.utils import *
  3. import ocr
  4. import rpa
  5. #图片支持本地或网络图片
  6. image_path = 'http://img.alicdn.com/tps/i1/T1MoLQFPdcXXcXNlf0-380-480.jpg'
  7. #默认aliyun ocr获取结果
  8. #access_key_id及access_key_secret替换成自己的
  9. text = ocr.text(image_path,app_code='自己的app_code')
  10. rpa.logger.info(text)
  11. #google开源ocr
  12. text = ocr.text(image_path,'google')
  13. rpa.logger.info(text)

idCard_front

idCard_front(image_path,app_code)

  • image_path : 图片路径
  • app_code : 购买商品后获得的appCode

身份证正面识别
身份证识别购买链接:https://market.aliyun.com/products/57124001/cmapi010401.html

  1. from rpa.core import *
  2. from rpa.utils import *
  3. import ocr
  4. import rpa
  5. #图片支持本地或网络图片
  6. image_path = "https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1528375609915&di=b3c0f917609793c4929230d8dab79a69&imgtype=0&src=http%3A%2F%2F5b0988e595225.cdn.sohucs.com%2Fimages%2F20171111%2F8a2058c30d614674a4fa7e40cf171ebf.jpeg"
  7. #image_path=r'C:\work\ocr\正面.jpg'
  8. #app_code替换成自己的
  9. cardFront = ocr.idCard_front(image_path,app_code='自己的app_code')
  10. #身份证信息获取
  11. #名称
  12. rpa.logger.info(cardFront.name)
  13. #地址
  14. rpa.logger.info(cardFront.address)
  15. #出生日期
  16. rpa.logger.info(cardFront.birth)
  17. #身份证号码
  18. rpa.logger.info(cardFront.number)
  19. #性别
  20. rpa.logger.info(cardFront.sex)

idCard_back

idCard_back(image_path,app_code)

  • image_path : 图片路径
  • app_code : 购买商品后获得的appCode

身份证反面识别

  1. from rpa.core import *
  2. from rpa.utils import *
  3. import ocr
  4. import rpa
  5. #图片支持本地或网络图片
  6. image_path = "https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1528376006540&di=0ad525d2d94e5ab5bcb7b3990291badf&imgtype=0&src=http%3A%2F%2Fimg2.thebetterchinese.com%2Fbeicai2%2Ftmp%2F33339769f5f3411497a65bb785f42f49.jpg"
  7. #image_path=r'C:\work\ocr\反面.jpg'
  8. #app_code替换成自己的
  9. #身份证信息获取
  10. cardBack = ocr.idCard_back(image_path,app_code='自己的app_code')
  11. #签发机构
  12. rpa.logger.info(cardBack.authority)
  13. #有限期限-开始日期
  14. rpa.logger.info(cardBack.startDate)
  15. #有限期限-结束日期
  16. rpa.logger.info(cardBack.endDate)

invoice

invoice(image_path,app_code)

  • image_path : 图片路径
  • app_code : 购买商品后获得的appCode

发票识别,识别结果包括的信息:
发票代码,发票号码,开票日期,校验码,发票金额,发票税额,不含税金额,受票方名称,
受票方税号,受票方地址、电话,受票方开户行、账号,销售方名称,销售方税号,销售方地址、电话,销售方开户行、账号

发票app_code购买链接:https://market.aliyun.com/products/57124001/cmapi027758.html

  1. from rpa.core import *
  2. from rpa.utils import *
  3. import ocr
  4. import rpa
  5. try:
  6. #本地或网络发票图片路径
  7. #app_code替换成自己的
  8. file_path = r"C:\work\2018\ocr\发票\10.jpg"
  9. #file_path = 'http://rpa- demo.allinbots.com/rpa/file/get/26eafdffe8bf764b189172f85975bf9ccb3b95dd.jpg'
  10. result = ocr.invoice(file_path,app_code='自己的app_code')
  11. #rpa.logger.info(result)
  12. rpa.logger.info(result["受票方名称"])
  13. rpa.logger.info(result["发票税额"])
  14. rpa.logger.info(result["开票日期"])
  15. rpa.logger.info(result["发票代码"])
  16. #其它信息参考说明
  17. except SDKError as e:
  18. rpa.logger.info(e)

table

table(image_path,app_code,pdf_page_index)

  • image_path : 图片路径
  • app_code : 购买商品后获得的appCode
  • pdf_page_index : 针对pdf文件,可以指定只读取某些页,支持多页,如:2,3

表格识别购买链接:https://market.aliyun.com/products/57124001/cmapi024968.html

  1. from rpa.core import *
  2. from rpa.utils import *
  3. import ocr
  4. import rpa
  5. # 识别pdf文件,只读第2,3页的表格
  6. #app_code 替换自己的
  7. file_path = r'C:\code\codestore-offline-client-solution\ConsoleApplication1\bin\Release\0809.pdf'
  8. tables = ocr.table(file_path,pdf_page_index='2,3',app_code='自己的app_code')
  9. print(len(tables))
  10. print(tables)
  11. #识别某张图片
  12. file_path = r'C:\Users\zhuxia\AppData\Local\Temp\file-2.png'
  13. tables = ocr.table(file_path,app_code='自己的app_code')
  14. print(len(tables))
  15. print(tables)