全部产品
云市场

第十五课:OCR的使用方法

更新时间:2019-09-18 15:39:08

一、场景介绍

本章节SDK业务场景主要面向文字识别/图像文字识别、发票识别及身份证识别

二、新建应用

业务场景:识别网络图片并把图片中文字写入到excel中
视频案例:

demo_0001.mov (8.35MB)源码分享:

  1. import ocr
  2. def start():
  3. #打开一个excel文件
  4. xls = rpa.excel.open(file = r'\\Mac\Home\Desktop\test.xlsx',visible = True)
  5. sheet = xls.get_sheet()
  6. #序列号
  7. sheet.set_col_width(col = 'A',width = '6')
  8. #写入A1 字段为序列号
  9. sheet.write(range = 'A1',value = '序列号')
  10. #写入B1 字段为识别内容
  11. sheet.write(range = 'B1',value = '识别内容')
  12. #设置列宽度
  13. sheet.set_col_width(col = 'B',width = '65')
  14. count = 1
  15. for i in range(1,4):
  16. #本地图片 动态变化
  17. image_path = r'\\Mac\Home\Desktop\批量识别网络图片\网络图片00'+str(i)+'.jpg'
  18. #app_code 填写自己在阿里云注册的号
  19. text = ocr.text(image_path,app_code='dac58aa17a6142549152c56ee9f1a68f')
  20. sheet.write(range = 'A'+str(count),value = str(i))
  21. sheet.write(range = 'B'+str(count),value = text)
  22. count+=1
  23. rpa.logger.info(text)
  24. xls.save()


三、代码编写

1、text 文字/图片文字识别

阿里云ocr

  1. import ocr
  2. def start():
  3. #图片支持本地或网络图片
  4. image_path = ''
  5. #app_code 填写自己在阿里云注册的号
  6. text = ocr.text(image_path,app_code='xxxxxxxxxxxxxxxxxxxxxx')
  7. rpa.logger.info(text)

有关app_code:

  1. 如何购买
  2. ocr够买链接如下:https://market.aliyun.com/products/57124001/cmapi023866.html
  3. 如何查看
  1. import ocr
  2. def start():
  3. #图片支持本地或网络图片
  4. image_path = ''
  5. #google开源ocr
  6. text = ocr.text(image_path,'google')
  7. rpa.logger.info(text)

2、invoice发票识别

  1. import ocr
  2. def start():
  3. #本地或网络发票图片路径
  4. #app_code替换成自己的
  5. file_path = r"xxxxxxx"
  6. result = ocr.invoice(file_path,app_code='xxxxxxxxxx')
  7. #rpa.logger.info(result)
  8. rpa.logger.info(result["受票方名称"])
  9. rpa.logger.info(result["发票税额"])
  10. rpa.logger.info(result["开票日期"])
  11. rpa.logger.info(result["发票代码"])

发票识别,识别结果包括的信息:
发票代码,发票号码,开票日期,校验码,发票金额,发票税额,不含税金额,受票方名称,
受票方税号,受票方地址、电话,受票方开户行、账号,销售方名称,销售方税号,销售方地址、电话,销售方开户行、账号

发票app_code购买链接:https://market.aliyun.com/products/57124001/cmapi027758.html

#