chineseocr_lite 搭建轻量 Web 端中文 OCR

最主要的一点,识别效果还有待改进

另外不适用于用户使用,因为界面比较青春,可以自行魔改

环境

  • Ubuntu 18.04
  • python3.6
    • 需要 python3 以上版本

参考

步骤

官方 Readme 中依赖给的不太详细,可能是因为大部分都是上游(chineseocr 与 psenet)的依赖,坑都集中在这里

  1. 安装依赖
    • apt 包管理安装 libsm6 和 libxrender1
      sudo apt install libsm6 libxrender1
    • pip3 安装 numpy, torch, web.py, Pillow, torchvision, opencv-python, scipy
      pip3 install numpy torch web.py Pillow torchvision opencv-python scipy

      因为 numpy、torch、Pillow 这三个包是另外三个的依赖包,所以可以尝试直接安装(未经验证)

      pip3 install web.py torchvision opencv-python
  2. 克隆项目
    • git clone https://github.com/ouyanghuiyu/chineseocr_lite.git
  3. 进入项目目录,编译 PSENET
    • 执行指令
      cd cd psenet/pse
      make

      时间不长

  4. 返回项目主目录,运行 OCR
    python3 app.py [your port]

    访问 [IP]:[Your Port] 查看效果

效果

识别耗时取决于计算机硬件,下图效果并不是项目本身的问题

新浪主页的截图

试了下官方图片还行

发表评论

电子邮件地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据