您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. ParallelOCR:使用Poppler和Tesseract的文档的多处理Python OCR实现-源码

  2. 并行OCR 使用Poppler和Tesseract的pdf文本提取的Python OCR实现 特征: 同时支持文本可读和非文本可读(扫描)的文档 通过三种不同的性能配置文件实现多处理,以优化执行速度 基本文字清理 以.docx或.csv格式导出数据 要求: 如果在Windows上运行(没有Docker),请从下载Poppler并将/ bin文件夹添加到PATH(对于pdftoppm来说是必需的) 如果在Windows上运行(没有Docker),请从下载Tesseract,并将根文件夹添加
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:296960
    • 提供者:weixin_42124497