pdftoolbox是一个简单的在线pdf工具箱,基于GhostScript进行开发,目前支持PDF压缩以及PDF文字提取(OCR)。PDF文字提取目前支持的语言有英文、简体中文、繁体中文、日文、韩文。
简单试用了下,发现还挺有趣,这篇文章还是利用宝塔面板来搭建这个工具,宝塔服务器面板,一键全能部署及管理,送你3188元礼包,点我领取https://www.bt.cn/?invite_code=MV9ub2NxdmI=
项目:https://github.com/lixiaofei123/pdftoolbox
演示:https://halo.vsvs.xyz/(保留一天)
1)准备一台vps,测试教程搭建于ionvps(https://www.daniao.org/tag/ion/)
至于其他的东西根据自己需求来安装吧!
1)新建站点,宝塔如何新建站点,略过,
2)新建站点后,顺手把ssl也申请好吧。宝塔如何申请免费是ssl,也略过!

mkdir-p/data/pdftoolbox/input
mkdir-p/data/pdftoolbox/output
dockerrun-d--namepdftoolbox--restart=always-p8082:8082-v/data/pdftoolbox/input:/opt/pdftoolbox/input-v/data/pdftoolbox/output:/opt/pdftoolbox/outputmrlee326/pdftoolbox
注意,默认用的8082端口,如果有冲突,可以自行修改为其他端口,如果搭建好不能访问,请在安全重放行这个端口。
4)启动成功后,在浏览器中访问http://服务器ip:8082,即可看到前端界面。
1)如何用域名访问,看图:
2)效果,浏览器,访问你的域名,即可看到如下效果。
1)选择上方的【pdf压缩】,然后点击【点击此处上传】按钮,选择要转换的文件,即可上传并压缩。目前支持三种压缩质量。高质量(300dpi)/中质量(150dpi)/低质量(72dpi)!!!
2)选择上方的【pdf压缩】,然后点击【点击此处上传】按钮,选择要转换的文件,即可上传并进行OCR文字提取。目前导出格式为txt。此过程会比较慢,请耐心等待。等待完毕后即可下载。
整个使用下来,体验还不错,如果你有一些pdf需要处理,可以试试这个项目。
本文来源:vps主机--宝塔面板安装fileinfo扩展
本文地址:https://www.idcbaba.com/vps/4181.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 1919100645@qq.com 举报,一经查实,本站将立刻删除。



