常见问题解答 + 进阶用法:让申报效率再上一个台阶

使用过程中遇到问题?想进一步提升效率?这篇文章整理了用户最常问的 10 个问题,以及几个实用的进阶技巧。

常见问题

Q1:OCR 识别要这么久,有什么办法加快?

识别慢是正常的,30 张图片首次约需 20~30 分钟。但有几点可以缓解:

  1. 图片拍清楚:模糊图片需要多次重试,拍清楚的图首次识别就能成功
  2. 第二次起极快:识别结果按图片内容缓存,只要图片没变,重跑瞬间完成
  3. OCR 缓存不会消失:即便你删除了 Word/Excel 产出文件,缓存仍然保留,重新生成不需要重新识别

💡 技巧:每批申报结束后不要清空缓存,下次遇到同一张图片时直接命中。

Q2:匹配结果出错了怎么办?

有三种方式修正:

方式一(推荐):网页歧义校准

  • 访问系统的「校准」页面
  • 对比候选凭证图片,点选正确的
  • 系统记住选择,重跑后自动应用

方式二:直接编辑中间数据

  • 下载 matched_data.json
  • 修改对应记录的字段值
  • 重新上传,然后运行阶段一点五和阶段二

方式三:补充 manual_matches.json

  • 在文件里指定「这张小票 → 对应这张发票」
  • 重跑阶段一,系统优先采用手动指定的配对

Q3:提交政府后被驳回了,如何快速重新生成?

驳回不要慌,大多数情况只需要局部修改:

  1. 根据驳回原因找到对应字段
  2. 下载 matched_data.json,修改出错的字段
  3. 重新上传后,只需运行「阶段一点五」+「阶段二」(约 5 分钟)
  4. 重新下载文件提交

OCR 和匹配结果不需要重做,速度极快。

Q4:图片拍糊了,系统能识别吗?

系统会尽力识别,但模糊图片可能导致:

  • 金额、订单号识别错误
  • 匹配失败,被归入「歧义」处理

建议:重新拍清楚的图片,上传后重跑阶段一。 系统会自动更新缓存,使用新图片的识别结果。

Q5:同一天有多笔金额相同的交易,系统能区分吗?

能,这正是系统的核心能力之一。

系统会综合对比:

  • 订单号(命中率最高,能精确区分)
  • SN 码(商品序列号,命中即可确认)
  • 交易时间(精确到分钟,不同时间的交易会区分)

如果以上条件都无法区分,才会进入歧义校准界面,由你手动确认。

Q6:能否多个门店共用一套系统?

可以,系统支持多用户账号,每个账号有独立的:

  • 文件上传空间
  • 处理记录(发票、小票、产出)
  • 公司信息配置(印章、公司名、负责人)

不同门店登录不同账号,数据完全隔离,互不影响。

账号管理:系统管理员可以在「管理员」页面创建、管理用户账号。

Q7:如何更换公司印章?

在系统右上角点击「⚙ 设置」,进入「个人设置」页面:

  1. 找到「印章图片」区域
  2. 点击上传,或直接拖拽 PNG 格式的印章图片
  3. 保存后,下次生成的 Word 和 Excel 文件都会自动使用新印章

注意:印章图片建议使用透明底色的 PNG 文件,效果最好。

Q8:台账的列顺序或列名要改,怎么操作?

台账模板由 templates/ledger_new.xlsx 决定:

变更类型操作方式
调整列顺序直接在 Excel 里拖动列,保存上传
修改列名在 Excel 里改列头文字,同时在系统配置里添加别名映射
新增列Excel 里加列头 + 在系统代码里添加对应字段
修改默认区县/地址在「个人设置」页面直接修改,无需改代码

Q9:数据安全吗?客户信息会泄露吗?

系统完全部署在你自己的服务器上,数据不会上传到任何第三方。

具体保障:

  • 原始文件(发票、小票)程序只读,不会修改或删除
  • 所有产出文件存在服务器本地,只有登录用户可以下载
  • 用户密码经过加密存储,不保存明文

Q10:能同时处理多少笔交易?

理论上没有上限,实际取决于服务器配置。

批量大小OCR 时间估算建议
10~30 笔10~20 分钟最流畅,推荐单次批量
30~100 笔30~60 分钟完全支持,耐心等待
100 笔以上1~2 小时建议分批处理,每批 50 笔

记住:第二次运行时 OCR 已缓存,速度与批量大小无关。

Q11:如何恢复历史批次中的数据?

假设你上个月处理过一批申报,现在需要重新查看或修改那批数据。不用担心数据丢失——

恢复步骤

  1. 首页点击「📂 历史批次」展开列表
  2. 找到目标批次(显示为 批次_YYYYMMDD_HHMMSS 的格式)
  3. 点击「恢复」按钮,该批次的所有文件被复制回工作区
  4. 当前工作区的数据会被覆盖,但你可以在恢复前【手动备份当前工作区】

恢复后可以做什么

  • 查看或重新下载产出文件(.docx / .xlsx 等)
  • 修改 matched_data.json 中的任何字段
  • 重新运行阶段一点五 + 二,快速更新产出文件
  • OCR 缓存依然有效,无需重新识别,极快

保险做法

  • 恢复前,先点击「📤 清空原始文件」清理当前工作区
  • 然后恢复历史批次
  • 或者直接点击「下载」按钮,将历史批次下载为 ZIP 到本地电脑,手工管理

💡 提示:系统会自动保留 OCR 缓存,即便删除或恢复了工作区,下次遇到相同图片时仍会秒级命中,无需重新识别。

进阶用法

技巧一:一次性配置,永久生效

在「个人设置」里配置好以下信息后,之后每次生成都自动填入,无需重复操作:

  • 填报单位名称(公司全称)
  • 负责人姓名和手机号
  • 台账填报人姓名和手机号
  • 默认区县
  • 常用收货地址
  • 公司印章图片

技巧二:工作区清理的 7 个选项详解

「工作区清理」面板提供 7 个独立操作,让你精确控制工作区状态:

选项图标清理内容保留内容适用场景重跑需要
📦 归档当前批次绿色原始文件 + 产出OCR 缓存完整批次完成,准备新批次
🗂️ 清理产出文件灰色.docx / .xlsx / PDFmatched_data仅重跑阶段二(格式或数据改了)阶段二
🔄 重置匹配结果灰色matched_data.jsonmanual_matches重跑阶段一(校准保留)阶段一 → 一点五 → 二
🧹 清除歧义校准灰色manual_matches.json所有数据推翻校准从头再来阶段一 → 一点五 → 二
⚠️ 重置工作区红色以上三项全清OCR 缓存全流程重跑(用以前的图片)阶段一 → 一点五 → 二
📤 清空原始文件灰色input/ 中全部文件匹配数据 / 校准 / 产出释放存储空间(保留结果)
🗃️ 清除 OCR 缓存黄色缓存文件所有数据强制重新识别(图片内容改了)阶段一

使用建议

新增/替换了图片?
  → 清理产出文件 → 阶段一 → 一点五 → 二

只改了数据字段?
  → 不用清理,直接重跑一点五 → 二

确信数据没问题,只是改了格式?
  → 清理产出文件 → 阶段二

推翻之前的校准从头再来?
  → 清除歧义校准 → 阶段一 → 一点五 → 二

图片内容完全没变,想快速重跑?
  → 不清理缓存,直接阶段一 → 一点五 → 二

想彻底清空重来,又想保留 OCR 速度?
  → 重置工作区

技巧三:只重跑需要改的部分

学会按需重跑,节省大量等待时间:

改了图片?       → 清理产出文件 → 阶段一 → 一点五 → 二
改了数据字段?   → 重跑一点五 → 二
改了模板格式?   → 清理产出文件 → 阶段二

合理使用「工作区清理」面板,可以把重跑时间从 30+ 分钟降低到几分钟。

技巧四:出问题时的诊断方法

问题:某笔交易匹配失败

  1. 查看日志里对应组的提示信息
  2. 检查小票图片是否清晰,订单号是否可识别
  3. 确认发票备注里是否包含订单号

问题:某行台账数据不对

  1. 下载 matched_data.json 查看原始数据
  2. 找到对应的 seq(序号)字段
  3. 检查 invoice_data(发票数据)和 merged_data(小票/凭证数据)是否正确

问题:生成的文件打不开

  1. 确认文件下载完整(查看文件大小,不应为 0 KB)
  2. 检查是否有「文件被占用」的提示(关闭其他打开该文件的程序)
  3. 查看系统日志最后几行,是否有错误信息

技巧五:备份重要的中间文件

建议在每次申报完成后,备份以下两个文件:

文件作用
matched_data.json所有匹配数据,可用于重新生成
manual_matches.json手动校准记录,下次遇到相同情况无需再校准

把这两个文件下载到本地电脑,妥善保存,是最简单有效的备份方式。

技巧六:新一批申报时的最优流程

每个月或每个批次开始新的申报时,建议的操作顺序:

  1. 上传新一批发票和图片
  2. 按顺序运行三个阶段(一、一点五、二)
  3. 申报完成后,点击「📦 归档当前批次」(绿色大按钮)
  4. 系统自动备份 + 清理工作区,准备下一批

这样可以保证每批数据干净独立,且所有历史数据都被妥善保存在「📂 历史批次」,永不丢失。

💡 好处:OCR 缓存保留,后续批次遇到相同图片时秒级命中,加速处理。

技巧七:多用户与管理员代操作(适用于多人团队)

如果你的企业有多个员工需要使用这套系统:

管理员操作

  1. 登录管理员账号
  2. 点击右上角 🛠 用户管理
  3. 在「用户管理」标签页新增员工账号(用户名、密码、角色)
  4. 每个员工使用各自账号登录,有独立的工作区和历史数据,互不干扰

代操作(处理紧急情况)

  1. 管理员登录后,右上角有「用户切换」下拉框
  2. 选择要代操作的员工账号
  3. 页面顶部出现黄色警告条:「⚠ 当前操作用户:{员工名}」
  4. 之后的所有操作(上传、处理、下载)都针对该员工的工作区
  5. 点击「返回自身」即可切换回管理员账号

适用场景

  • 员工出差无法操作,管理员代为处理
  • 需要审核员工的处理结果
  • 集中管理多家门店的数据

总结

遇到的情况解决方法
OCR 慢正常现象,第二次起极快;保持图片清晰
匹配出错歧义校准页面点选确认,或直接编辑中间数据
政府驳回修改数据后只重跑阶段一点五+二,5 分钟搞定
图片模糊重拍上传,系统自动更新
换印章「个人设置」页面上传新印章
改台账格式修改模板 Excel + 只重跑阶段二
多门店共用创建多用户账号,数据隔离
历史数据恢复「历史批次」面板点击恢复,或下载备份
员工紧急代操作管理员用户切换下拉框代操作

有其他问题欢迎留言,我们会持续更新本文。

作者: cavalier

能源行业从业者,业余爱好象棋、C++还有二胡、乒乓也很喜欢

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注