使用过程中遇到问题?想进一步提升效率?这篇文章整理了用户最常问的 10 个问题,以及几个实用的进阶技巧。
常见问题
Q1:OCR 识别要这么久,有什么办法加快?
识别慢是正常的,30 张图片首次约需 20~30 分钟。但有几点可以缓解:
- 图片拍清楚:模糊图片需要多次重试,拍清楚的图首次识别就能成功
- 第二次起极快:识别结果按图片内容缓存,只要图片没变,重跑瞬间完成
- OCR 缓存不会消失:即便你删除了 Word/Excel 产出文件,缓存仍然保留,重新生成不需要重新识别
💡 技巧:每批申报结束后不要清空缓存,下次遇到同一张图片时直接命中。
Q2:匹配结果出错了怎么办?
有三种方式修正:
方式一(推荐):网页歧义校准
- 访问系统的「校准」页面
- 对比候选凭证图片,点选正确的
- 系统记住选择,重跑后自动应用
方式二:直接编辑中间数据
- 下载
matched_data.json - 修改对应记录的字段值
- 重新上传,然后运行阶段一点五和阶段二
方式三:补充 manual_matches.json
- 在文件里指定「这张小票 → 对应这张发票」
- 重跑阶段一,系统优先采用手动指定的配对
Q3:提交政府后被驳回了,如何快速重新生成?
驳回不要慌,大多数情况只需要局部修改:
- 根据驳回原因找到对应字段
- 下载
matched_data.json,修改出错的字段 - 重新上传后,只需运行「阶段一点五」+「阶段二」(约 5 分钟)
- 重新下载文件提交
OCR 和匹配结果不需要重做,速度极快。
Q4:图片拍糊了,系统能识别吗?
系统会尽力识别,但模糊图片可能导致:
- 金额、订单号识别错误
- 匹配失败,被归入「歧义」处理
建议:重新拍清楚的图片,上传后重跑阶段一。 系统会自动更新缓存,使用新图片的识别结果。
Q5:同一天有多笔金额相同的交易,系统能区分吗?
能,这正是系统的核心能力之一。
系统会综合对比:
- 订单号(命中率最高,能精确区分)
- SN 码(商品序列号,命中即可确认)
- 交易时间(精确到分钟,不同时间的交易会区分)
如果以上条件都无法区分,才会进入歧义校准界面,由你手动确认。
Q6:能否多个门店共用一套系统?
可以,系统支持多用户账号,每个账号有独立的:
- 文件上传空间
- 处理记录(发票、小票、产出)
- 公司信息配置(印章、公司名、负责人)
不同门店登录不同账号,数据完全隔离,互不影响。
账号管理:系统管理员可以在「管理员」页面创建、管理用户账号。
Q7:如何更换公司印章?
在系统右上角点击「⚙ 设置」,进入「个人设置」页面:
- 找到「印章图片」区域
- 点击上传,或直接拖拽 PNG 格式的印章图片
- 保存后,下次生成的 Word 和 Excel 文件都会自动使用新印章
注意:印章图片建议使用透明底色的 PNG 文件,效果最好。
Q8:台账的列顺序或列名要改,怎么操作?
台账模板由 templates/ledger_new.xlsx 决定:
| 变更类型 | 操作方式 |
|---|---|
| 调整列顺序 | 直接在 Excel 里拖动列,保存上传 |
| 修改列名 | 在 Excel 里改列头文字,同时在系统配置里添加别名映射 |
| 新增列 | Excel 里加列头 + 在系统代码里添加对应字段 |
| 修改默认区县/地址 | 在「个人设置」页面直接修改,无需改代码 |
Q9:数据安全吗?客户信息会泄露吗?
系统完全部署在你自己的服务器上,数据不会上传到任何第三方。
具体保障:
- 原始文件(发票、小票)程序只读,不会修改或删除
- 所有产出文件存在服务器本地,只有登录用户可以下载
- 用户密码经过加密存储,不保存明文
Q10:能同时处理多少笔交易?
理论上没有上限,实际取决于服务器配置。
| 批量大小 | OCR 时间估算 | 建议 |
|---|---|---|
| 10~30 笔 | 10~20 分钟 | 最流畅,推荐单次批量 |
| 30~100 笔 | 30~60 分钟 | 完全支持,耐心等待 |
| 100 笔以上 | 1~2 小时 | 建议分批处理,每批 50 笔 |
记住:第二次运行时 OCR 已缓存,速度与批量大小无关。
Q11:如何恢复历史批次中的数据?
假设你上个月处理过一批申报,现在需要重新查看或修改那批数据。不用担心数据丢失——
恢复步骤:
- 首页点击「📂 历史批次」展开列表
- 找到目标批次(显示为
批次_YYYYMMDD_HHMMSS的格式) - 点击「恢复」按钮,该批次的所有文件被复制回工作区
- 当前工作区的数据会被覆盖,但你可以在恢复前【手动备份当前工作区】
恢复后可以做什么:
- 查看或重新下载产出文件(.docx / .xlsx 等)
- 修改
matched_data.json中的任何字段 - 重新运行阶段一点五 + 二,快速更新产出文件
- OCR 缓存依然有效,无需重新识别,极快
保险做法:
- 恢复前,先点击「📤 清空原始文件」清理当前工作区
- 然后恢复历史批次
- 或者直接点击「下载」按钮,将历史批次下载为 ZIP 到本地电脑,手工管理
💡 提示:系统会自动保留 OCR 缓存,即便删除或恢复了工作区,下次遇到相同图片时仍会秒级命中,无需重新识别。
进阶用法
技巧一:一次性配置,永久生效
在「个人设置」里配置好以下信息后,之后每次生成都自动填入,无需重复操作:
- 填报单位名称(公司全称)
- 负责人姓名和手机号
- 台账填报人姓名和手机号
- 默认区县
- 常用收货地址
- 公司印章图片
技巧二:工作区清理的 7 个选项详解
「工作区清理」面板提供 7 个独立操作,让你精确控制工作区状态:
| 选项 | 图标 | 清理内容 | 保留内容 | 适用场景 | 重跑需要 |
|---|---|---|---|---|---|
| 📦 归档当前批次 | 绿色 | 原始文件 + 产出 | OCR 缓存 | 完整批次完成,准备新批次 | 无 |
| 🗂️ 清理产出文件 | 灰色 | .docx / .xlsx / PDF | matched_data | 仅重跑阶段二(格式或数据改了) | 阶段二 |
| 🔄 重置匹配结果 | 灰色 | matched_data.json | manual_matches | 重跑阶段一(校准保留) | 阶段一 → 一点五 → 二 |
| 🧹 清除歧义校准 | 灰色 | manual_matches.json | 所有数据 | 推翻校准从头再来 | 阶段一 → 一点五 → 二 |
| ⚠️ 重置工作区 | 红色 | 以上三项全清 | OCR 缓存 | 全流程重跑(用以前的图片) | 阶段一 → 一点五 → 二 |
| 📤 清空原始文件 | 灰色 | input/ 中全部文件 | 匹配数据 / 校准 / 产出 | 释放存储空间(保留结果) | 无 |
| 🗃️ 清除 OCR 缓存 | 黄色 | 缓存文件 | 所有数据 | 强制重新识别(图片内容改了) | 阶段一 |
使用建议:
新增/替换了图片?
→ 清理产出文件 → 阶段一 → 一点五 → 二
只改了数据字段?
→ 不用清理,直接重跑一点五 → 二
确信数据没问题,只是改了格式?
→ 清理产出文件 → 阶段二
推翻之前的校准从头再来?
→ 清除歧义校准 → 阶段一 → 一点五 → 二
图片内容完全没变,想快速重跑?
→ 不清理缓存,直接阶段一 → 一点五 → 二
想彻底清空重来,又想保留 OCR 速度?
→ 重置工作区
技巧三:只重跑需要改的部分
学会按需重跑,节省大量等待时间:
改了图片? → 清理产出文件 → 阶段一 → 一点五 → 二
改了数据字段? → 重跑一点五 → 二
改了模板格式? → 清理产出文件 → 阶段二
合理使用「工作区清理」面板,可以把重跑时间从 30+ 分钟降低到几分钟。
技巧四:出问题时的诊断方法
问题:某笔交易匹配失败
- 查看日志里对应组的提示信息
- 检查小票图片是否清晰,订单号是否可识别
- 确认发票备注里是否包含订单号
问题:某行台账数据不对
- 下载
matched_data.json查看原始数据 - 找到对应的
seq(序号)字段 - 检查
invoice_data(发票数据)和merged_data(小票/凭证数据)是否正确
问题:生成的文件打不开
- 确认文件下载完整(查看文件大小,不应为 0 KB)
- 检查是否有「文件被占用」的提示(关闭其他打开该文件的程序)
- 查看系统日志最后几行,是否有错误信息
技巧五:备份重要的中间文件
建议在每次申报完成后,备份以下两个文件:
| 文件 | 作用 |
|---|---|
matched_data.json | 所有匹配数据,可用于重新生成 |
manual_matches.json | 手动校准记录,下次遇到相同情况无需再校准 |
把这两个文件下载到本地电脑,妥善保存,是最简单有效的备份方式。
技巧六:新一批申报时的最优流程
每个月或每个批次开始新的申报时,建议的操作顺序:
- 上传新一批发票和图片
- 按顺序运行三个阶段(一、一点五、二)
- 申报完成后,点击「📦 归档当前批次」(绿色大按钮)
- 系统自动备份 + 清理工作区,准备下一批
这样可以保证每批数据干净独立,且所有历史数据都被妥善保存在「📂 历史批次」,永不丢失。
💡 好处:OCR 缓存保留,后续批次遇到相同图片时秒级命中,加速处理。
技巧七:多用户与管理员代操作(适用于多人团队)
如果你的企业有多个员工需要使用这套系统:
管理员操作:
- 登录管理员账号
- 点击右上角 🛠 用户管理
- 在「用户管理」标签页新增员工账号(用户名、密码、角色)
- 每个员工使用各自账号登录,有独立的工作区和历史数据,互不干扰
代操作(处理紧急情况):
- 管理员登录后,右上角有「用户切换」下拉框
- 选择要代操作的员工账号
- 页面顶部出现黄色警告条:「⚠ 当前操作用户:{员工名}」
- 之后的所有操作(上传、处理、下载)都针对该员工的工作区
- 点击「返回自身」即可切换回管理员账号
适用场景:
- 员工出差无法操作,管理员代为处理
- 需要审核员工的处理结果
- 集中管理多家门店的数据
总结
| 遇到的情况 | 解决方法 |
|---|---|
| OCR 慢 | 正常现象,第二次起极快;保持图片清晰 |
| 匹配出错 | 歧义校准页面点选确认,或直接编辑中间数据 |
| 政府驳回 | 修改数据后只重跑阶段一点五+二,5 分钟搞定 |
| 图片模糊 | 重拍上传,系统自动更新 |
| 换印章 | 「个人设置」页面上传新印章 |
| 改台账格式 | 修改模板 Excel + 只重跑阶段二 |
| 多门店共用 | 创建多用户账号,数据隔离 |
| 历史数据恢复 | 「历史批次」面板点击恢复,或下载备份 |
| 员工紧急代操作 | 管理员用户切换下拉框代操作 |
有其他问题欢迎留言,我们会持续更新本文。