发票整理器(Invoice Organizer)
本技能将混乱的发票、收据和财务文档文件夹转变为整洁的、可用于报税的归档系统,无需手动操作。
适用场景
- 准备报税季需要有序的记录
- 管理多个供应商的业务支出
- 整理从混乱文件夹或邮件下载中收集的收据
- 设置自动化发票归档以持续记账
- 按年份或类别归档财务记录
- 核对报销费用
- 为会计师准备文档
功能说明
1. 读取发票内容
从 PDF、图片和文档中提取信息:
- 供应商/公司名称
- 发票编号
- 日期
- 金额
- 产品或服务描述
- 支付方式
2. 统一重命名文件
创建标准化文件名:
- 格式:
YYYY-MM-DD 供应商 - Invoice - 产品或服务.pdf - 示例:
2024-03-15 Adobe - Invoice - Creative Cloud.pdf
3. 按类别整理
按逻辑文件夹分类:
- 按供应商
- 按费用类别(软件、办公用品、差旅等)
- 按时间段(年、季度、月)
- 按税务类别(可抵扣、个人等)
4. 处理多种格式
支持:
- PDF 发票
- 扫描收据(JPG、PNG)
- 邮件附件
- 截图
- 银行对账单
5. 保留原始文件
在整理副本的同时保留原始文件
使用方法
基本用法
导航到你的混乱发票文件夹:
cd ~/Desktop/receipts-to-sort
然后请求 Claude Code:
Organize these invoices for taxes
(整理这些发票用于报税)
或更具体地:
Read all invoices in this folder, rename them to
"YYYY-MM-DD Vendor - Invoice - Product.pdf" format,
and organize them by vendor
(读取此文件夹中所有发票,重命名为标准格式,并按供应商整理)
高级整理
Organize these invoices:
1. Extract date, vendor, and description from each file
2. Rename to standard format
3. Sort into folders by expense category (Software, Office, Travel, etc.)
4. Create a CSV spreadsheet with all invoice details for my accountant
(整理发票:提取信息、重命名、按类别分类、创建 CSV 汇总表)
详细指引
当用户请求发票整理时:
1. 扫描文件夹
识别所有发票文件:
# 查找所有发票相关文件
find . -type f \( -name "*.pdf" -o -name "*.jpg" -o -name "*.png" \) -print
报告发现:
- 文件总数
- 文件类型
- 日期范围(如果可从文件名辨别)
- 当前的组织状态(或缺乏组织)
2. 从每个文件中提取信息
PDF 发票:
- 使用文本提取读取发票内容
- 查找常见模式:
- "Invoice Date:"、"Date:"、"Issued:"
- "Invoice #:"、"Invoice Number:"
- 公司名称(通常在顶部)
- "Amount Due:"、"Total:"、"Amount:"
- "Description:"、"Service:"、"Product:"
图片收据:
- 从图片读取可见文字
- 识别供应商名称(通常在顶部)
- 查找日期(常见格式)
- 找到总金额
不清晰的文件的备选方案:
- 使用文件名线索
- 检查文件创建/修改日期
- 标记为手动审查(如果关键信息缺失)
3. 确定整理策略
如果用户未指定,询问偏好:
我找到了 [X] 张发票,日期范围 [起止日期]。
你希望如何整理?
1. **按供应商**(Adobe/、Amazon/、Stripe/ 等)
2. **按类别**(Software/、Office Supplies/、Travel/ 等)
3. **按日期**(2024/Q1/、2024/Q2/ 等)
4. **按税务类别**(Deductible/、Personal/ 等)
5. **自定义**(描述你的结构)
或者我可以使用默认结构:年份/类别/供应商
4. 创建标准化文件名
为每张发票创建遵循此模式的文件名:
YYYY-MM-DD Vendor - Invoice - Description.ext
示例:
2024-03-15 Adobe - Invoice - Creative Cloud.pdf2024-01-10 Amazon - Receipt - Office Supplies.pdf2023-12-01 Stripe - Invoice - Monthly Payment Processing.pdf
文件命名最佳实践:
- 移除特殊字符(连字符除外)
- 正确大写供应商名称
- 保持描述简洁但有意义
- 使用一致的日期格式(YYYY-MM-DD)以便排序
- 保留原始文件扩展名
5. 执行整理
移动文件前展示计划:
# 整理计划
## 建议结构
Invoices/
├── 2023/
│ ├── Software/
│ │ ├── Adobe/
│ │ └── Microsoft/
│ ├── Services/
│ └── Office/
└── 2024/
├── Software/
├── Services/
└── Office/
## 示例更改
之前:`invoice_adobe_march.pdf`
之后:`2024-03-15 Adobe - Invoice - Creative Cloud.pdf`
位置:`Invoices/2024/Software/Adobe/`
之前:`IMG_2847.jpg`
之后:`2024-02-10 Staples - Receipt - Office Supplies.jpg`
位置:`Invoices/2024/Office/Staples/`
处理 [X] 个文件?(yes/no)
批准后:
# 创建文件夹结构
mkdir -p "Invoices/2024/Software/Adobe"
# 复制(不移动)以保留原始文件
cp "original.pdf" "Invoices/2024/Software/Adobe/2024-03-15 Adobe - Invoice - Creative Cloud.pdf"
# 或者如果用户偏好移动
mv "original.pdf" "new/path/standardized-name.pdf"
6. 生成汇总报告
创建包含所有发票详情的 CSV 文件:
Date,Vendor,Invoice Number,Description,Amount,Category,File Path
2024-03-15,Adobe,INV-12345,Creative Cloud,52.99,Software,Invoices/2024/Software/Adobe/...
2024-03-10,Amazon,123-4567890-1234567,Office Supplies,127.45,Office,Invoices/2024/Office/Amazon/...
此 CSV 可用于:
- 导入会计软件
- 分享给会计师
- 费用追踪和报告
- 报税准备
7. 提供完成摘要
# 整理完成!
## 摘要
- **已处理**:[X] 张发票
- **日期范围**:[最早] 至 [最晚]
- **总金额**:$[总和](如果提取了金额)
- **供应商**:[Y] 个不同供应商
## 新结构
Invoices/
├── 2024/(45 个文件)
│ ├── Software/(23 个文件)
│ ├── Services/(12 个文件)
│ └── Office/(10 个文件)
└── 2023/(12 个文件)
## 已创建的文件
- `/Invoices/` - 已整理的发票
- `/Invoices/invoice-summary.csv` - 会计用电子表格
- `/Invoices/originals/` - 原始文件(如果是复制的)
## 需要审查的文件
[列出无法完整提取信息的文件]
## 下一步
1. 审查 `invoice-summary.csv` 文件
2. 检查"Needs Review(需要审查)"文件夹中的文件
3. 将 CSV 导入你的会计软件
4. 为未来发票设置自动整理
示例
示例 1:报税准备(灵感来源:Martin Merschroth)
用户:"我有一个混乱的发票文件夹用于报税。帮我分类并正确重命名。"
过程:
- 扫描文件夹:发现 147 个 PDF 和图片
- 读取每张发票提取:日期、供应商名称、发票编号、产品/服务描述
- 全部重命名为:
YYYY-MM-DD Vendor - Invoice - Product.pdf - 整理到:
2024/Software/、2024/Travel/等 - 创建
invoice-summary.csv给会计师 - 结果:几分钟内完成税务就绪的发票整理
示例 2:月度费用核对
用户:"按类别整理我上个月的业务收据。"
输出:
# 2024 年 3 月收据已整理
## 按类别
- 软件与工具:$847.32(12 张发票)
- 办公用品:$234.18(8 张收据)
- 差旅与餐饮:$1,456.90(15 张收据)
- 专业服务:$2,500.00(3 张发票)
合计:$5,038.40
所有收据已重命名并归档至:
`Business-Receipts/2024/03-March/[Category]/`
CSV 导出:`march-2024-expenses.csv`
示例 3:多年归档
用户:"我有 3 年的随机发票。按年份再按供应商整理。"
输出 —— 创建如下结构:
Invoices/
├── 2022/
│ ├── Adobe/
│ ├── Amazon/
│ └── ...
├── 2023/
│ ├── Adobe/
│ ├── Amazon/
│ └── ...
└── 2024/
├── Adobe/
├── Amazon/
└── ...
每个文件都正确重命名,包含日期和描述。
示例 4:邮件下载清理
用户:"我从 Gmail 下载发票。它们都叫 'invoice.pdf'、'invoice(1).pdf' 等。解决这个混乱。"
输出:
找到 89 个文件,全部名为 "invoice*.pdf"
读取每个文件以提取真实信息...
重命名示例:
- invoice.pdf → 2024-03-15 Shopify - Invoice - Monthly Subscription.pdf
- invoice(1).pdf → 2024-03-14 Google - Invoice - Workspace.pdf
- invoice(2).pdf → 2024-03-10 Netlify - Invoice - Pro Plan.pdf
所有文件已重命名并按供应商整理。
常见整理模式
按供应商(简单)
Invoices/
├── Adobe/
├── Amazon/
├── Google/
└── Microsoft/
按年份和类别(适合报税)
Invoices/
├── 2023/
│ ├── Software/
│ ├── Hardware/
│ ├── Services/
│ └── Travel/
└── 2024/
└── ...
按季度(详细追踪)
Invoices/
├── 2024/
│ ├── Q1/
│ │ ├── Software/
│ │ ├── Office/
│ │ └── Travel/
│ └── Q2/
│ └── ...
按税务类别(会计师友好)
Invoices/
├── Deductible/(可抵扣)
│ ├── Software/
│ ├── Office/
│ └── Professional-Services/
├── Partially-Deductible/(部分可抵扣)
│ └── Meals-Travel/
└── Personal/(个人)
自动化设置
持续整理方案:
Create a script that watches my ~/Downloads/invoices folder
and auto-organizes any new invoice files using our standard
naming and folder structure.
(创建一个监视 Downloads/invoices 文件夹的脚本,自动整理新发票文件)
这创建了一个在发票到达时自动整理的持久方案。
专业技巧
- 邮件发票扫描为 PDF:先用 Preview 或类似工具将邮件发票保存为 PDF
- 统一下载位置:将所有发票保存到一个文件夹便于批量处理
- 月度例行整理:每月整理发票,而非每年一次
- 备份原始文件:重新整理前保留原始文件
- 在 CSV 中包含金额:有助于预算追踪
- 标记可抵扣性:标注哪些费用可抵税
- 保留收据 7 年:标准审计周期
处理特殊情况
信息缺失
如果无法提取日期/供应商:
- 标记文件用于手动审查
- 使用文件修改日期作为备选
- 创建 "Needs-Review/" 文件夹
重复发票
如果同一发票出现多次:
- 比较文件哈希
- 保留最高质量的版本
- 在汇总中注明重复
多页发票
对于分散在多个文件中的发票:
- 如需要合并 PDF
- 对各部分使用一致的命名
- 如果发票被拆分,在 CSV 中注明
非标准格式
对于不常见的收据格式:
- 提取可能的信息
- 尽可能标准化
- 如果关键信息缺失则标记审查
相关用例
- 创建报销费用报告
- 整理银行对账单
- 管理供应商合同
- 归档旧财务记录
- 为审计做准备
- 追踪长期订阅费用