发票整理器(Invoice Organizer)

入门 Starter 工具型 Tool claude-code
9 min read · 439 lines

将混乱的发票和财务文档整理为可用于报税的归档系统

发票整理器(Invoice Organizer)

本技能将混乱的发票、收据和财务文档文件夹转变为整洁的、可用于报税的归档系统,无需手动操作。

适用场景

  • 准备报税季需要有序的记录
  • 管理多个供应商的业务支出
  • 整理从混乱文件夹或邮件下载中收集的收据
  • 设置自动化发票归档以持续记账
  • 按年份或类别归档财务记录
  • 核对报销费用
  • 为会计师准备文档

功能说明

1. 读取发票内容

从 PDF、图片和文档中提取信息:

  • 供应商/公司名称
  • 发票编号
  • 日期
  • 金额
  • 产品或服务描述
  • 支付方式

2. 统一重命名文件

创建标准化文件名:

  • 格式:YYYY-MM-DD 供应商 - Invoice - 产品或服务.pdf
  • 示例:2024-03-15 Adobe - Invoice - Creative Cloud.pdf

3. 按类别整理

按逻辑文件夹分类:

  • 按供应商
  • 按费用类别(软件、办公用品、差旅等)
  • 按时间段(年、季度、月)
  • 按税务类别(可抵扣、个人等)

4. 处理多种格式

支持:

  • PDF 发票
  • 扫描收据(JPG、PNG)
  • 邮件附件
  • 截图
  • 银行对账单

5. 保留原始文件

在整理副本的同时保留原始文件

使用方法

基本用法

导航到你的混乱发票文件夹:

cd ~/Desktop/receipts-to-sort

然后请求 Claude Code:

Organize these invoices for taxes
(整理这些发票用于报税)

或更具体地:

Read all invoices in this folder, rename them to
"YYYY-MM-DD Vendor - Invoice - Product.pdf" format,
and organize them by vendor
(读取此文件夹中所有发票,重命名为标准格式,并按供应商整理)

高级整理

Organize these invoices:
1. Extract date, vendor, and description from each file
2. Rename to standard format
3. Sort into folders by expense category (Software, Office, Travel, etc.)
4. Create a CSV spreadsheet with all invoice details for my accountant
(整理发票:提取信息、重命名、按类别分类、创建 CSV 汇总表)

详细指引

当用户请求发票整理时:

1. 扫描文件夹

识别所有发票文件:

# 查找所有发票相关文件
find . -type f \( -name "*.pdf" -o -name "*.jpg" -o -name "*.png" \) -print

报告发现:

  • 文件总数
  • 文件类型
  • 日期范围(如果可从文件名辨别)
  • 当前的组织状态(或缺乏组织)

2. 从每个文件中提取信息

PDF 发票

  • 使用文本提取读取发票内容
  • 查找常见模式:
    • "Invoice Date:"、"Date:"、"Issued:"
    • "Invoice #:"、"Invoice Number:"
    • 公司名称(通常在顶部)
    • "Amount Due:"、"Total:"、"Amount:"
    • "Description:"、"Service:"、"Product:"

图片收据

  • 从图片读取可见文字
  • 识别供应商名称(通常在顶部)
  • 查找日期(常见格式)
  • 找到总金额

不清晰的文件的备选方案

  • 使用文件名线索
  • 检查文件创建/修改日期
  • 标记为手动审查(如果关键信息缺失)

3. 确定整理策略

如果用户未指定,询问偏好:

我找到了 [X] 张发票,日期范围 [起止日期]。

你希望如何整理?

1. **按供应商**(Adobe/、Amazon/、Stripe/ 等)
2. **按类别**(Software/、Office Supplies/、Travel/ 等)
3. **按日期**(2024/Q1/、2024/Q2/ 等)
4. **按税务类别**(Deductible/、Personal/ 等)
5. **自定义**(描述你的结构)

或者我可以使用默认结构:年份/类别/供应商

4. 创建标准化文件名

为每张发票创建遵循此模式的文件名:

YYYY-MM-DD Vendor - Invoice - Description.ext

示例:

  • 2024-03-15 Adobe - Invoice - Creative Cloud.pdf
  • 2024-01-10 Amazon - Receipt - Office Supplies.pdf
  • 2023-12-01 Stripe - Invoice - Monthly Payment Processing.pdf

文件命名最佳实践

  • 移除特殊字符(连字符除外)
  • 正确大写供应商名称
  • 保持描述简洁但有意义
  • 使用一致的日期格式(YYYY-MM-DD)以便排序
  • 保留原始文件扩展名

5. 执行整理

移动文件前展示计划:

# 整理计划

## 建议结构
Invoices/
├── 2023/
│   ├── Software/
│   │   ├── Adobe/
│   │   └── Microsoft/
│   ├── Services/
│   └── Office/
└── 2024/
    ├── Software/
    ├── Services/
    └── Office/

## 示例更改

之前:`invoice_adobe_march.pdf`
之后:`2024-03-15 Adobe - Invoice - Creative Cloud.pdf`
位置:`Invoices/2024/Software/Adobe/`

之前:`IMG_2847.jpg`
之后:`2024-02-10 Staples - Receipt - Office Supplies.jpg`
位置:`Invoices/2024/Office/Staples/`

处理 [X] 个文件?(yes/no)

批准后:

# 创建文件夹结构
mkdir -p "Invoices/2024/Software/Adobe"

# 复制(不移动)以保留原始文件
cp "original.pdf" "Invoices/2024/Software/Adobe/2024-03-15 Adobe - Invoice - Creative Cloud.pdf"

# 或者如果用户偏好移动
mv "original.pdf" "new/path/standardized-name.pdf"

6. 生成汇总报告

创建包含所有发票详情的 CSV 文件:

Date,Vendor,Invoice Number,Description,Amount,Category,File Path
2024-03-15,Adobe,INV-12345,Creative Cloud,52.99,Software,Invoices/2024/Software/Adobe/...
2024-03-10,Amazon,123-4567890-1234567,Office Supplies,127.45,Office,Invoices/2024/Office/Amazon/...

此 CSV 可用于:

  • 导入会计软件
  • 分享给会计师
  • 费用追踪和报告
  • 报税准备

7. 提供完成摘要

# 整理完成!

## 摘要
- **已处理**:[X] 张发票
- **日期范围**:[最早] 至 [最晚]
- **总金额**:$[总和](如果提取了金额)
- **供应商**:[Y] 个不同供应商

## 新结构
Invoices/
├── 2024/(45 个文件)
│   ├── Software/(23 个文件)
│   ├── Services/(12 个文件)
│   └── Office/(10 个文件)
└── 2023/(12 个文件)

## 已创建的文件
- `/Invoices/` - 已整理的发票
- `/Invoices/invoice-summary.csv` - 会计用电子表格
- `/Invoices/originals/` - 原始文件(如果是复制的)

## 需要审查的文件
[列出无法完整提取信息的文件]

## 下一步
1. 审查 `invoice-summary.csv` 文件
2. 检查"Needs Review(需要审查)"文件夹中的文件
3. 将 CSV 导入你的会计软件
4. 为未来发票设置自动整理

示例

示例 1:报税准备(灵感来源:Martin Merschroth)

用户:"我有一个混乱的发票文件夹用于报税。帮我分类并正确重命名。"

过程

  1. 扫描文件夹:发现 147 个 PDF 和图片
  2. 读取每张发票提取:日期、供应商名称、发票编号、产品/服务描述
  3. 全部重命名为:YYYY-MM-DD Vendor - Invoice - Product.pdf
  4. 整理到:2024/Software/2024/Travel/
  5. 创建 invoice-summary.csv 给会计师
  6. 结果:几分钟内完成税务就绪的发票整理

示例 2:月度费用核对

用户:"按类别整理我上个月的业务收据。"

输出

# 2024 年 3 月收据已整理

## 按类别
- 软件与工具:$847.32(12 张发票)
- 办公用品:$234.18(8 张收据)
- 差旅与餐饮:$1,456.90(15 张收据)
- 专业服务:$2,500.00(3 张发票)

合计:$5,038.40

所有收据已重命名并归档至:
`Business-Receipts/2024/03-March/[Category]/`

CSV 导出:`march-2024-expenses.csv`

示例 3:多年归档

用户:"我有 3 年的随机发票。按年份再按供应商整理。"

输出 —— 创建如下结构:

Invoices/
├── 2022/
│   ├── Adobe/
│   ├── Amazon/
│   └── ...
├── 2023/
│   ├── Adobe/
│   ├── Amazon/
│   └── ...
└── 2024/
    ├── Adobe/
    ├── Amazon/
    └── ...

每个文件都正确重命名,包含日期和描述。

示例 4:邮件下载清理

用户:"我从 Gmail 下载发票。它们都叫 'invoice.pdf'、'invoice(1).pdf' 等。解决这个混乱。"

输出

找到 89 个文件,全部名为 "invoice*.pdf"

读取每个文件以提取真实信息...

重命名示例:
- invoice.pdf → 2024-03-15 Shopify - Invoice - Monthly Subscription.pdf
- invoice(1).pdf → 2024-03-14 Google - Invoice - Workspace.pdf
- invoice(2).pdf → 2024-03-10 Netlify - Invoice - Pro Plan.pdf

所有文件已重命名并按供应商整理。

常见整理模式

按供应商(简单)

Invoices/
├── Adobe/
├── Amazon/
├── Google/
└── Microsoft/

按年份和类别(适合报税)

Invoices/
├── 2023/
│   ├── Software/
│   ├── Hardware/
│   ├── Services/
│   └── Travel/
└── 2024/
    └── ...

按季度(详细追踪)

Invoices/
├── 2024/
│   ├── Q1/
│   │   ├── Software/
│   │   ├── Office/
│   │   └── Travel/
│   └── Q2/
│       └── ...

按税务类别(会计师友好)

Invoices/
├── Deductible/(可抵扣)
│   ├── Software/
│   ├── Office/
│   └── Professional-Services/
├── Partially-Deductible/(部分可抵扣)
│   └── Meals-Travel/
└── Personal/(个人)

自动化设置

持续整理方案:

Create a script that watches my ~/Downloads/invoices folder
and auto-organizes any new invoice files using our standard
naming and folder structure.
(创建一个监视 Downloads/invoices 文件夹的脚本,自动整理新发票文件)

这创建了一个在发票到达时自动整理的持久方案。

专业技巧

  1. 邮件发票扫描为 PDF:先用 Preview 或类似工具将邮件发票保存为 PDF
  2. 统一下载位置:将所有发票保存到一个文件夹便于批量处理
  3. 月度例行整理:每月整理发票,而非每年一次
  4. 备份原始文件:重新整理前保留原始文件
  5. 在 CSV 中包含金额:有助于预算追踪
  6. 标记可抵扣性:标注哪些费用可抵税
  7. 保留收据 7 年:标准审计周期

处理特殊情况

信息缺失

如果无法提取日期/供应商:

  • 标记文件用于手动审查
  • 使用文件修改日期作为备选
  • 创建 "Needs-Review/" 文件夹

重复发票

如果同一发票出现多次:

  • 比较文件哈希
  • 保留最高质量的版本
  • 在汇总中注明重复

多页发票

对于分散在多个文件中的发票:

  • 如需要合并 PDF
  • 对各部分使用一致的命名
  • 如果发票被拆分,在 CSV 中注明

非标准格式

对于不常见的收据格式:

  • 提取可能的信息
  • 尽可能标准化
  • 如果关键信息缺失则标记审查

相关用例

  • 创建报销费用报告
  • 整理银行对账单
  • 管理供应商合同
  • 归档旧财务记录
  • 为审计做准备
  • 追踪长期订阅费用

相关技能 Related Skills