ドキュメント
CLI/extract

renamed extract

ドキュメントから構造化データを抽出します。請求書、領収書、契約書を経理や自動化のためにJSONまたはCSVに変換します。

renamed extract <file|directory> [options]

extractコマンドはAIを使用してドキュメントを解析し、日付、金額、取引先名、明細項目などの主要フィールドを抽出します。API用にJSON、スプレッドシート用にCSVで出力できます。

使用例

請求書データをJSONに抽出:

$ renamed extract invoice.pdf --output json

一括抽出して単一CSVに出力:

$ renamed extract ./invoices/*.pdf --output csv --merge --file invoices.csv

特定のドキュメントスキーマを使用:

$ renamed extract receipt.pdf --schema receipt

オプション

-o, --output <format>

出力形式: json、table。デフォルト: json。

-s, --schema <type>

組み込みスキーマ: invoice、receipt、contract、resume。

-f, --schema-file <path>

フィールド定義用のカスタムJSONスキーマファイルのパス。

-p, --parser-id <id>

Webダッシュボードで保存したパーサープロファイルを使用。

-i, --instructions <text>

抽出用のカスタムAI指示。

--merge

すべての抽出データを単一の出力ファイルにまとめます。

--pretty

JSON出力をインデント付きで整形します。

組み込みスキーマ

invoice 取引先、請求書番号、日付、金額、明細項目、税金

receipt 店舗、日付、合計、支払方法、商品

contract 当事者、発効日、終了日、条件

resume 氏名、連絡先、スキル、経験、学歴

カスタムスキーマ

JSONスキーマファイルで独自のフィールドを定義:

custom-schema.json
{
 "fields": {
 "projectName": "string",
 "budget": "currency",
 "deadline": "date",
 "approved": "boolean"
 }
}

フィールドタイプ: string, number, date, currency, boolean

出力例

請求書からのJSON出力:

{
 "vendor": "Acme Corp",
 "invoiceNumber": "INV-8847",
 "date": "2026-01-15",
 "amount": 2450.00,
 "currency": "USD",
 "lineItems": [
 {
 "description": "Consulting Services",
 "total": 2000.00
 }
 ]
}

関連項目