AIに丸投げしない領収書チェックという考え方
AIに丸投げしない領収書チェックという考え方 実行時は軽く、判定は説明可能に。ブラウザ内処理とルールベース判定で帳票確認を組み立てる。 --- 領収書やレシートのチェックというと、画像をAIに渡して、文字認識、帳票種別判定、金額抽出、必須項目チェックまでを一括で任せる構成を思い浮かべるかもしれません。 もちろん、その...
AIに丸投げしない領収書チェックという考え方 実行時は軽く、判定は説明可能に。ブラウザ内処理とルールベース判定で帳票確認を組み立てる。 --- 領収書やレシートのチェックというと、画像をAIに渡して、文字認識、帳票種別判定、金額抽出、必須項目チェックまでを一括で任せる構成を思い浮かべるかもしれません。 もちろん、その方法は強力です。複雑な画像や未知のレイアウトにも対応しやすく、自然言語で結果を返せるという利点があります。 一方で、領収書チェックのように、日付、金額、消費税、宛名、発行元、取引内容、登録番号など、見るべき項目がある程度決まっている領域では、すべてを毎回AI推論に任せる必要がない場面もあります。 今回の領収書チェッカーは、そこに着目した実験です。 画像から文字を読み取り、その後の判定はブラウザ内のロジックで行う。 この考え方により、実行時の外部AI APIコストを抑えつつ、判定根拠を説明しやすい仕組みを目指しています。 --- この機能で試していること この機能の狙いは、「AIを使わない」ことではありません。 むしろ、AIの使いどころを変えるという考え方です。 使いどころ 役割 特徴 --- --- --- 開発時のAI 判定条件、正規表現、例外処理、分類ルールの設計支援 複雑なロジックを作りやすい 実行時の文字認識 画像内の文字を抽出 ブラウザ内で処理できる 実行時のルール 帳票分類、必須項目チェック、候補抽出 高速、低コスト、再現性が高い つまり、AIを「毎回の判定者」として使うのではなく、判定ロジックを作るための設計支援者として活用します。 実行時には、あらかじめ設計したロジックが、文字列、位置関係、帳票ごとの特徴を使って判定します。 --- なぜルールベースにするのか 領収書チェックでは、必ずしも「毎回賢く推論する」ことだけが正解ではありません。 業務で使う場合は、次のような観点も重要になります。 観点 重要な理由 --- --- 速度 画像を選んだあと、すぐに結果を確認したい コスト 毎回外部AI APIを呼ぶと、利用量に応じたコストが発生する...