ルールベースで領収書をどう判定しているのか
ルールベースで領収書をどう判定しているのか キーワードだけでは足りない。文字列、位置関係、帳票構造を組み合わせたルールベース判定の中身。 --- 領収書チェッカーでは、画像から読み取った文字をそのまま表示するだけではありません。 読み取った文字ブロックをもとに、まず帳票種別を判定し、領収書形式と判断できる場合は、発行...
ルールベースで領収書をどう判定しているのか キーワードだけでは足りない。文字列、位置関係、帳票構造を組み合わせたルールベース判定の中身。 --- 領収書チェッカーでは、画像から読み取った文字をそのまま表示するだけではありません。 読み取った文字ブロックをもとに、まず帳票種別を判定し、領収書形式と判断できる場合は、発行元、宛名、取引日、金額、消費税、取引内容、登録番号をチェックします。 私が最も伝えたいのは、 ## 「帳票判定をすべてAIに任せる」のではなく、AIとロジックを適材適所で使い分ける ということです。 従来、人の手だけで複雑なルールベースロジックを作り込むには、多くの時間と専門的な調整が必要でした。 しかし現在は、AIを活用することで、正規表現、判定条件、例外処理、スコアリング、分類ルール といった複雑なロジックを、以前よりも現実的に設計・改善できるようになっています。 つまり、AIを「毎回の判定者」として使うだけではなく、判定ロジックを作るための「開発支援者」として活用する、という考え方です。 帳票判定の実行時には、あらかじめ設計したロジックを使うことで、処理を速く、安く、再現性高く進められます。 さらに、どの条件によって判定されたのかを説明しやすく、後から見直しや改善もしやすくなります。 AIでロジックを作り、実行時はロジックで速く・安く・説明可能に処理する。 このように、AIとルールベース処理を組み合わせることで、帳票判定には新しい実用的な選択肢が生まれると考えています。 ルールは複雑ですが、複雑だからこそAIで設計・改善しやすく、実行時には高速で再現性のある判定として動作します。 この記事では、その判定ロジックの考え方を整理します。 --- 判定は2段階で行う 領収書チェッカーの判定は、大きく2段階です。 段階 目的 主な処理 --- --- --- 帳票種別判定 画像が何の帳票かを推定する 領収書、レシート、請求書、見積書などをスコアリング 領収書必須チェック 領収書形式として必要項目があるか確認する 発行元、宛名、取引日、金額、消費税、取引内容、...