AI BuilderのOCR機能がスゴい!手書き文字を高精度で読み取る設定方法と活用術
AI BuilderのOCR機能がスゴい!手書き文字の認識精度と設定のコツ
Power PlatformでAIを手軽に利用できる「AI Builder」。その中でも特に便利なのが、紙の書類や手書きのメモをデータ化できるOCR(光学文字認識)機能です。本記事では、AI BuilderのOCR機能で手書き文字を高精度に読み取るための設定のコツと、業務にどう活用できるのかを、わかりやすく解説します。
AI BuilderのOCR機能とは?
AI BuilderのOCR機能は、画像やPDFに含まれる文字情報を自動的に読み取り、テキストデータとして抽出する機能です。特に次のような特徴があります。
- 印刷文字だけでなく手書き文字にも対応
- Power AppsやPower Automateとシームレスに連携
- テンプレートを使えばプログラミング不要で構築可能
従来、紙の申込書やアンケートの内容をExcelに入力するには、人手による転記が必要でした。AI BuilderのOCRを使うことで、スキャン画像をアップロードするだけで自動的にテキスト化でき、業務の効率化や入力ミスの削減につながります。
AI Builderで利用できるOCRの種類
AI Builderには、用途に応じた複数のモデルが用意されています。手書き文字の読み取り精度を最大化するためには、このモデル選択が非常に重要です。
1. テキスト認識(Text Recognition)
画像内のテキストをまとめて抽出するためのモデルです。看板やラベル、スクリーンショットなど、レイアウトをあまり意識しない「文字だけ」抽出に向いています。
2. フォーム処理(Form Processing)
申込書・申請書・アンケートなど、定型フォーマットの書類を対象にしたモデルです。次のような特徴があります。
- 項目ごとに「名前」「住所」「日付」などのフィールド単位で抽出できる
- 複数ページの書類にも対応
- 手書き文字の認識にも強い
手書きの申込書や手書き伝票を扱う場合は、このフォーム処理(Form Processing)モデルを利用するのが基本になります。
手書き文字の認識精度を高めるポイント
AI BuilderのOCRは高性能ですが、設定や前提条件によって認識精度が大きく変わります。ここでは、手書き文字をできるだけ正確に読み取らせるためのコツを整理します。
1. 画像の解像度とスキャン品質を見直す
- 解像度は300dpi以上を目安にスキャンする
- スマホ撮影の場合は、ブレ・ピンぼけ・影を避ける
- 書類全体がフレーム内に収まるよう、真上から撮影する
- 斜めに撮影した場合は、可能な範囲で補正してからアップロード
OCRはピクセル情報から文字を判定するため、画像の鮮明さが直接精度に影響します。特に手書き文字は線が細いことも多いため、低解像度の画像では線が潰れてしまい、誤認識の原因になります。
2. フォームのレイアウトを整える
フォーム処理モデルを使う場合、フォーマットが一定であることが重要です。次の点を意識してフォームを設計すると、AI Builderの学習と認識が安定します。
- 入力欄の位置や大きさを固定し、バージョンによるズレを最小限にする
- 「氏名」「住所」「電話番号」など、ラベル(項目名)をはっきり印字する
- 手書き欄には罫線や枠を引き、文字を書く位置をガイドする
- 1つの枠に複数の情報を入れない(例:氏名とフリガナは枠を分ける)
AI Builderは、アップロードされたサンプルから「どの位置がどの項目か」を学習します。そのため、レイアウトが変わるたびに再学習が必要になり、運用が複雑になります。最初の設計段階でフォーマットを固めておくと、長期的に安定したOCR運用が可能になります。
3. 手書きの書き方ルールを決める
AI Builderの手書きOCRは賢いとはいえ、極端に崩れた文字やデザイン文字は苦手です。現場で使う書類について、次のようなルールを作っておくと、認識精度が大きく改善します。
- ひらがな・カタカナはできるだけ丁寧に、マス目に収まるように書く
- 数字は「1と7」「0と6」などが紛らわしくならないよう、はっきり書く
- アルファベットは大文字・小文字を混在させず、どちらかに統一する
- ボールペンかサインペンを使い、薄い鉛筆や色ペンは避ける
特に数字や記号(ハイフン・スラッシュなど)は誤認識が起こりやすいため、「電話番号は枠の上に1桁ずつ書く」など、社内ルール化しておくと効果的です。
4. 学習用サンプルは「現場で実際に使う」用紙から集める
フォーム処理モデルでは、学習用として複数枚のフォーム画像をアップロードします。このとき、きれいに書かれた理想的なサンプルだけでなく、
- 多少くせ字が混ざったもの
- 空欄があるもの
- 訂正が入っているもの
など、実運用に近い状態の書類も含めて学習させると、現場での認識精度が安定します。あまりにきれいなサンプルだけで学習すると、実際の現場の書類を読み取ったときにギャップが生まれてしまいます。
AI BuilderのOCRモデル設定のステップ
ここからは、Power Platformの管理者や現場担当者が実際に構築するイメージで、AI Builderで手書きOCRモデルを設定する流れを整理します。
ステップ1:モデルの種類を選ぶ
- Power Apps または Power Automate の画面からAI Builderを開く
- 「モデルを探索」から、フォーム処理(Form Processing)またはテキスト認識(Text Recognition)を選択
- モデル名を付けて作成を開始
申込書や定型の用紙を扱う場合は「フォーム処理」、単純に文字だけ抽出したい場合は「テキスト認識」を選びます。
ステップ2:学習用ドキュメントをアップロード
フォーム処理モデルの場合、AIにレイアウトと項目を覚えさせるため、同じフォーマットの書類を数枚〜十数枚アップロードします。
- PDFまたは画像(JPG、PNGなど)形式で用意
- できるだけ実際に手書きされた状態のものを使う
- スキャン品質は前述の通り300dpi程度を目安に
アップロードが完了すると、AI Builderが自動的にレイアウトを分析し、どこにテキストがあるかを検出します。
ステップ3:フィールドのラベル付け
AI Builderが検出したテキストの領域に対して、「これは氏名」「これは住所」「これは日付」といったフィールド名(ラベル)を付けていきます。
- マウスで枠を選択し、フィールド名を入力
- 同じ項目が複数ページにわたる場合は、すべてにラベルを付ける
- 不要な領域(メモ欄など)はラベルを付けず無視する
ここでフィールド名を整理しておくことで、後のPower AutomateフローやPower Appsの操作で、「顧客名」「郵便番号」といった名前で簡単に参照できるようになります。
ステップ4:モデルのトレーニング
ラベル付けが完了したら、トレーニング(学習)を実行します。トレーニングはクラウド上で自動的に行われ、完了するとテストが可能になります。
- 学習に使ったものとは別のフォームを使ってテストする
- フィールドごとの認識結果を確認し、誤認識が多い場合はラベル付けや学習サンプルを見直す
- 必要に応じて、サンプル枚数を追加して再トレーニングする
このサイクルを数回回すことで、現場の書字パターンに合わせた精度の高い手書きOCRモデルが作り上げられます。
ステップ5:Power Apps / Power Automateへの組み込み
トレーニングが完了したOCRモデルは、Power AppsやPower Automateから簡単に利用できます。
Power Appsでの活用例
- スマホアプリから申込書を撮影し、その場でAI Builderモデルに送信
- 返ってきたテキストデータを画面上に表示し、オペレーターが目視で確認・修正
- 最終確定した内容をDataverseやSharePoint、Excelに保存
Power Automateでの活用例
- SharePointの特定フォルダにPDFがアップロードされたらフローを自動起動
- AI Builderのフォーム処理モデルで解析し、抽出結果をリストやデータベースに保存
- 必要に応じて、担当者にメール通知を送る
このように、AI BuilderのOCR機能はPower Platform全体と連携してこそ真価を発揮します。RPA的な自動処理とも組み合わせることで、紙ベースの業務を大幅にデジタル化できます。
AI Builder OCRの活用シナリオ
具体的にどのような業務でAI Builderの手書きOCRが活躍するのか、代表的なシナリオをいくつか紹介します。
1. 顧客申込書・契約書のデータ化
- 店舗で記入してもらった会員申込書
- 保険や金融商品の申込書
- サービス利用申請書
これらの書類は、従来は人手で基幹システムに入力していましたが、AI Builderのフォーム処理モデルを使えば、手書きの内容を自動的にテキスト化し、顧客マスタや契約管理システムへの取り込みを自動化できます。
2. 手書きアンケートの集計
イベントやセミナー、店舗などで回収する紙のアンケート票も、OCRの得意分野です。
- チェックボックスや評価(5段階評価など)をフィールドとして抽出
- 自由記述欄のコメントもテキスト化して分析
テキスト化された自由記述欄は、Power BIやAzureのテキスト分析と組み合わせることで、ポジティブ・ネガティブの傾向分析や、よく出てくるキーワードの抽出などにも活用できます。
3. 手書き作業日報・点検表の入力自動化
現場作業や設備点検では、紙に手書きで日報やチェックリストを記入しているケースがまだまだ多くあります。
- 作業日、担当者名、現場名
- 点検項目の結果(OK/NG、数値など)
- 特記事項のコメント
これらをAI BuilderのOCRで読み取り、SharePointリストやDataverseに自動登録することで、集計・検索・分析が一気にしやすくなります。
よくあるつまずきポイントと対策
AI Builderの手書きOCRを導入する際によくある課題と、その対策をまとめておきます。
課題1:手書き文字の認識精度が安定しない
原因候補:
- サンプル数が少なく、AIが十分に学習できていない
- フォームのレイアウトがバージョンごとに微妙に違う
- スキャン品質が低い、または撮影条件が悪い
対策:
- 学習用ドキュメントを増やし、バリエーションも含めて再トレーニングする
- フォームのレイアウトを統一し、古いフォーマットは廃止する
- スキャナ設定を見直し、撮影マニュアルを現場に展開する
課題2:一部のフィールドだけ誤認識が多い
原因候補:
- 枠のサイズが小さく、文字が潰れてしまっている
- 背景の罫線やデザインが濃く、文字と干渉している
- そのフィールドだけ特殊な書き方(略称・記号)が多い
対策:
- 該当フィールドの枠を大きくし、ゆとりを持って書けるようにする
- 背景を薄いグレーにする、罫線を細くするなどデザインを調整
- 略称や業界用語を減らし、できるだけ一般的な表記で記入してもらう
課題3:システム連携や後続処理がうまく設計できない
OCRでテキスト化するだけでは、業務全体の効率化は十分ではありません。
対策:
- まずは「紙からどのシステムにどの項目を入れたいか」を洗い出す
- Power Automateで、入力 → OCR → 結果の整形 → 保存 → 通知までの一連のフローを設計する
- 最初は小さな範囲(1つの書類・1つの部署)から始め、徐々に拡大する
まとめ:AI BuilderのOCRで「紙」を資産に変える
AI BuilderのOCR機能は、手書き文字を含む紙の書類を、デジタルデータに変換する強力なツールです。特にフォーム処理モデルを活用することで、申込書・アンケート・日報など、さまざまな業務で大きな効果を発揮します。
手書き文字の認識精度を高めるためのポイントは、次の4つでした。
- 解像度やスキャン品質を見直し、読み取りやすい画像を用意する
- フォームのレイアウトを統一し、AIが学習しやすい設計にする
- 現場での「書き方ルール」を決め、くせ字や誤認識を減らす
- 実運用に近いサンプルで学習させ、トレーニングとテストを繰り返す
これらを意識してモデルを構築すれば、人手による入力作業を大幅に削減しつつ、データ品質も向上させることができます。Power AppsやPower Automateと組み合わせて、ぜひ自社の紙業務のデジタル化にチャレンジしてみてください。
実際の画面操作や具体的な設定例については、以下の動画も参考になります。