Google Cloud Vision API で手書きのモデル図からデータを抽出する

Google Cloud Vision API は Google が提供する機械学習モデルを利用して、画像から有益な情報を抽出するインターフェースです。

このAPIを利用して、手書きのモデル図からデータを抽出してみました。

手書きのモデル図

抽出した結果は以下のとおり。

18.8m
M = 100.0
A= 123,4
10.3m
M=200.0
A =567.8
6.3m M. = 300.0
A=9876.5
4.2mM = 300.0
thrin KH = 1000.0
INPUT-SS1 TA KR=2000.0

バネの記号図がなにやら意味不明な単語になっていますが、どうやら記号を無理やり文字に変換しようとしているようで、このあたりはチューニングが必要ですが基本的なデータはしっかり抽出できています。

データを整理して自社サーバなどの解析エンジンにデータを投げれば手書きモデル図から解析を実行するということが可能になりそうです。

Pythonソースは以下のサイトを参考にさせていただきました。
https://www.g104robo.com/entry/google-cloud-vision-api

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA