Google Cloud Vision APIを試してみた。


Google Cloud Vision APIのベータ版が公開されたのでためしてみる。

Google Cloud Vision APIとは

google の画像処理技術を駆使した高精度の画像処理API。
高精度な画像の分類、文字抽出、OCRが可能

つかいかた

google cloud platformへの登録

まずgoogle cloud platformに登録します。
60日, $300は無料で使用可能です。

クレジットカードの登録が必要ですが、60日すぎて勝手に更新されることはない様子。

APIの有効化

Cloud Vision APIを有効化します。

API マネージャーから Vision APIを探し、有効化します。

そのあと
– 認証情報
– Create credential
– API key
– サーバーキー
– 作成
とし、APIのリクエストに必要なキーを発行する。

リクエストの送信

以下の形式のjsonファイルを作成します。

{
  "requests":[
    {
      "image":{
        "content":"base64-encoded file data"
      },
      "features":[
        {
          "type":"LABEL_DETECTION",
          "maxResults":1
        }
      ]
    }
  ]
}

ここでbase64-encoded file dataが画像データになります。
これは画像データをbase64形式のASCIIコードで表現したもので以下のコマンドで作成できます。

Linux

$ base64 input.jpg > output.jpg
MacOSX
$ base64 -i input.jpg -o output.jpg

curlコマンドでAPIのリクエストを送信します。

$ curl -v -k -s -H "Content-Type: application/json" https://vision.googleapis.com/v1/images:annotate?key=browser_key --data-binary @test.json

ここでbrowser_keyはさきほど作成したAPIキー, test.jsonが作成jsonファイルですね

以下の画像で試すと次のようなjsonが帰ってきます。

faulkner-1

{
  "responses": [
    {
      "labelAnnotations": [
        {
          "mid": "/m/0bt9lr",
          "description": "dog",
          "score": 0.97346616
        }
      ]
    }
  ]
}

0.97ぐらいのスコアで”dog”だといっていますね。
これが3秒ぐらいで帰ってきます。

まとめ

Google Cloud Vision APIを使用して画像の分類をためしてみました。
近いうちにtext detectionとOCRもためしてみたいと思います。

apiのマニュアル

The following two tabs change content below.
miyamoto
IoT/ DIY / music / 日本語ラップ
miyamoto

About miyamoto

IoT/ DIY / music / 日本語ラップ

One Thought on “Google Cloud Vision APIを試してみた。

  1. Pingback: Google Cloud Vision Api でOCRをためす | illmatic工業

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

Post Navigation