Go 言語で画像のサイズを変更する

今回は小ネタ。 ちょっと画像データを弄る機会があったので,やったことを忘れないうちに記しておく。

画像の Width/Height の値を取得する

画像のサイズを変更するにはまず元の画像のサイズが分かっていないといけない。 これは標準の image パッケージを使って実装できる。 いきなりコードを書くとこんな感じ。

package main

import (
    "flag"
    "fmt"
    "image"
    _ "image/gif"
    _ "image/jpeg"
    _ "image/png"
    "os"
)

func main() {
    flag.Parse()
    if flag.NArg() != 1 {
        fmt.Fprintln(os.Stderr, os.ErrInvalid)
        return
    }
    
    //open image file
    file, err := os.Open(flag.Arg(0)) //maybe file path
    if err != nil {
        fmt.Fprintln(os.Stderr, err)
        return
    }
    defer file.Close()

    //decode image
    img, t, err := image.Decode(file)
    if err != nil {
        fmt.Fprintln(os.Stderr, err)
        return
    }
    fmt.Println("Type of image:", t)

    //rectange info of image
    rct := img.Bounds()
    fmt.Println("Width:", rct.Dx())
    fmt.Println("Height:", rct.Dy())
}

image.Decode() 関数で画像データをデコードし image.Image.Bounds() 関数で画像全体の矩形情報(image.Rectangle)を取得する1。 ポイントは image.Decode() 関数が factory method のように機能していて画像フォーマットを意識する必要はないという点。 ではどこで依存(dependency)を注入しているかというと,パッケージのインポート

import (
    _ "image/gif"
    _ "image/jpeg"
    _ "image/png"
)

の部分。 この場合は GIF, JPEG, PNG 形式に対応していることを示す。 もちろんこれらと互換性のある独自パッケージを使ってもよい2

では早速

Frog
Frog

の画像を読み込んでみよう。

$ go run sample1.go 7444837_o.jpg
Type of image: jpeg
Width: 640
Height: 480

よーし,うむうむ,よーし。

画像のサイズを変更する

次に画像のサイズを変更してみよう。 ググってみると github.com/nfnt/resize を使った例をよく見かけるが,件のリポジトリを見てみると

This package is no longer being updated! Please look for alternatives if that bothers you.
via nfnt/resize: Pure golang image resizing

と書かれていて2018年2月を最後に活動を停止しているようである。 代わりのパッケージとして

紹介されている。

そこで今回は golang.org/x/image/draw パッケージを使って画像のサイズ変更を行ってみる。 これもいきなりコードを書くとこんな感じ。

package main

import (
    "flag"
    "fmt"
    "image"
    "image/gif"
    "image/jpeg"
    "image/png"
    "os"

    "golang.org/x/image/draw"
)

func main() {
    flag.Parse()
    if flag.NArg() != 2 {
        fmt.Fprintln(os.Stderr, os.ErrInvalid)
        return
    }

    //open original image file
    src, err := os.Open(flag.Arg(0)) //maybe src file path
    if err != nil {
        fmt.Fprintln(os.Stderr, err)
        return
    }
    defer src.Close()

    //decode image
    imgSrc, t, err := image.Decode(src)
    if err != nil {
        fmt.Fprintln(os.Stderr, err)
        return
    }
    fmt.Println("Type of image:", t)

    //rectange of image
    rctSrc := imgSrc.Bounds()
    fmt.Println("Width:", rctSrc.Dx())
    fmt.Println("Height:", rctSrc.Dy())

    //scale down by 1/2
    imgDst := image.NewRGBA(image.Rect(0, 0, rctSrc.Dx()/2, rctSrc.Dy()/2))
    draw.CatmullRom.Scale(imgDst, imgDst.Bounds(), imgSrc, rctSrc, draw.Over, nil)

    //create resized image file
    dst, err := os.Create(flag.Arg(1)) //maybe dst file path
    if err != nil {
        fmt.Fprintln(os.Stderr, err)
        return
    }
    defer dst.Close()

    //encode resized image
    switch t {
    case "jpeg":
        if err := jpeg.Encode(dst, imgDst, &jpeg.Options{Quality: 100}); err != nil {
            fmt.Fprintln(os.Stderr, err)
            return
        }
    case "gif":
        if err := gif.Encode(dst, imgDst, nil); err != nil {
            fmt.Fprintln(os.Stderr, err)
            return
        }
    case "png":
        if err := png.Encode(dst, imgDst); err != nil {
            fmt.Fprintln(os.Stderr, err)
            return
        }
    default:
        fmt.Fprintln(os.Stderr, "format error")
    }
}

このコードでは Width/Height を半分のサイズにしたイメージをファイル出力している。

前半の画像の読み込み部分は先程と同じ。 その次に image.NewRGBA() 関数で Width/Height を半分のサイズにした空のインスタンスを生成し draw.CatmullRom.Scale() 関数で変換した画像データを流し込んでいる。 その後ファイルに出力するのだが,出力するフォーマットごとに異なる Encode() 関数になっている。

draw.CatmullRom はサイズ変換のための draw.Scaler インタフェースを持つ draw.Kernel 型インスタンスで,以下のように定義されている。

var (
    // CatmullRom is the Catmull-Rom kernel. It is very slow, but usually gives
    // very high quality results.
    //
    // It is an instance of the more general cubic BC-spline kernel with parameters
    // B=0 and C=0.5. See Mitchell and Netravali, "Reconstruction Filters in
    // Computer Graphics", Computer Graphics, Vol. 22, No. 4, pp. 221-228.
    CatmullRom = &Kernel{2, func(t float64) float64 {
        if t < 1 {
            return (1.5*t-2.5)*t*t + 1
        }
        return ((-0.5*t+2.5)*t-4)*t + 2
    }}
)

draw.CatmullRom はどちらかというと品質優先の draw.Scaler のようだが,他にもいくつか定義済みのインスタンスがある。 性能について詳しくは次回の記事を参考にしてほしい。

では,実際に動かしてみよう。

$ go run sample2.go 7444837_o.jpg out.jpg
Type of image: jpeg
Width: 640
Height: 480

出力結果は以下の通り。

out.jpg
out.jpg

うむうむ。 いい感じである。

ブックマーク

参考図書

photo
プログラミング言語Go (ADDISON-WESLEY PROFESSIONAL COMPUTING SERIES)
Alan A.A. Donovan, Brian W. Kernighan
柴田 芳樹 (翻訳)
丸善出版 2016-06-20
Book 単行本(ソフトカバー)
ASIN: 4621300253, EAN: 9784621300251
評価     

著者のひとりは(あの「バイブル」とも呼ばれる)通称 “K&R” の K のほうである。この本は Go 言語の教科書と言ってもいいだろう。

reviewed by Spiegel on 2018-10-20 (powered by amazon-item v0.2.0)


  1. image.Image は interface 型で抽象化されている。 [return]
  2. 厳密に言うと image.RegisterFormat() 関数で登録する。例えば image/jpeg パッケージの場合は init() 関数内で image.RegisterFormat() 関数が呼ばれている。このようなデザイン・パターンは Go 言語ではよく見られるので覚えておくとよいだろう(参考:Hash 値を計算するパッケージを作ってみた)。 [return]