GitHub Actions のワークフローをチェックする actionlint をつくった

GitHub Actions のワークフローを静的にチェックする actionlint というコマンドラインツールを最近つくっていて，概ね欲しい機能が揃って実装も安定してきたので紹介します．

なぜワークフローファイルの lint をすべきなのか

GitHub Actions が正式リリースされてからだいぶ経ち，GitHub 上での CI は GitHub Actions が第一候補となってきているように感じます．僕も新規にリポジトリを作成して CI をセットアップする場合はほぼ GitHub Actions を使っています．

ですが，GitHub Actions には下記のような問題があり，actionlint でそれらを解決・緩和したいというのが理由です．

ワークフローを実装する時は，GitHub に push して CI が実行されるのを待って結果を確認するという作業が繰り返し必要になり，時間がかかります．手元で分かる間違いはなるべく手元でチェックし，この繰り返し回数を減らしたいです．
GitHub Actions サービス側のワークフローのチェックは非常に『緩い』です．例えば，想定していないキーがあっても単に無視されるため，キー名をタイポしていても気付きません．また matrix.os のような式内でのプロパティアクセスはプロパティが存在しなくてもエラーにならず，単に null に評価されます．また，ブランチ名やタグ名のフィルタに使う glob パターンも簡単な構文チェックしか行っておらず，例えば間違えて正規表現を使ってしまったりしてもエラーになりません．
ワークフローが「一応実行は成功しているが実は意図通り動いていない」（静かに壊れている）ということがよくあります．例えばありがちなのは actions/cache で key: ${{ matrix.platform }}-${{ hashFiles(...) }} のようにキャッシュのキーを指定していて，matrix.platform が存在しない場合です（他所のワークフローからコピペしてきた場合などに matrix の値の名前をミスってることがあります）．この場合 matrix.platform は null になり，文字列化すると空文字列になるため，キャッシュのキーは意図した値になりません．ですが，これは実行してすぐは普通に動いてしまうので間違いに気付かず，後にジョブ間での難しいキャッシュ周りの問題を引いてしまいます．

コマンドラインでの使い方

ローカルにインストールする場合は以下のいずれかの方法で使ってください．

(macOS の場合）Homebrew を使う．ただし，M1 Mac は動作確認が取れていないのでビルド済みバイナリを提供できていないのでこの方法が使えません．x86_64 用のバイナリをダウンロードして Rosetta2 で動かしていただくか，Go 1.16 以上で手元でソースからビルドしてください v1.4.1 で Apple M1 サポートしました（追記: 2021/7/12）
リリースページから実行バイナリをダウンロードして解凍し，PATH が通ったディレクトリに置く
ソースからビルドする: go install github.com/rhysd/actionlint/cmd/actionlint@latest

インストールした actionlint コマンドを lint をかけたいリポジトリ内で引数無しで実行すると，自動で .github/workflows 以下のワークフローファイルを見つけてきてチェックします．基本的にはこれだけです．

$ actionlint

ワークフローを指定したい場合は引数にパスを渡します．

$ actionlint /path/to/workflow.yml

その他オプションについては actionlint -help を確認してください．

f:id:rhysd:20210711213405p:plain — actionlint 実行例

見つけたエラーはエラー箇所のコードスニペットと一緒に標準出力に出力されます．エラーが見つからなかった場合は何も出力しません．

CI での使い方

自動で最新版の actionlint をカレントディレクトリにダウンロードしてくるダウンロードスクリプトを使うのが一番簡単です．

例えば GitHub Actions なら下記のようなジョブで実行できます．GitHub Actions でのコマンド実行は端末から実行された扱いにならずそのままでは出力に色が着かないので -color フラグを用います．

jobs:
  actionlint:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v2
      - name: Run actionlint
        shell: bash
        run: |
          bash <(curl https://raw.githubusercontent.com/rhysd/actionlint/main/scripts/download-actionlint.bash)
          ./actionlint -color

また，-oneline フラグを使うと reviewdog のようなツールにも簡単に integrate できます．

ブラウザでの使い方

actionlint を WebAssembly にコンパイルし，ブラウザでも Playground として利用できるようにしています．

https://rhysd.github.io/actionlint/

ページ内のエディタにワークフローの YAML を貼り付けると，自動で lint 結果が更新されます．エラーメッセージをクリックすると，エディタのカーソルがエラー位置に移動します．全てローカルのブラウザで完結しているので，貼り付けたワークフローがリモートのサーバに送信されることはありません．一応 iOS などのモバイル端末でも動きます．

f:id:rhysd:20210711213628j:plain — actionlint playground

actionlint で実装した静的チェック

actionlint では方針としてワークフロー内のミスを見つけることにフォーカスしています．1回の実行でできるだけ多くのエラーを見つけ，かつ false positive（誤検知）を最小限に抑えることを目指しています．なので，インデントの崩れなどのコードスタイルについてはチェックしません．もしそういったチェックが欲しい場合は yamllint などのツールを別途使用してください．

actionlint ではざっくり下記のチェックを実装しています．

ワークフロー構文の構文チェック．必要なキーが無かったり，不要なキーがあったりするとエラーになる
${{ }} 内の式構文の構文チェックおよび意味チェック．式の型チェック，コンテキストオブジェクトのプロパティチェック，関数のシグネチャチェックなど
shellcheck を使った run: のシェルスクリプトチェック
pyflakes を使った run: の Python スクリプトチェック
on: に書く Webhook イベントのチェック
branches: などに書く glob パターンの構文チェックおよび ref name のチェック
cron: に書く CRON の構文チェックおよび実行頻度チェック
runs-on: に書く runner ラベルのバリデーション
uses: に書くアクションのフォーマットチェックとローカルアクションの input チェック
shell: に書くシェル名のバリデーション（例えば powershell は Windows 系の runner でないと使えないなど）
needs: に書く依存ジョブのチェック．ジョブの存在チェック，循環依存チェックなど
Job ID や Step ID のユニーク性のチェック
その他，ハードコードされたパスワードの検知，環境変数名のチェックなど...

actionlint による有用なチェックの例

チェック一覧はこちらのドキュメントに例と actionlint の出力，playground へのリンク付きで網羅的に書いてありますが，この記事内でそれを全て書くのは長くなりすぎるのでやめておきます．

代わりに，ここでは actionlint が有用な例をいくつか紹介します．コメントで 'エラー: ' と書かれているところが実際に actionlint で指摘される箇所です．

キー名やラベル名のタイポ

on:
  push:
    # エラー: branches: が正しい
    branch: main

キー名は間違っていても GitHub Actions は特に指摘してくれません．単にワークフローが走らないだけなので，自力でタイポに気付く必要があります．actionlint はどの要素がどういうキーを持っているべきかを知っているので，こういったミスをチェックできます．

strategy:
  matrix:
    # エラー: linux-latest は存在しない．ubuntu-latest が正しい
    os: [linux-latest, windows-latest]
runs-on: ${{ matrix.os }}

actionlint は runs-on: に書かれた runner ラベルが正しいかどうかもチェックします．上記のように，${{ matrix.os }} のように間接的に指定していても matrix の値を見に行ってチェックします．

Webhook のバリデーション

on:
  # エラー: pull_request が正しい
  pullreq:
  issues:
    # エラー: opened が正しい
    types: created
  schedule:
    # エラー: CRON シンタックスが間違っている（要素数が1つ足りない）
    - cron: '0 */3 * *'
    # エラー: 実行のインターバルが短すぎる
    - cron: '* */3 * * *'
  push:
    tags:
      # エラー: 正規表現は使えない
      - '^v\d+$'
      # エラー: glob パターンの構文エラー（? は * に付けられない）
      - 'v*.*.*?'

on: には Webhook イベントを書けます．どういうイベントがあるかはドキュメントに書いてあるので，actionlint は正しいイベントおよびイベントタイプが指定されているかをチェックできます．

cron: に指定するスケジュールの構文チェックや実行頻度のチェックも行います．実行頻度が1分に1回以上だとエラーになります．

さらに，tags: や branches: や paths: に使う glob パターンについても構文が正しいかや Git の ref name に使えない文字が使われていないかなどをチェックします．ここに正規表現を書けると勘違いしているケースが結構あるみたいなのですが，GitHub Actions 側ではエラーになりません．actionlint ならそういったケースも拾えます．

`${{ }}` 内の式の型チェック

# エラー: 構文チェック: 文字列リテラルにはシングルクォートしか使えない
- run: echo '${{ contains(runner.os, "windows-") }}'
# エラー: 意味チェック: github.repository は文字列型なので owner プロパティは存在しない
- run: echo '${{ github.repository.owner }}'

GitHub Actions では ${{ }} で囲んだ中に式を書いて評価させることができます．actionlint ではその式を構文木にパースして型チェックを行います．

github.* や job.* などのグローバルに自動で定義されるコンテキストオブジェクト
matrix.* や steps.*, env.*，needs.* などの，ユーザが書いたワークフローに応じて適宜定義されるコンテキストオブジェクト
contains(), toJSON(), format(), hashFiles() などの組み込み関数

これらを適宜解析しながら型チェックを行います．

strategy:
  matrix:
    node: [14, 15]
    package:
      - name: 'foo'
        optional: true
      - name: 'bar'
        optional: false
# エラー: matrix に定義されていない値（コピペしてきて変え忘れが多い）
runs-on: ${{ matrix.os }}
steps:
  # エラー: 存在しないキー．matrix.package の型は {name: string, optional: bool}
  - run: echo '${{ matrix.package.dev }}'
  # エラー: startswith() は第1引数に文字列型の値を取るので，object 型の matrix.package は使えない
  - run: echo '${{ startswith(matrix.package, 'foo') }}'

actionlint は matrix: に定義された値を解析し，matrix.* オブジェクトに適宜型を付けます．存在しないプロパティにアクセスしようとした時や，型が合わないときなどにエラーにできます．

# エラー: startswith() は第1引数に文字列型の値を取るので，object 型の runner は使えない
- run: echo ${{ startswith(runner, 'linux-') }}
# エラー: hashFiles() は少なくとも1つ以上引数が必要
- run: echo ${{ hashFiles() }}
# エラー: format() 引数の数とプレースホルダの数が合っていない
- run: echo ${{ format('{0}: {1}', 1) }}

${{ }} 内の式で使える関数は組み込み関数のみでドキュメントに定義が載っています．actionlint はこれら全ての関数シグネチャの情報を持っていて，型チェックなどを行います．これらの関数の定義は結構複雑で，オーバーロードがあったり（contains() は文字列でも配列でも使えるなど），デフォルト引数（join() のセパレータのデフォルトは ','）があったり，可変長引数（hashFiles() は1つ以上の引数を取る）があったりします．actionlint ではそれらを解析できるように実装しています．

また，steps.* オブジェクトには各ステップの output 値がセットされていきます．これらの値は，そのステップが実行されるまでは存在しないため，アクセスすると null になってしまいます．これはステップを他のワークフローからコピペしてきた時によく起きる間違いです．

# エラー: ここではまだ get_value ステップが実行されていないため steps.get_value.outputs は存在しない
- run: echo '${{ steps.get_value.outputs.name }}'
# ここで steps.get_value に値がセットされる
- run: echo '::set-output name=foo::value'
  id: get_value
# OK
- run: echo '${{ steps.get_value.outputs.name }}'

`run:` に書くスクリプトの lint

test:
  runs-on: ubuntu-latest
  steps:
    # エラー: "$FOO" のようにクォートで括るべき
    - run: echo $FOO
test-win:
  runs-on: windows-latest
    # PowerShell で実行されるので shellcheck でチェックしない
    - run: echo $FOO

actionlint は run: に書かれたシェルスクリプトを shellcheck を使ってチェックします．actionlint は run: に書かれているスクリプトがどのシェルで実行されるかを解析し，bash か sh だった場合のみ shellcheck を実行します．shellcheck コマンドがシステムに存在しない時は単にチェックをスキップします（-shellcheck オプションで制御可能）．

# エラー: 未定義変数 hello
- run: print(hello)
  shell: python

また，GitHub Actions では shell: python を指定することで run: に Python スクリプトを書くこともできます．actionlint ではこれらの Python スクリプトを shellcheck と同様に pyflakes を使ってチェックします．pyflakes コマンドがシステムに存在しない時は単にチェックをスキップします（-pyflakes オプションで制御可能）．

actionlint の設定ファイル

.github/actionlint.yml に設定ファイルを置くことができます．ただ，僕は lint の設定ファイルを極力管理したくないので，設定ファイルは基本的に必要無いようにしています．現在は，self-hosted runner を使っている時のカスタムラベルの値だけを設定に書くことができます（runs-on: のラベルのバリデーションで使われます）．

設定ファイルが必要になった際は，actionlint -init-config でデフォルトの設定ファイルを生成できるので，ゼロから書く必要はありません．

actionlint の実装について

全て Go で実装しています．

ワークフローファイルは go-yaml/yaml を使って YAML の構文木に一旦パースし，YAML 構文木をトラバースしてワークフロー構文独自の構文木に再構成します (parse.go）．

各チェックはルールごとにワークフロー構文木の visitor の pass として分けて実装していて（rule_*.go），ルールの取捨選択やルールごとのテストがやりやすいように設計しています．ワークフロー構文木 1 pass でチェックを終えられるように，visitor に pass を登録して，visitor は構文木を巡りながら各 pass を適用していきます．

${{ }} 内の式の解析は真面目に字句解析・構文解析・意味解析を実装しました（expr_*.go）．glob パターンの解析も独自にバリデータを実装しています（glob.go）．

実装の方針として，できるだけ多くのエラーを検知できるようにというのがあるので，たとえ1つエラーを見つけても処理は続行します．例えばワークフロー構文木の生成の過程でエラー（必要なキーが無いなど）が見つかっても，気にせずにその後の解析を続けます．壊れたワークフローをチェックしても問題ないように，go-fuzz を使った fuzzing を行ったりもしています．

この辺りの細かい実装の話はもし需要があれば別途どこかに書くかもしれません．

単体テストはまだ十分ではないですが，一応実世界でのテストはしていて，GitHub API を使って GitHub の上位1000リポジトリから 1500 以上の GitHub Actions のワークフローファイルをかき集めてきて，それらに actionlint を適用し，検出したエラーを一通り目でチェックしました．その過程で見つかった誤検知などの問題は一通り修正しています．

まとめ

GitHub Actions ワークフローの静的チェックを行うツール actionlint を実装しました．CI のワークフローの実装やデバッグは時間がかかって大変なので，そういった作業が少しでもこれで軽減できれば良いなと思ってます．

簡単に試せるようになっているので，お手元のワークフローファイルを試してみていただき，フィードバック（誤検知の報告や機能提案など）を issue で教えてもらえるとありがたいです（日本語で大丈夫です）．