Pytorchでの日本語自然言語処理の分析環境を用意するための Docker ファイル
Docker version 20.10.3
nvidiaが提供しているPytorchイメージ https://ngc.nvidia.com/catalog/containers/nvidia:pytorch
- pytorch
- gensim
- MeCab
- mecab-python3
- mecab-ipadic-neologd
- neologdn
- numpy
- optuna
- pandas
- matplotlib
- scikit-learn
- seaborn
- transformers
- fugashi
- tqdm
- apex
- seqeval
- mlflow
コンテナの起動には主にdocker-compose
を利用する方法と利用しない方法の2種類あります.
2つの方法を以下に紹介します.個人的にはdocker-compose を利用する方法が楽です.
※以下作業はcloneしたディレクトリ内で行ってください
cd docker_pytorch/
docker-compose は複数のコンテナを同時に立ち上げてくれるものですが,ひとつのコンテナを立ち上げるのにも便利です.
docker-compose.yml にあらかじめオプションを記述することで各コンテナの起動時の設定などができます.
これを利用することによって「docker-compose を利用しない方法」に書いてあるようなbuildやrunコマンド時の煩雑なオプション指定をいちいち入力しなくてもよくなります.
docker-compose.yml のあるディレクトリに移動して
以下のコマンドを打つと イメージの作成(build) から コンテナの作成&起動(run) まで全て行ってくれます.
docker-compose up -d
docker-compose
を打ったあとは,以下コマンドでコンテナ内に入れます.
docker exec -it pytorch_container bash
docker build --rm -t pytorch_env:latest .
docker run -it -v $PWD:/home/workspase --name pytorch_container pytorch_env:latest /bin/bash
上記コマンドを打つと自動的にコンテナ内に入ってくれます.
実行中のdockerコンテナの一覧が表示されます.
docker ps
-a オプションをつけることで 終了したコンテナも 含めて一覧表示されます.
docker ps -a
作成したはずのコンテナがdocker ps
をしても表示されない場合は,起動していない可能性があります.
以下コマンドでコンテナを起動してください.
docker start pytorch_container
起動後はexecコマンドで入れます.
docker exec -it pytorch_container bash
以下のサイトを参考にするとできます.
[Docker / VSCode] VSCodeからリモートマシンのDocker情報にアクセスする
Dockerで環境構築するための最低限の概念理解
docker と docker-compose の初歩
Dockerを使って機械学習の環境を作ろうとした話
日本語自然言語処理で必須の前処理まとめ(Dockerによる環境構築込み)