diff --git a/en/docs/03.md b/en/docs/03.md index 63d694397..a43a91245 100644 --- a/en/docs/03.md +++ b/en/docs/03.md @@ -113,8 +113,8 @@ The major options of the `qsub` and the `qrsh` command are follows. | Option | Description | |:--|:--| | -g *group* | Specify ABCI user group | -| -l *resource_type*[=*number*] | Specify resource type (mandatory) | -| -l h_rt=[[*HH:*]*MM:*]*SS*] | Specify elapsed time by [[*HH:*]*MM:*]*SS*. When execution time of job exceed specified time, job is rejected. | +| -l *resource_type*=*number* | Specify resource type (mandatory) | +| -l h_rt=[*HH:MM:*]*SS* | Specify elapsed time by [*HH:MM:*]*SS*. When execution time of job exceed specified time, job is rejected. | | -N *name* | Specify job name. default is name of job script. | | -o *stdout_name* | Specify standard output stream of job | | -p *priority* | Specify POSIX priority for Spot service | @@ -133,7 +133,7 @@ To execute an interactive job, use the `qrsh` command. If ABCI point is insufficient when executing interactive job, execution is failed. ``` -$ qrsh -g ABCI_UserGroup -l Resource_type[=number] [option] +$ qrsh -g ABCI_UserGroup -l Resource_type=number [option] ``` @@ -349,7 +349,7 @@ jc_name NONE ``` The major fields of accounting information are follows. -For more detail, use `man accounting` command. +For more detail, use `man sge_accounting` command. | Field | Description | |:--|:--| @@ -360,7 +360,7 @@ For more detail, use `man accounting` command. | end_time | Job end time | | failed | Job end code managed by job scheduler | | exit_status | Job end status | -| ru_wallclock | Job running time(include pre/post process) | +| wallclock | Job running time(include pre/post process) | ### 3.5.6. Environment Variable diff --git a/en/docs/04.md b/en/docs/04.md index f914f6030..587278f66 100644 --- a/en/docs/04.md +++ b/en/docs/04.md @@ -89,7 +89,7 @@ Note that the amount of the local storage you can use is determined by "Resource The set of NVMe storages of job assigned compute nodes can be used as a distributed shared file system (BeeGFS) on demand. -When using on demand BeeGFS (BeeOND), you need to submit job with `-l USE_BEEOND` option. +When using on demand BeeGFS (BeeOND), you need to submit job with `-l USE_BEEOND=1` option. And you need to specify `-l rt_F` option in this case, because node must be exclusively allocated to job. The created distributed shared file system area can be accessed from /beeond. @@ -100,7 +100,7 @@ Example) sample of job script(use_beeond.sh) #!/bin/bash #$-l rt_F=2 -#$-l USE_BEEOND +#$-l USE_BEEOND=1 #$-cwd echo test1 > /beeond/foo.txt diff --git a/en/docs/09.md b/en/docs/09.md index a3feea706..04768b8d5 100644 --- a/en/docs/09.md +++ b/en/docs/09.md @@ -69,13 +69,9 @@ When you use Docker, you need to set up user environment by the `module` command The available Docker image can be referred by `show_docker_images` command. ``` -[username@es1 ~]$ show_docker_imags +[username@es1 ~]$ show_docker_images REPOSITORY TAG IMAGE ID CREATED SIZE jcm:5000/dhub/ubuntu latest 113a43faa138 3 weeks ago 81.2MB -jcm:5000/ngc/digits 18.05 6a1f6f779ee7 6 weeks ago 6.3GB -jcm:5000/ngc/cntk 18.05-py3 fc80364bb960 8 weeks ago 6.35GB -jcm:5000/ngc/theano 18.05 152676dfc545 8 weeks ago 3.86GB -jcm:5000/ngc/caffe2 18.05-py3 c60b8604c4bb 8 weeks ago 3.18GB ``` !!! warning @@ -92,7 +88,7 @@ The following job script executes `python3 ./test.py` on Docker container. #$-j y #$-l rt_F=1 #$-l docker=1 -#$-l docker_images="*jcm:5000/ngc/caffe2:18.05-py3*" +#$-l docker_images="*jcm:5000/dhub/ubuntu*" python3 ./sample.py ``` diff --git a/en/docs/index.md b/en/docs/index.md index 21d81049b..debf7ba6b 100644 --- a/en/docs/index.md +++ b/en/docs/index.md @@ -5,4 +5,4 @@ All users who use this system are strongly recommended to read this document, as !!! notte - Please check restrictions before using. + Please check "Known issues" before using. diff --git a/en/docs/known-issues.md b/en/docs/known-issues.md new file mode 100644 index 000000000..71c13ddf9 --- /dev/null +++ b/en/docs/known-issues.md @@ -0,0 +1,8 @@ +# Known Issues + +|date|content|status| +|:--|:--|:--| +|2019/04/10| The following qsub option requires to specify argument due to job scheduler update (8.5.4 -> 8.6.3).
resource type ( -l rt_F etc)
$ qsub -g GROUP -l rt_F=1
$ qsub -g GROUP -l rt_G.small=1|close| +|2019/04/10| The following qsub option requires to specify argument due to job scheduler update (8.5.4 -> 8.6.3).
use BEEOND ( -l USE_BEEOND)
$ qsub -g GROUP -l rt_F=2 -l USE_BEEOND=1|close| +|2019/04/05| Due to job scheduler update (8.5.4 -> 8.6.3), a comupte node can execute only up to 2 jobs each resource type "rt_G.small" and "rt_C.small" (normally up to 4 jobs ).This situation also occures with Reservation service, so to be careful when you submit job with "rt_G.small" or "rt_C.small".
$ qsub -ar ARID -l rt_G.small=1 -g GROUP run.sh (x 3 times)
$ qstat
job-ID prior name user state
--------
478583 0.25586 sample.sh username r
478584 0.25586 sample.sh username r
478586 0.25586 sample.sh username qw|open| + diff --git a/en/docs/restriction.md b/en/docs/restriction.md deleted file mode 100644 index 07ee5e731..000000000 --- a/en/docs/restriction.md +++ /dev/null @@ -1,7 +0,0 @@ -# Restriction - -|date|restriction|status| -|:--|:--|:--| -|2019/04/05|Because of job scheduler trouble, a comupte node can execute only up to 2 jobs each resource type "rt_G.small" and "rt_C.small" (normally up to 4 jobs ).This situation also occures with Reservation service, so to be careful when you submit job with "rt_G.small" or "rt_C.small".
$ qsub -ar ARID -l rt_G.small=1 -g GROUP run.sh (x 3 times)
$ qstat
job-ID prior name user state
--------
478583 0.25586 sample.sh username r
478584 0.25586 sample.sh username r
478586 0.25586 sample.sh username qw|open| - - diff --git a/en/mkdocs.yml b/en/mkdocs.yml index 5716f9213..5f18d75cf 100644 --- a/en/mkdocs.yml +++ b/en/mkdocs.yml @@ -24,7 +24,7 @@ nav: - '13. AWS': '13.md' - 'Appendix 1. Configuration of Installed Software': 'appendix1.md' - 'Appendix 2. Use of ABCI System for HPCI ': 'appendix2.md' - - 'Restriction': 'restriction.md' + - 'Known Issues': 'known-issues.md' - 'System Updates': 'system-updates.md' - 'Privacy Policy': 'https://portal.abci.ai/docs/privacy-policy/' theme: diff --git a/ja/docs/03.md b/ja/docs/03.md index 7518e19a3..887973d9a 100644 --- a/ja/docs/03.md +++ b/ja/docs/03.md @@ -112,8 +112,8 @@ Reservedサービス毎の使用ABCIポイントの計算式は以下の通り | オプション | 説明 | |:--|:--| | -g *group* | ABCI利用グループを*group*で指定します。 | -| -l *resource_type*[=*num*] | 資源タイプ*resource_type*と、その個数*num*を指定します。本オプションは指定必須です。 | -| -l h_rt=[[*HH:*]*MM:*]*SS* | 経過時間制限値を指定します。[[*HH:*]*MM:*]*SS*で指定することができます。ジョブの実行時間が指定した時間を超過した場合、ジョブは強制終了されます。 | +| -l *resource_type*=*num* | 資源タイプ*resource_type*と、その個数*num*を指定します。本オプションは指定必須です。 | +| -l h_rt=[*HH:MM:*]*SS* | 経過時間制限値を指定します。[*HH:*MM:*]*SS*で指定することができます。ジョブの実行時間が指定した時間を超過した場合、ジョブは強制終了されます。 | | -N *name* | ジョブ名を*name*で指定します。デフォルトは、ジョブスクリプト名です。 | | -o *stdout_name* | 標準出力名を*stdout_name*で指定します。 | | -p *priority* | SpotサービスでPOSIX優先度を*priority*で指定します。 | @@ -132,7 +132,7 @@ Reservedサービス毎の使用ABCIポイントの計算式は以下の通り インタラクティブジョブ実行時にABCIポイントが不足している場合、インタラクティブジョブの実行に失敗します。 ``` -$ qrsh -g group -l resource_type[=num] [options] +$ qrsh -g group -l resource_type=num [options] ``` @@ -357,7 +357,7 @@ jc_name NONE ``` 主な表示項目は以下の通りです。 -その他項目の詳細は`man accounting`を参照ください。 +その他項目の詳細は`man sge_accounting`を参照ください。 | 項目 | 説明 | |:--|:--| @@ -368,7 +368,7 @@ jc_name NONE | end_time | ジョブの実行終了時刻 | | failed | ジョブスケジューラのジョブ終了コード | | exit_status | ジョブの終了ステータス | -| ru_wallclock | ジョブの実行時間(前後処理を含む) | +| wallclock | ジョブの実行時間(前後処理を含む) | ### 3.5.6. 環境変数 diff --git a/ja/docs/04.md b/ja/docs/04.md index bb2f63ebf..680ede45a 100644 --- a/ja/docs/04.md +++ b/ja/docs/04.md @@ -93,7 +93,7 @@ ABCIシステムでは各計算ノードに 1.6TB の NVMe ストレージが搭 ジョブに割り当てられたすべての計算ノードの NVMe ストレージを、 分散共有ファイルシステム(BeeGFS)としてオンデマンドで利用できます。 オンデマンドの BeeGFS(BeeOND)を利用するジョブを投入するときは、 -`-l USE_BEEOND`オプションを指定する必要があります。 +`-l USE_BEEOND=1`オプションを指定する必要があります。 また、BeeONDを利用する場合はノードを占有する必要があるため、 `-l rt_F`オプションを指定する必要もあります。 @@ -105,7 +105,7 @@ ABCIシステムでは各計算ノードに 1.6TB の NVMe ストレージが搭 #!/bin/bash #$-l rt_F=2 -#$-l USE_BEEOND +#$-l USE_BEEOND=1 #$-cwd echo test1 > /beeond/foo.txt diff --git a/ja/docs/09.md b/ja/docs/09.md index 085e942f0..6f43d7f49 100644 --- a/ja/docs/09.md +++ b/ja/docs/09.md @@ -68,13 +68,9 @@ Dockerを利用する場合、ジョブ投入時に`-l docker`オプションと 利用可能なDockerイメージは`show_docker_images`コマンドで参照可能です。 ``` -[username@es1 ~]$ show_docker_imags +[username@es1 ~]$ show_docker_images REPOSITORY TAG IMAGE ID CREATED SIZE jcm:5000/dhub/ubuntu latest 113a43faa138 3 weeks ago 81.2MB -jcm:5000/ngc/digits 18.05 6a1f6f779ee7 6 weeks ago 6.3GB -jcm:5000/ngc/cntk 18.05-py3 fc80364bb960 8 weeks ago 6.35GB -jcm:5000/ngc/theano 18.05 152676dfc545 8 weeks ago 3.86GB -jcm:5000/ngc/caffe2 18.05-py3 c60b8604c4bb 8 weeks ago 3.18GB ``` !!! warning @@ -91,7 +87,7 @@ Dockerジョブのジョブスクリプト例) #$-j y #$-l rt_F=1 #$-l docker=1 -#$-l docker_images="*jcm:5000/ngc/caffe2:18.05-py3*" +#$-l docker_images="*jcm:5000/dhub/ubuntu*" python3 ./sample.py ``` diff --git a/ja/docs/index.md b/ja/docs/index.md index 340535012..dceb4561a 100644 --- a/ja/docs/index.md +++ b/ja/docs/index.md @@ -6,4 +6,4 @@ !!! note - ご利用の際には、制限事項の項目も併せてご確認ください。 + ご利用の際には、"既知の問題" も併せてご確認ください。 diff --git a/ja/docs/known-issues.md b/ja/docs/known-issues.md new file mode 100644 index 000000000..e2d84938f --- /dev/null +++ b/ja/docs/known-issues.md @@ -0,0 +1,7 @@ +# 既知の問題 + +|日時|内容|状況| +|:--|:--|:--| +|2019/04/10|ジョブスケジューラのアップデート(8.5.4 -> 8.6.3)に伴い、以下のジョブ投入オプションは引数が必須になりました。
リソースタイプ(-l rt_F等)
$ qsub -g GROUP -l rt_F=1
$ qsub -g GROUP -l rt_G.small=1|対応完了| +|2019/04/10|ジョブスケジューラのアップデート(8.5.4 -> 8.6.3)に伴い、以下のジョブ投入オプションは引数が必須になりました。BEEOND使用する場合は、-l USE_BEEONDオプションに"1"を省略せず指定してください。
BEEOND 実行 (-l USE_BEEOND)
$ qsub -g GROUP -l rt_F=2 -l USE_BEEOND=1|対応完了| +|2019/04/05|通常計算ノードで rt_C.small/rt_G.small はそれぞれ最大で4ジョブまで実行されますが、ジョブスケジューラの不具合により、それぞれ最大2ジョブまでしか実行できない事象が発生しています。
Reservedサービスでも同様の事象が発生しており、rt_C.small/rt_G.small を使用の場合はご注意ください。
$ qsub -ar ARID -l rt_G.small=1 -g GROUP run.sh (x 3回)
$ qstat
job-ID prior name user state
--------
478583 0.25586 sample.sh username r
478584 0.25586 sample.sh username r
478586 0.25586 sample.sh username qw|対応中| diff --git a/ja/docs/restriction.md b/ja/docs/restriction.md deleted file mode 100644 index cf79f7bc3..000000000 --- a/ja/docs/restriction.md +++ /dev/null @@ -1,5 +0,0 @@ -# 制限事項 - -|日時|制限事項|状況| -|:--|:--|:--| -|2019/04/05|通常計算ノードで rt_C.small/rt_G.small はそれぞれ最大で4ジョブまで実行されますが、ジョブスケジューラの不具合により、それぞれ最大2ジョブまでしか実行できない事象が発生しています。
Reservedサービスでも同様の事象が発生しており、rt_G.small/rt_G.small を使用の場合はご注意ください。
$ qsub -ar ARID -l rt_G.small=1 -g GROUP run.sh (x 3回)
$ qstat
job-ID prior name user state
--------
478583 0.25586 sample.sh username r
478584 0.25586 sample.sh username r
478586 0.25586 sample.sh username qw|対応中| diff --git a/ja/mkdocs.yml b/ja/mkdocs.yml index b5e656b4a..37c867db0 100644 --- a/ja/mkdocs.yml +++ b/ja/mkdocs.yml @@ -24,7 +24,7 @@ nav: - '13. AWS の利用': '13.md' - '付録1. インストール済みソフトウェアの構成': 'appendix1.md' - '付録2. HPCIによるABCIシステム利用': 'appendix2.md' - - '制限事項': 'restriction.md' + - '既知の問題': 'known-issues.md' - 'システム更新履歴': 'system-updates.md' - 'プライバシーポリシー': 'https://portal.abci.ai/docs/privacy-policy/' theme: