model parallelism #243

HUA9803 · 2023-06-25T12:53:25Z

HUA9803
Jun 25, 2023

I would like to ask when the model can support parallelism inference?

Jun 25, 2023

Thanks for the question. All our models already supports tensor parallel execution. For example, if you have 2 GPUs, you can pass in argument --tesnor-parallel-size 2 or -tp 2. We will add documents on distributed execution (#206).

View full answer

zhuohan123 · 2023-06-25T17:07:00Z

zhuohan123
Jun 25, 2023
Maintainer

Thanks for the question. All our models already supports tensor parallel execution. For example, if you have 2 GPUs, you can pass in argument --tesnor-parallel-size 2 or -tp 2. We will add documents on distributed execution (#206).

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

model parallelism #243

{{title}}

Replies: 1 comment

{{title}}

Select a reply

model parallelism #243

HUA9803 Jun 25, 2023

Replies: 1 comment

zhuohan123 Jun 25, 2023 Maintainer

HUA9803
Jun 25, 2023

zhuohan123
Jun 25, 2023
Maintainer