mPLUG-2: A Modularized Multi-modal Foundation Model Across Text, Image and Video (Haiyang Xu, Qinghao Ye, Ming Yan, Yaya Shi, Jiabo Ye, Yuanhong Xu, Chenliang Li, Bin Bi, Qi Qian, Wei Wang, Guohai Xu, Ji Zhang, Songfang Huang, Fei Huang, Jingren Zhou)

vision/text/image-text/video-text 통합 모델이군요.

#multimodal

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

230201 mPLUG-2.md

230201 mPLUG-2.md

Files

230201 mPLUG-2.md

Latest commit

History

230201 mPLUG-2.md

File metadata and controls