Prompt Engineering aims to carefully curate input prompts that can extract the best possible results from Large language models(LLMs).
🌀 As a prominent example of LLMs, ChatGPT has received widespread attention and skyrocketed in popularity. Nonetheless, in recent years, a significant number of LLMs have emerged, typically several tens of gigabytes in size and trained on massive amounts of textual data. Therefore, there are several alternatives available that we can use to practice prompt techniques using these models.
🌟 TrustGPT can also serve as a playground for everyone's convenience to learn and practice advanced prompt techniques. You can also commit your issues from TrustGPT to this repo page. Thanks a lot.
We will gradually release the following features:
Prompt example
Question answering over your own document
Autonomous agent
Access to various LLMs
As resources are limited, we suggest using this playground for learning and practicing prompt techniques rather than for work. This will help more people access prompt engineering.
🤩 These models in the table below are directly accessible via links, The page contains the usage guide and API interface of the model for the convenience of all developers and researchers to explore and experience. The Checkpoints can also obtained by corresponding links.
Model
Type
Lab
Playgrounds
Params(B)
Blog/Paper/Github
Checkpoints
Announced Time
Gemma
Decoder
Google
🔗
2,7
Github
Gemma-2B /Gemma-7B
Feb-24
Yi series
Decoder
01.Ai
🔗
6,34
Github
Yi-34B /Yi-6B
Nov-23
InternLM
Decoder
Shanghai Artificial Intelligence Laboratory
🔗
20
Github
InternLM-20B
Aug-23
Mistral 7B
Decoder
🔗
7
Paper /Blog
Mistral-7B-v0.1
Oct-23
Llama-2
Decoder
Meta
🔗
7,13,70
Github /Paper /Blog
Llama-7B, Llama-13B, Llama-70B
Jul-23
TigerBot
Decoder
-
🔗
70
Github
TigerBot-70B
Jun-23
Falcon
Decoder
TII
🔗
1,7,40
Blog
Falcon-40B-instruct , Falcon-7B-instruct ,Falcon-RW-1B ,Falcon-RW-7B
May-23
GPT-J-6B
Decoder
EleutherAI
🔗
6
Blog
GPT-J-6B , GPT4All-J
May-23
DLite
Decoder
EleutherAI
🔗
0.124-1.5
Blog
dlite-v2-1_5b
May-23
OpenLLaMA
Decoder
H2O.AI
🔗
3,7
Github
OpenLLaMA-7b-preview-300bt
May-23
RedPajama-INCITE
Decoder
Together
🔗
3-7
Blog
RedPajama-INCITE
May-23
MPT-7B
Decoder
mosaic
🔗
7
Blog
MPT-7B , MPT-7B-Instruct
May-23
h2oGPT
Decoder
EleutherAI
🔗
12-20
Blog
h2oGPT
May-23
Dolly
Decoder
EleutherAI
🔗
3,7,12
Blog /Github
dolly-v2-12b
Apr-23
Pythia
Decoder
EleutherAI
🔗
0.07-12
Paper /Github
pythia 70M - 12B
Apr-23
FastChat-T5
Decoder
EleutherAI
🔗
3
Blog
fastchat-t5-3b-v1.0
Apr-23
StableLM-Alpha
Decoder
EleutherAI
🔗
3-65
Github
StableLM-Alpha
Apr-23
oasst-sft-6-llama-30b
Decoder
HuggingFace
🔗
30
Github
-
Apr-23
Cerebras-GPT
Decoder
HuggingFace
🔗
0.111-13
Paper
Cerebras-GPT: A Family of Open, Compute-efficient, Large Language Models
Mar-23
OpenAssistant(Pythia family)
Decoder
LAION AI
🔗
12
Paper /Github
OA-Pythia-12B-SFT-8 , OA-Pythia-12B-SFT-4 , OA-Pythia-12B-SFT-1
Apr-23
GPT-4
Decoder
OpenAI
🔗
20
Paper
-
Mar-23
OpenChatKit
Decoder
Together
🔗
20
Github
-
Mar-23
Alpaca
Decoder
Stanford
🔗
7
Github
-
Mar-23
ChatGPT
Decoder
OpenAI
🔗
175
Paper
-
Nov-22
GPT-JT
Decoder
Together
🔗
6
Github
-
Nov-22
Flan-T5
Encoder-Decoder
Google Research
🔗
11
Paper /Github
Flan-T5
Oct-22
Flan-UL2
Encoder-Decoder
Google Research
🔗
20
Paper /Github
Flan-UL2
Oct-22
CodeGeeX
Decoder
Tsinghua
🔗
13
Github
CodeGeeX register path
Sep-22
GLM-130B
Encoder-Decoder
Tsinghua & Zhipu
🔗
130
Paper /Github
-
Aug-22
BLOOM(tr11-176B-ml)
Decoder
BigScience
🔗
176
Github
BLOOM
Jul-22
PaLM
Decoder
Google Research
🔗
540
Paper
-
Apr-22
GPT-NeoX-20B
Decoder
EleutherAI
🔗
20
Paper
GPT-NEOX-20B
Apr-22
CodeT5
Encoder-Decoder
Salesforce Research Asia
🔗
small:0.06,base:0.22
Paper
-
Mar-22
ERNIE3.0
Encoder-Decoder
Baidu
🔗
10
Paper
-
Dec-21
CodeX
Decoder
OpenAI
🔗
12
Paper
-
Aug-21
RWKV
Decoder
OpenAI
🔗
0.1-14
Github
RWKV, ChatRWKV
Aug-21
GPT-3
Decoder
OpenAI
🔗
175
Paper
-
May-20
T5
Encoder-Decoder
Google
🔗
11
Paper
T5
Oct-19
RoBERTa
Encoder
MetaAI
🔗
0.355
Paper
roberta-series
Jul-19
GPT-2
Decoder
OpenAI
🔗
1.5
Paper
GPT_2 Series
Feb-19
BERT
Encoder
Google
🔗
0.3
Paper
BERT Series
Oct-18
GPT-1
Decoder
OpenAI
🔗
0.117
Paper
GPT_1_seriers
Jun-18
Providing the Pre-train weights
🤨 The models in the table below all provide pre-trained weights on which developers can fine-tune (without changing the original backbone architecture), and people can visually see the work of a good team of researchers by using the pre-trained weights of the models directly for a good Demo.
Model
Type
Lab
Github
Params(B)
Paper/Code
Announced Time
Gorilla-OpenFunctions series
Decoder
Gorilla LLM
🔗
-
Paper /Github
-
LLaMA-65B
Decoder
MetaAI
🔗
65
Paper /Code
Feb-23
OPT-IML
Decoder
MetaAI
🔗
175
Paper /-
Dec-22
ERNIE-Code
Encoder-Decoder
Baidu
🔗
0.56
Paper /-
Dec-22
Galactica
Decoder
MetaAI
🔗
120
Paper /-
Nov-22
mT0
Encoder-Decoder
BigScience
🔗
13
Paper /-
Nov-22
BLOOMZ
Decoder
BigScience
🔗
176
Paper /-
Nov-22
Atlas
Encoder-Decoder
MetaAI
🔗
11
Paper /-
Aug-22
OPT-175B
Decoder
MetaAI
🔗
175
Paper /-
May-22
RETRO
Encoder-Decoder
DeepMind
🔗
7.5
Paper /-
Dec-21
FLAN
Encoder-Decoder
Google
🔗
137
Paper /-
Sep-21
Without Opensource Till Now
😣 The following table show that the related models and codes are not open-source till now.
Model
Type
Lab
Report
Params(B)
Paper/Code
Announced Time
Med-PaLM
Encoder
Google & DeepMind
🔗
540
Paper /-
Dec-22
GLaM
Encoder
Google Inc
🔗
1200
Paper /-
Dec-22
RL-CAI
Encoder
Anthropic
🔗
52
Paper /-
Dec-22
Sparrow
Decoder
DeepMind
🔗
70
Paper /-
Sep-22
PaLI
Encoder-Decoder
Google
🔗
17
Paper /-
Sep-22
Gato(Cat)
Encoder-Decoder
DeepMind
🔗
1
Paper /-
May-22
Chinchilla
Encoder
DeepMind
🔗
70
Paper /-
Mar-22
Gopher
Encoder
DeepMind
🔗
280
Paper /-
Dec-21
LaMDA
Decoder
GoogleAI
🔗
137
Paper /-
Jun-21
🎭 The following table shows the LLMs for Coding.
📈 The following table shows the Dataset of the LLM area, with instruction-tunning and alignment-tuning.
Dataset
Paper/Blog
Dataset
Samples (K)
Announced Time
Type
MPT-7B-Instruct
Blog
dolly_hhrlhf
59
May-23
instruction-tuning
databricks-dolly-15k
Blog
databricks-dolly-15k
15
Apr-23
instruction-tuning
OpenAssistant Conversations Dataset
Blog
oasst1
161
Apr-23
alignment-tuning
OIG (Open Instruction Generalist)
Blog
OIG
44,000
Mar-23
instruction-tuning
🇨🇳 The following table shows the LLMs from China, including the research lab, firms, and some universities.
Note: The part of contents of the list are from here , and we have made appropriate modifications and supplements, hereby noted.
Source
Model & Link
Description
复旦大学
MOSS
Playground
贝壳
BELLE
基于BLOOMZ或LLaMA 系列的多个模型
哈尔滨工业大学
本草
医学;基于LLaMA ;另有基于 ChatGLM 的Med-ChatGLM
云知声
山海
通用大模型
百度
文心一言
申请账号
科大讯飞
星火
申请账号
清华大学
ChatGLM ,NowcastNet
开源6B ,ChatGLM2-6B , 智谱AI ,气象,临近预报大模型
华为
盘古 ,盘古气象 ,盘古-Σ
华为+鹏城,华为云盘古
达观数据
曹植
试用需账号
阿里云
通义千问
试用需账号
浙江大学
启真 ,PromptProtein
医学大模型提供基于LLaMA-7B、CaMA-13B和ChatGLM-6B 三个版本,用于PromptProtein的模型
百川智能
baichuan-7B ,Baichuan-13B
模型下载:Baichuan-13B-Base ,Baichuan-13B-Chat ,Baichuan-7B ,开源可商用
上海人工智能实验室
书生·浦语 , OpenMEDLab浦医
技术报告 ,开源的InternLM-7B ,HuggingFace下载模型权重
OpenBMB
CPM ,CPM-Bee
面壁智能 ,CPM-Bee-10B
港中文深圳
华佗 ,凤凰
香港中文大学(深圳)和深圳市大数据研究院,医学,Demo ,华佗和凤凰都基于BLOOMZ
中国科学院自动化研究所
紫东·太初
紫东太初2.0号称100B参数,全模态
虎博科技
TigerBot
基于BLOOM
东北大学
TechGPT ,PICA
TechGPT->BELLE->LLaMA ,图谱构建和阅读理解问答;PICA->ChatGLM2-6B情感大模型
上海交通大学
K2 ,白玉兰
Demo ,GeoLLaMA,基于LLaMA ,HuggingFace
IDEA研究院
封神榜MindBot
姜子牙 系列模型
智源人工智能研究院
悟道·天鹰 ,悟道·EMU
悟道3.0,视界视觉,AQUILA天鹰座,Aquila-7B ,AquilaChat-7B ,AquilaCode-7B-NV ,AquilaCode-7B-TS ,HuggingFace ,EMU 基于LLaMA
度小满
轩辕
基于BLOOM
23
360
智脑 ,一见
艾写科技
Anima
基于Guanaco->基于LLaMA ,使用QLoRA
西湖心辰
西湖
通用大模型
晓多科技+国家超算成都中心
晓模型XPT
试用需要账号,位置
稀宇科技
MiniMax
GLOW虚拟社交
北京语言大学
桃李
基于LLaMA ,北语+清华+东北、北京交大
商汤科技
SenseNova日日新
商汤科技版ChatGPT
国家超级计算天津中心
天河天元
目前官网查询不到
星环科技
无涯、求索
无涯——金融;求索——大数据分析
慧言科技+天津大学
海河·谛听
-
恒生电子
LightGPT
-
电信智科
星河
通用视觉,中国电信
左手医生
左医GPT
医疗,试用需Key
智慧眼
砭石
医疗领域
好未来
MathGPT
学而思
数慧时空
长城
自然资源,遥感
理想科技
大道Dao
运维大模型
硅基智能
炎帝
旅游行业大模型
中工互联
智工
与复旦NLP实验室联合,工业领域
创业黑马
天启
创业黑马与360合作,科创服务行业
追一科技
博文Bowen
-
上海科技大学
DoctorGLM
医学大模型,论文
华东师范大学
EmoGPT ,EduChat
EmoGPT是上海市心理健康与危机干预重点实验室与镜象科技公司合作完成, 教学教育大模型EduChat基于BELLE(BELLE基于LLaMA)
昆仑万维
天工
与奇点智源联合研发
智媒开源研究院
智媒
基于LLaMA,面向自媒体
医疗算网
Uni-talk
上海联通+华山医院+上海超算中心+华为
蚂蚁集团
贞仪
据传语言和多模态两个
香港科技大学
罗宾Robin
基于LLaMA ,港科大开源LMFlow
腾讯
混元
-
拓尔思
拓天
中文通用大模型
乐言科技
乐言
TRSGPT
清博智能
先问
基于结构化数据
智子引擎
元乘象
手机号快速登录,使用方便
拓世科技
拓世
数万亿参数量,通用领域
循环智能
盘古
循环智能,清华大学,华为
印象笔记
大象GPT
AGI智能化产品
第四范式
式说
以生成式AI重构企业软件(AI-Generated Software),提升企业软件的体验和开发效率。
字节跳动
Grace
内部代号
出门问问
序列猴子
AI写作助理大模型
数说故事
SocialGPT
聚焦社交对话大模型
云从科技
从容
通用大模型
浪潮信息
源
论文支撑——源
中国农业银行
小数ChatABC
金融行业大模型
麒麟合盛
天燕AiLMe
需要账号登录,登录位置
台智云
福尔摩斯FFM
华硕子公司
医联科技
medGPT
国内首款AI医生
理想汽车
MindGPT
-
深思考人工智能
Dongni
登录需要账号
长虹
长虹超脑
-
孩子王
KidsGPT
-
中科闻歌
雅意
媒体、金融、宣传等领域的大模型应用
中国联通
鸿湖
-
思必驰
DFM-2
通用大模型
中科创达
魔方Rubik
-
电科太极
小可
党政企行业应用
中国移动
九天
-
中国电信
TeleChat
-
容联云
赤兔
客服,营销
云天励飞
天书
-
维智科技
CityGPT
城市大模型
澜舟科技
孟子
自研大规模预训练语言模型
京东
言犀
面向不同过产业大模型
智臻智能
华藏
小i机器人
新华三H3C
百业灵犀
-
鹏城实验室
鹏城·脑海
Peng Cheng Mind
宇视科技
梧桐
AIoT行业
网易有道
子曰
-
美亚柏科
天擎
公共安全
赛灵力科技
达尔文
赛灵力,清华珠三角研究院,赛业生物,大湾区科技创新服务中心
佳都科技
佳都知行
交通领域
知乎
知海图
知乎和面壁科技合作
实在智能
塔斯
TARS
网易伏羲
玉言
-
北京大学信息工程学院
ChatLaw
ChatLaw-13B 基于Ziya-LLaMA-13B-v1->LLaMA,ChatLaw-33B 基于Anima33B->Guanaco->LLaMA
华南理工大学
扁鹊 ,灵心SoulChat
医疗大模型
中国科学院计算技术研究所
百聆
基于 LLaMA ,权重Diff下载7B 和13B ,demo
沪渝人工智能研究院
兆言
也称:上海交通大学重庆人工智能研究院
企查查
知彼阿尔法
-
超对称技术公司
乾元
BBT-1-1B金融模型,BBT-2-12B-TF金融模型,BBT-2-12B-TC代码模型,BBT-2-12B-Image文生图模型,BBT-2-12B-Science科学论文模型,BBT-2.5-13B-Text中英双语基础模型
清睿智能
ArynGPT
英语智能对话口语老师
微盟
WAI
-
蜜度
文修
智能校对
中国电子云
星智
政务大模型
西北工业大学+华为
秦岭·翱翔
流体力学大模型,湍流+流场
奇点智源
Singularity OpenAPI
瑶光和天枢
联汇科技
欧姆
OmModel欧姆多模态(视觉语言)大模型
阅文集团
网文大模型
国内首个网文行业大模型
北京交通大学
TransGPT
国内首个综合交通领域的大模型
Please keep adding relevant information, we greatly appreciate your contributions.