有一群军情六处的黑客试图独自重建 GPT 3 号。
今年早些时候,EleutherAI 发布了他们的 pile 数据集( 825 GB 英语文本语料库,旨在训练大规模语言模型 ) 论文,这让数据爱好者们议论纷纷。这一突破解决了数据问题,现在他们只需要计算:👇
他们正在使用 Tensorflow 的网格库来构建它。我们祝他们好运。或者就像他们的回购协议上写的那样:要么我死,要么我亡。
github.com](https://github.com/EleutherAI/gpt-neo)
他们的不和谐服务器:
discord.com](https://discord.com/invite/BK2v3EJ)
哦,你好,火星!👽
解密的
如果你喜欢这本书,请帮帮我们👏👏并与朋友分享🙈。
如果您想了解 PyTorch 和 Ray 的最新分布式培训,这是一个有益的介绍:
medium.com](https://medium.com/pytorch/getting-started-with-distributed-machine-learning-with-pytorch-and-ray-fd83c98fdead)
“Transformers interpret 允许用两行代码解释任何变形金刚模型。它甚至支持笔记本和可保存的 html 文件中的可视化。”
例如,如果你对下面的句子进行情感分析:
“我爱你,我喜欢你”
这个输出👇会告诉你哪些词对推理影响最大。
[('BOS_TOKEN ',0.0), (' I ',0.46820529249283205), (' love ',0.46061853275727177), (' you ',0.566412765400519), ('。
然后用一行代码将其可视化:
cls_explainer.visualize("distilbert_viz.html")
github.com](https://github.com/cdpierse/transformers-interpret)
“ConvLab-2 是一个开源工具包,使研究人员能够使用最先进的模型构建面向任务的对话系统,执行端到端评估,并诊断系统的弱点。”
[## ConvLab-2
convlab.github.io](https://convlab.github.io/)
QuestGen 图书馆的创建者,Ramsri Golla,在 Udemy 上有一门新课程!
我有一张优惠券,你可以用在他的项目上。如果您感兴趣,以下是对您将学到的内容的描述:
- 使用最先进的自然语言处理技术从任何内容中生成评估,如 mcq、是非题等。
- 应用最新进展,如 BERT、OpenAI GPT-2 和 T5 变压器,解决 edtech 中的实际问题。
- 使用 NLP 库,如 Spacy,NLTK,AllenNLP,HuggingFace transformers 等。
- 使用 Google Colab 环境运行所有这些算法。
- 4 小时点播视频🤖
优惠券七五折:
麻省理工学院的电子工程和计算机科学课程。
ocw.mit.edu](https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/)
描述维基百科 API 起源的文章,维基媒体基金会(WMF)最初没有一个整体 API 策略的问题,以及他们对这个问题的解决方案。API 于 2020 年 12 月完成。
evanprodromou.wordpress.com](https://evanprodromou.wordpress.com/2021/02/18/the-new-api-for-wikipedia/)
源代码:
github.com](https://github.com/wikimedia/apiclient-wiki)
包括代码…希望你喜欢 YML 文件。😁
juliensalinas.com](https://juliensalinas.com/en/container-orchestration-docker-swarm-nlpcloud/)
不可复制的文件开始生活的地方…
[## 没有代码的文件——不可复制文件的生存之地
不可复制的文件来到 livewww.paperswithoutcode.com](https://www.paperswithoutcode.com/)
一个新的问答配对检索器模型,RePAQ,补充了可能问的问题(PAQ),一个 6500 万自动生成的问答配对的资源。
github.com](https://github.com/facebookresearch/PAQ)
连接论文 📈
使用两种方法进行抽象概括:
1.JAENS:联合实体和摘要生成
2.有摘要价值的实体分类和摘要(多任务学习)
这种方法感兴趣的是处理抽象摘要中实体的事实一致性,这是一个正在进行的研究问题。
在公平序列上运行
github.com](https://github.com/amazon-research/fact-check-summarization)
连接论文 📈
用表情数据训练情感分析的变形金刚。
这是情绪任务中基于表情符号的迁移学习的存储库。https://arxiv.org/abs/2102.06423 数据集…
github.com](https://github.com/uds-lsv/emoji-transfer)
连接论文 📈
知识图和文本数据的远程监督关系抽取。
github.com](https://github.com/baodaiqin/UGDSRE)
连接论文 📈
通过将 Apache 日志的解析任务公式化为机器翻译(MT)任务来实现解析任务的自动化。
github.com](https://github.com/WulffHunter/log_generator)
连接论文 📈
新的问答评测基准。考虑 QA 模型的部署如何影响性能。例如,语音、文本或翻译等 QA 界面会引发大多数评估基准不考虑的独特推理错误。
noiseqa.github.io](https://noiseqa.github.io/)
连接论文 📈
基于变压器的模型在 CPU 上推理的可扩展性和性能的实证分析。
[## 优化变压器在 CPU 上的推理性能
arxiv.org](https://arxiv.org/abs/2102.06621)
连接论文 📈
简明介绍 GPT,伯特和 NLG XLNET 的变形金刚。
连接论文 📈
一个将人类情感与艺术作品联系起来的数据集,包含了用自然语言对每种被触发的情感背后的基本原理的解释。
www.artemisdataset.org](https://www.artemisdataset.org/#dataset)
每周日,我们都会对来自世界各地研究人员的 NLP 新闻和代码进行一次每周综述。
如需完整报道,请关注我们的 Twitter: @Quantum_Stat