凯尔·格伦在 Unsplash 上的照片
欢迎回来!因此,ACL 2020 今天正式启动,技术窥视者已经开始展示他们的研究。我将在一周内关注 ACL 的所有事情,因此请确保关注我们的 Twitter 更新: Quantum Stat。
脸书在 ACL:
ai.facebook.com](https://ai.facebook.com/blog/facebook-research-at-acl-2020/)
IBM at ACL:
[## IBM 在 ACL 2020 上的研究| IBM 研究博客
www.ibm.com](https://www.ibm.com/blogs/research/2020/07/ibm-research-at-acl-2020/)
哦,最后但同样重要的是,2020 年正式成为有记录以来最奇怪的一年:坎耶·韦斯特正在竞选总统。
埃隆就像:
拜登的竞选经理是这样的:
祝在美国庆祝的人们 7 月 4 日快乐!🎇🎆
FastAPI 和 Streamlit
RASA 对话人工智能
软件更新
文本英雄
智能回复来 YouTube
羊驼蹼套
重整器系列
本周数据集:敌对的 NLI
牛逼的新 GitHub,自带全栈后端(fastAPI)和前端(Streamlit)。你可以直接提供这个框架,如果你想跳出 flask WSGI 框架,深入了解 ASGI 的方方面面,这是一个不错的选择。
FastAPI 和 Streamlit 都可以通过 Docker Compose 进行桥接:
version: '3'
services:
fastapi:
build: fastapi/
ports:
- 8000:8000
networks:
- deploy_network
container_name: fastapi
streamlit:
build: streamlit/
depends_on:
- fastapi
ports:
- 8501:8501
networks:
- deploy_network
container_name: streamlit
networks:
deploy_network:
driver: bridge
博客:
[## 使用 FastAPI 和 streamlit 在 Python 中服务的机器学习模型
davidefiocco.github.io](https://davidefiocco.github.io/2020/06/27/streamlit-fastapi-ml-serving.html)
Github:
[## davidefiocco/streamlit-fastapi-模型服务
github.com](https://github.com/davidefiocco/streamlit-fastapi-model-serving/)
在讨论对话式人工智能时,RASA 的联合创始人 Alan Nichol 讨论了我们都应该努力实现的聊天机器人技术的 5 个级别,特别是圣杯:级别 5 又称 HAL 9000。对话式人工智能的 5 个层次是从最终用户和开发者的角度来观察的。有趣的阅读可以得到 RASA 认为聊天机器人前进方向的路线图,以及让 HAL 登上 Elon 的星舰需要什么。
博客:
blog.rasa.com](https://blog.rasa.com/5-levels-of-conversational-ai-2020-update/)
张量流:
[## 发布 tensor flow 2 . 3 . 0-rc0 tensor flow/tensor flow
github.com](https://github.com/tensorflow/tensorflow/releases/tag/v2.3.0-rc0)
🤗高频:
[## 发布新的 tokenizer API、TensorFlow 改进、增强的文档和教程…
github.com](https://github.com/huggingface/transformers/releases/tag/v3.0.0)
附言拥抱脸给他们的模型中心添加了一个很棒的端点 API,这样你就可以用社区的模型进行推理了。这里有一个蒸馏瓶的例子:
huggingface.co](https://huggingface.co/distilbert-base-uncased)
DeepPavlov:
[## 走近梦想:宣布我们新的 DeepPavlov🎅0.11.0 发布!
deeppavlov.ai](http://deeppavlov.ai/blog/tpost/22tid6u13h-deeppavlov-library-0110-release)
一个新的 NLP 数据集库出来了,它被称为文本英雄。您可以使用它进行出色的预处理和数据集可视化。目前它的一些工具:
预处理文本数据:它既提供了开箱即用的解决方案,也为定制解决方案提供了灵活性。
自然语言处理:关键短语和关键词提取,命名实体识别等等。
文本表示:TF-IDF、词频、预训练和自定义单词嵌入。
向量空间分析:聚类(K-means,Meanshift,DBSAN 和 Hierarchical),主题建模(LDA 和 LSI)和解释。
文本可视化:关键词可视化,向量空间可视化,地图上地点定位。
仅用 3 行代码就可以可视化数据集的向量空间!
GitHub:
github.com](https://github.com/jbesomi/texthero)
博客:
[## Texthero 文本预处理,从零到英雄的表示和可视化。
从零到 hero.texthero.org 的文本预处理、表示和可视化](https://texthero.org/)
当你想加快回复邮件的速度时,智能回复功能非常棒。现在,SmartReply 正走向 YouTube,它基于字符/字节级语言建模的最新进展:
论文:https://www.aaai.org/ojs/index.php/AAAI/article/view/4182
目前,SmartReply 有英语和西班牙语版本,只会根据谷歌是否认为创作者可能会回复以及他们认为模型何时可以给出合理的评论来选择性地进行提示。🧐
让我们看看这一个是如何进行的:
ai.googleblog.com](https://ai.googleblog.com/2020/07/smartreply-for-youtube-creators.html)
今年,我偶然发现了一个很棒的金融市场数据 API:羊驼。而我之所以是粉丝,是因为它免费提供实时的市场数据流。我只想说这很少见,我不知道还有其他 API 提供免费的流媒体端点。如果我错了,请在评论里给我爆料。如果你想知道一个设置它的好教程,请看这里:
文档:
羊驼市场](https://alpaca.markets/docs/api-documentation/api-v2/market-data/streaming/)
如果你想深入了解是什么让改革者成功,看看拥抱脸的这 4 个 Colab 教程。讨论如下:
- 改革者自我关注层——如何有效地实施自我关注,而不受当地环境的限制? = >见本可乐。
- 分块前馈层 — 对于大型前馈层,如何获得更好的时间-内存平衡?
- 可逆残差层 — 如何通过智能残差架构大幅降低训练中的内存消耗?
- 轴向位置编码 — 如何使位置编码可用于极大的输入序列?
colab.research.google.com](https://colab.research.google.com/drive/15oP52_7W5dRcAnbgX3tYADsu4R3cjMIf?usp=sharing)
colab.research.google.com](https://colab.research.google.com/drive/1xKK32Yhda-iYgtoA3eCrnCVuy_lraQR9?usp=sharing)
colab.research.google.com](https://colab.research.google.com/drive/1BLffcRt9LXmM7nKU2UXhtm0PqAG0UE7J?usp=sharing)
colab.research.google.com](https://colab.research.google.com/drive/1MYxvC4RbKeDzY2lFfesN-CvPLKLk00CQ?usp=sharing)
数据集是一个自然语言推理(NLI)基准,通过人和模型在回路中启用训练(哈姆雷特)创建。
[## 安利 Demo
adversarialnli.com](https://adversarialnli.com/?fbclid=IwAR2vlb3egNu7LEhRQtatHv620CWT_aMeJ20uT291eTFLQfmhzIKS7lpeOkI#)
github.com](https://github.com/facebookresearch/anli)
每周日,我们都会对来自世界各地研究人员的 NLP 新闻和代码进行一次每周综述。
如果你喜欢这篇文章,请帮助我们并与朋友分享!
如需完整报道,请关注我们的 Twitter: @Quantum_Stat