博物学家的研究|罗伊
人的一小步…
猴子用意念玩乒乓的一大飞跃…
解密的
欢迎回来。本周我们为你准备了一个好节目。但首先……埃隆·马斯克的大脑芯片公司 Neuralink 在一只猴子的头骨中植入了芯片,这样它就可以无线玩 pong 了。赢了!如果你是那种创造下一级星际迷航技术的人,他们有空缺职位。🙉
neuralink.com](https://neuralink.com/blog/)
兴奋地宣布 Graphbrain 库在过去的一周有了重大更新。它现在包括一个更广泛的文档,带有教程和笔记本,用于快速实验。
重述…
Graphbrain 是一个用于从文本构建语义超图的库。超图只是一个普通的图,除了一条边不仅限于两个顶点。它可以有 3 个或更多😎。这一特性使 it 能够灵活地以分层的方式提取知识实体。它建立在 spaCy 和 Hugging Face 的 NeuralCoref 库之上,用于帮助完成共指解析任务。
如果您是这个库的新手,由于它的符号,一开始可能会有点吓人。仅供参考,这是符号的样子…👇
我知道…对于未经训练的人来说,这有点奇怪,但绝对值得更深入地探索,因为它可以帮助你从新的架构而不是纯粹的深度学习方法来看待 NLP 任务。要熟悉所有的任务,请查看下面的文章。
仅供参考,这是他们的手册,让你熟悉模型给出的符号:
[## 语义超图符号- Graphbrain 0.4.0 文档
graphbrain.net](https://graphbrain.net/manual/notation.html)
文档:
[## Graphbrain -语言、知识、认知- Graphbrain 0.4.0 文档
graphbrain.net](https://graphbrain.net/index.html)
代号:
github.com](https://github.com/graphbrain/graphbrain)
斯坦福开源的 Chirpy,他们的聊天机器人赢得了 Alexa 奖的第二名。这是一个聊天机器人,具有广泛的响应生成器。它们可以是完全基于规则的,也可以是完全基于神经的。
发电机类型:
音乐响应发生器
个人聊天响应生成器
维基响应生成器
[## 内部 Chirpy 枢机主教:斯坦福大学的开源社交聊天机器人,赢得了 Alexa 奖第二名
ai.stanford.edu](http://ai.stanford.edu/blog/chirpy-cardinal/)
[## 苹果 M1 芯片的 GPU 加速?问题编号 47702 pytorch/pytorch
github.com](pytorch/pytorch#47702 (comment))
“kgextension 包允许访问和使用链接的开放数据来扩充现有数据集。它使人们能够在熊猫中整合知识图谱信息。数据帧
链接开放数据的类型: DBpedia 、 WikiData 或欧盟开放数据门户
github.com](https://github.com/om-hb/kgextension)
colab.research.google.com](https://colab.research.google.com/github/om-hb/kgextension/blob/master/examples/book_genre_prediction.ipynb)
注意力是你所需要的……去看一个变形金刚的一个动作。
“BertViz 是一个在变形金刚模型中可视化注意力的工具,支持来自变形金刚库的所有模型(BERT、GPT-2、XLNet、罗伯塔、XLM、CTRL 等。)"
github.com](https://github.com/jessevig/bertviz)
除了一堆 YouTube 广告,Grammarly 还有一堆变形金刚模型😬。他们的语法纠错模型根据合成数据进行预训练,然后分两个阶段进行微调:
第一个是错误填充的语料库,第二个是错误填充和无错误平行语料库的组合。
github.com](https://github.com/grammarly/gector)
一个用于 PyTorch 几何的时态图神经网络扩展库。如果你正在研究流行病学预测或网络流量预测,看看吧:
[## benedekrozemberczki/py torch _ geometric _ temporal
github.com](https://github.com/benedekrozemberczki/pytorch_geometric_temporal)
在这些幻灯片中,ML 工程师 Andrei Lopatenko 描述了他在过去 15 年中经历的商业领域中的一些顶级 NLP 用例。
需要在开源软件上对您的网站或 API 端点进行负载测试吗?看看蝗虫…🐜
locust.io](https://locust.io/)
如何在 2021 年做出一个牛逼的 Python 包…
[## 如何在 2021 年做出一个牛逼的 Python 包
antonz.org](https://antonz.org/python-packaging/)
非常快速的最近邻搜索。Spotify 用它来推荐音乐。
特色(在他们的回购上找到的):
- 欧几里德距离,曼哈顿距离,余弦距离,汉明距离,或者点(内)积距离
- 余弦距离相当于归一化向量的欧几里德距离= sqrt(2–2 * cos(u,v))
- 如果你没有太多的维度,效果会更好(比如雷内·霍兰德)
- Spotify/骚扰
- 是一个带有 Python 绑定的 C++库,用来搜索空间中的点…
- github.com
- 多文档摘要
- Aylien 为摘要创建了维基百科时事门户数据集。在他们的博客中,他们讨论了为什么他们的方法不同于最近的 SOTA 模型,如 PEGASUS 和 BART,因为它们不能访问多文档。🥶🥶
多文档汇总的冒险:维基百科时事门户数据集
aylien.com
谷歌联合实验室
编辑描述
一组最近发布的回购引起了我们的关注👁](https://aylien.com/blog/multi-document-summarisation-and-the-wcep-dataset) [## 代码转换
接论文 📈
布局分析器
布局解析器是一个基于深度学习的工具,用于文档图像布局分析任务。使用 pip 或 conda 安装…](https://github.com/agemagician/CodeTrans)
github.com
连接论文 📈
基于变换器和图注意网络的知识图对话式问答
[## 一种扩展了图注意网络的多任务神经语义分析转换器结构。
本文研究基于知识图的(复杂)对话式问题回答任务。对于这项任务,我们…](https://github.com/Layout-Parser/layout-parser)
github.com
连接论文 📈
EXPATS:可解释的自动文本评分工具包
[## 一个用于自动文本评分(ATS)任务的框架,例如自动文章评分和可读性评估。该工具包还提供了与语言可解释性工具(LIT)的无缝集成,以便人们可以解释和可视化模型及其预测。
EXPATS 是一个用于自动文本评分(ATS)任务的开源框架,例如自动论文评分和…](https://github.com/endrikacupaj/LASAGNE)
github.com
连接论文 📈
Grammar tagger——一个用于语言学习的神经多语言语法分析器
一个用于语言学习的神经多语言语法分析器](https://github.com/octanove/expats)
github.com
连接论文 📈
MMBERT:用于改善医学 VQA 的多模态 BERT 预训练
[## 一种用于医学领域中的视觉问答任务的多模态转换器。它在用于放射学图像的两个 VQA 数据集上实现了新的一流性能——VQA-Med 2019 和 VQARAD。
Yash Khare*、Viraj Bagal*、Minesh Mathew、Adithi Devi、U Deva Priyakumar、CV Jawahar 摘要:医学图像…](https://github.com/octanove/grammartagger)
github.com
连接论文 📈
本周数据集:HumAID
它在哪里?](https://github.com/VirajBagal/MMBERT)
crisisnlp.qcri.org
每周日,我们都会对来自世界各地研究人员的 NLP 新闻和代码进行一次每周综述。
crisisnlp.qcri.org
RIP to one of the realest to ever do it…
Every Sunday we do a weekly round-up of NLP news and code drops from researchers around the world.
For complete coverage, follow our Twitter: @Quantum_Stat