W 欢迎来到首次机器学习主题演讲at**AWSre:Invent**。这是一个 2 小时的虚拟会议,由亚马逊机器学习副总裁 Swami Sivasubramanian 博士讲授 AWS 机器学习和人工智能的最新发展、发布和演示,以及客户见解和成功案例。让我们按时间顺序回顾一下主要亮点。****
基于工作日,AWS 在 2020 年发布一个新的 ML/AI 功能平均只需要一天多一点的时间!即使按日历天数计算,平均也仍然只需要不到 2 天就能实现这一壮举。今年 AWS ML/AI 的创新步伐真的快得令人难以置信。
你怎么想呢?
以上信息来自 Nucleus Research U192 —指南:AWS 上的深度学习—2020 年 11 月 23 日。AWS 上基于云的 PyTorch 运行的百分比应该是 90%,而不是 91%。另一方面,下面来自 Kaggle 的《2020 年机器学习和数据科学状况调查》的横条图也显示,AWS 是最受企业数据科学家欢迎的云平台。
企业云计算,Kaggle 的 2020 年机器学习和数据科学状况调查
基于 Habana Gaudi 的亚马逊 EC2 实例将于 2021 年上半年上市。 Habana Gaudi AI 处理器专为 ML 培训工作负载打造,与当前基于 GPU 的亚马逊 EC2 实例相比,其性价比最高可提高 40%。
AWS Trainium 将于 2021 年上市。它是 AWS 设计和构建的一种新的定制机器学习训练芯片,用于在云端提供最具成本效益的 ML 训练。我认为将它的性价比与其他 AI 训练加速器 ASICs 如 Habana Gaudi 和 Cloud TPU 进行比较将是令人兴奋的。
引入的两个新的 SageMaker 数据并行和模型并行分布式培训库是:
一个令人信服的展示是 AWS 和 NVIDIA 凭借这一功能实现了 Mask R-CNN 和 T5–3B的世界最快训练时间。
Mask R-CNN (基于区域的卷积神经网络)是一种最先进的(SOTA)深度神经网络架构,用于计算机视觉对象检测中的实例分割。
T5——3B(文本到文本转换转换器——30 亿个参数)是谷歌的 SOTA 自然语言处理(NLP)模型,在庞大的干净爬行语料库(C4) 数据集上进行预训练。在 SuperGLUE 基准测试中,它在多个 NLP 任务上取得了接近人类的性能。
亚马逊 SageMaker 数据牧马人 现已普遍上市。它通过可视化界面为机器学习提供了更快、更简单的数据准备。
亚马逊 SageMaker 特色店 现已普遍发售。它作为一个完全托管的存储库来存储、发现和共享机器学习(ML)功能。这使得能够重复使用机器学习功能,从而为机器学习工作流节省时间和成本。
亚马逊 SageMaker 澄清 现已普遍上市。它支持数据和模型中的偏差检测,以及理解模型行为的模型可解释性。这个特性有助于提高模型的公平性和透明度,从而构建更安全、更负责任的人工智能解决方案。
从这个公告博客和模型公平性和可解释性指南中了解更多信息。
Amazon SageMaker 调试器的深度剖析现已正式推出。它能够对机器学习培训工作进行深度剖析。此功能对于识别培训瓶颈和系统资源利用率非常有用。
从这篇公告博客和了解更多信息,利用 Amazon SageMaker Debugger 博客中的深度剖析功能识别瓶颈、提高资源利用率并降低 ML 培训成本。
亚马逊 SageMaker 管道 现已普遍上市。这是第一个专门为机器学习构建的持续集成和持续交付(CI/CD)服务。此功能通过内置或自定义 MLOps 模板实现了自动化的端到端 MLOps 工作流。以下是 SageMaker Pipelines MLOps 工作流程的演示。
从这个公告博客和这些 SageMaker 管道入门指南中了解更多信息。
亚马逊 SageMaker Edge Manager现已普遍上市。它简化了智能相机、机器人、个人电脑和移动设备等边缘设备的 ML 模型管理。
从这个公告博客和这个 Edge Manager 入门指南中了解更多信息。
亚马逊红移 ML 现已推出预览版。它使数据分析师和数据库开发人员能够利用 SQL 从 Amazon Redshift 中的数据创建和训练 ML 模型,并使用这些模型进行数据库内预测。亚马逊红移是最受欢迎的、完全管理的、Pb 级的数据仓库。
亚马逊海王 ML 现已普遍上市。它使用图形神经网络(GNNs)对图形进行简单、快速和更准确的预测。 Amazon Neptune 是一种快速、可靠、完全托管的图形数据库服务,可以轻松构建和运行处理高度关联数据集的应用程序。
从这篇公告博客和这篇使用 Neptune ML on graphs 指南中了解更多信息。
亚马逊 QuickSight Q 现已预告。它是一种商业智能的自然语言搜索服务,允许业务用户用简单的语言提出数据问题,并立即获得答案。 Amazon QuickSight 是一种可扩展、无服务器、可嵌入、基于机器学习的商业智能(BI)服务,专为云构建。以下是 QuickSight 仪表盘中显示的用户用简单英语询问的结果演示。
从这篇公告博客中了解更多信息。
亚马逊 Lookout for Metrics现已推出预览版。这是一种自动检测和诊断指标异常的服务,如产品销售下降或合格销售线索突然增加。它还提供了根本原因分析,使企业能够更快地采取行动来处理异常情况。
从这篇公告博客中了解更多信息。
亚马逊 Monitron 现已普遍上市。这是一种端到端的预测性维护服务,可监控工业机械设备并自动检测潜在故障,以最大限度地减少计划外停机时间。亚马逊 Monitron 入门套件现已上市。
从这篇公告博客中了解更多信息。
亚马逊寻找装备 现已在预览中。这是一项异常检测服务,允许拥有现有设备传感器的客户使用 AWS ML 模型来检测异常设备行为,并实现预测性维护。
从这篇公告博客中了解更多信息。
亚马逊瞭望视野 现已有预告。这是一种使用计算机视觉(CV)来发现产品中的视觉缺陷和异常的服务,以实现制造质量检测的自动化。
从这个公告博客和 Lookout for Vision 开发者指南中了解更多信息。
AWS 全景设备 现已作为 AWS 全景的一部分在预览中提供。它是一种硬件设备,为现有的互联网协议(IP)相机增加了计算机视觉(CV)功能,而现有的互联网协议(IP)相机不是为适应 CV 而构建的。它将现有的 IP 摄像机转变为智能摄像机,可以在多个并发视频流上运行 CV 模型,具有低延迟和高数据隐私性。
从这篇公告博客中了解更多信息。
AWS 全景 SDK 现已作为 AWS 全景的一部分在预览版中提供。它是一个软件开发工具包(SDK),使第三方制造商能够构建新的相机,在边缘运行 CV 模型,用于对象检测、面部识别或活动识别等任务。
从这篇公告博客中了解更多信息。
亚马逊健康湖 现已提供预览。这是一项完全托管的符合 HIPAA 标准的服务,允许医疗保健和生命科学客户将其来自不同孤岛和格式的健康数据聚合到一个 Pb 级的集中式 AWS 数据湖中。
从这个公告博客和 HealthLake 入门指南中了解更多信息。
这里列出了 AWS 公共资源、与第三方合作的大规模开放在线课程(MOOC),如 Coursera 、 edX 、 Udacity ,以及为任何对机器学习教育感兴趣的人提供的教育设备。
- AWS 机器学习大学
- AWS 机器学习
- AWS 机器学习培训库
- AWS 升级指南:机器学习
- AWS 教育:机器学习科学家职业道路
- Udacity-AWS:机器学习工程师纳米学位
- Coursera-AWS:AWS 机器学习入门
- edX-AWS:亚马逊 SageMaker:简化机器学习应用开发
- AWS DeepLens
- AWS DeepRacer
- AWS DeepComposer
- 提供坚实的基础
- 创造最短的成功之路
- 将机器学习扩展到更多的建设者
- 解决真实业务问题、端到端
- 持续学习
其中一些原则与亚马逊的一项或多项领导原则相一致,比如学习和好奇(原则 5)。****
我们可以看到,今年很多 AWS ML/AI 的新创新都是以 AWS SageMaker 和工业机器学习服务为中心的。毫无疑问,为什么 AWS SageMaker 成为 AWS 历史上增长最快的服务之一。如果 AWS 在未来继续保持或加快 ML/AI 的创新步伐,我相信 AWS 在未来将继续保持其在 Gartner 云 AI 开发者服务魔力象限中的领先优势。
Gartner 的云人工智能开发者服务魔力象限(2020 年 2 月)