照片由维多利亚诺·伊斯基耶多在 Unsplash 拍摄
如果人工智能是新的电力,我们应该掌握它。
但是,谷歌“什么是人工智能”,你会得到不切实际的解释或令人困惑的行话。
谷歌侧边栏搜索“什么是人工智能”由作者捕获。
让我们保持简单。以下是在 7 分钟内,针对 7 种不同的用例,制作 7 个人工智能创业 MVP 的精确步骤。系好安全带。
想法:向商店出售面罩检测系统,用于他们的闭路电视。
**数据:**戴口罩的人和不戴口罩的人的图像。
**流程:**建立模型,托管,销售。
让我们用可教机器来制作我们的模型。拍一些有无蒙版的照片,点击“火车模型”,测试,最后导出。现在,我们有了一个可以预售的 MVP:一个可以共享的 URL leads 可以试用。
下面是这个过程的 48 秒 GIF。
按作者。
对于最终产品,我们希望从许多角度拍摄许多人的图像,以及我们自己的平台。对于我们的 M 副总裁来说,极简主义是我们的目标。在花费一分钱或一分钟之前,预售将验证(或否定)我们的想法。
想法:大型连锁餐厅因碎盘子和玻璃器皿而失去利润,但这些事件没有被记录下来。我们出售碎盘检测系统(使用闭路电视音频),帮助店主分析破损情况,最大限度地减少商店损失。
**数据:**正常的餐厅声音和盘子破碎的声音。
**流程:**建立模型,主持,销售。(注意这个同上)。
还是用可教机吧。我录下了 40 秒的背景噪音和 8 位玻璃破碎的音频(来自 YouTube 的一个汇编)。我点击“火车”,然后“出口。”总的来说,这花了一分多钟。
下面,你可以听到模型正确地分类背景声音,当我播放玻璃被打破的新音频时,它正确地识别它,然后返回到背景噪音分类。
按作者。
虽然还远未最终确定,但尝试预售将有助于在没有风险的情况下验证我们的想法——这是 MVP 的全部意义。
**想法:**有些酒很恐怖,会降低你的销量;有些很精彩,会带来好评如潮。我们可以卖一个人工智能模型给卖酒的人(像加里·维纳查克),让他们在进货之前知道酒的真实质量。
“要么给我再来点酒,要么别烦我。”―鲁米
数据: 红酒数据集。
**流程:**放入数据,运行模型,销售。
让我们访问 Apteo ,点击 new workspace ,上传 CSV,转到 predictive insights ,点击 quality 列作为我们的数字 KPI,预测新酒的质量。我们新进的葡萄酒得到了 5.78/10——真扫兴!最好不要上架。
按作者。
除了单一的预测,我们可以从一个应用程序中获得一个 API 来进行预测,或者通过批处理一次预测数百种葡萄酒的质量。
创意:出售独一无二的艺术品。
**资料:**以照片为灵感。️
**流程:**运作模型,创作艺术,销售。
这个例子看起来有点复杂,但是非常简单。首先,访问这个 Google Colab 链接。用你自己的图片替换下面的 URL,或者从 Unsplash 借用一个:
url = 'https://storage.googleapis.com/download.tensorflow.org/example_images/YellowLabradorLooking_new.jpg'
然后,将鼠标悬停在“运行时”上,点击“全部运行”,或者使用 ctrl+F9。滚动到底部,这就是你的人工智能生成的艺术。获得 MVP 的时间大约是 30 秒。
按作者。 Billy Huynh 在 Unsplash 上的左图来源照片。
有人会为这样的艺术买单吗?
也许是,也许不是。也许他们会花钱买一个更简单的界面来生成自己的人工智能艺术。也许 Snapchat 或 Instagram 这样的公司会收购一家提供这种功能(或更好版本)的初创公司,将其作为过滤器添加到他们的应用程序中。谁知道呢。作为企业家,你的工作就是找出答案。
创意:数十亿美元花在内容上——博客、白皮书、广告文案等等。我们出售文本生成器以降低成本。
**数据:**文字提示。
**流程:**运营模型,生成内容,销售。
让我们打开下面的 Colab 链接,按 ctrl+F9 运行所有代码。我们将得到一个可共享的链接,在那里我们可以输入一个提示来生成文本。
colab.research.google.com](https://colab.research.google.com/drive/1o_-QIR8yVphfnbNZGYemyEr111CHHxSv?usp=sharing)
例如,我写了“酮饮食是”,它生成了这段文字:
“酮饮食是降低二型糖尿病病(T2DM)风险的有效方法,该病是美国的主要死亡原因。生酮饮食已被证明能有效降低 1 型糖尿病患者的糖尿病发病率,但尚未被证明对 T1DM 的患病率有显著影响。”
正在使用的 GPT-2 Gradio 界面截图,作者。
相当令人印象深刻。请记住,GPT-2 是更好的 GPT-3 的原始前身,后者尚未向公众开放(截至本文撰写之时)。GPT-3 就像邓布利多,而 GPT-2 就是还在学走路的哈利。
想象一下可能性!
理念:出售独一无二的音乐。
**资料:**以音乐为灵感。️
**流程:**运营模型,创作音乐,销售。
让我们访问这个 Google Colab 链接。老实说,这一次你真的要读一遍并跟着读。
默认代码的灵感来自肖邦,但我决定用贝多芬,所以我从 BitMIDI 收集了一堆 MIDI 文件。因为我使用了不同的灵感来源,所以我必须更改代码中相关的文件名。例如,我的贝多芬 MIDI 文件在一个名为Archive (1).zip
的文件夹中,所以我在代码中改变了它。
!unzip "Archive (1).zip";
我的 MIDI 文件也直接在压缩文件夹中——没有嵌套——所以我稍后才使用这一行代码(注意在之前什么都没有)。mid ,与默认代码相反):
for i,file in enumerate(glob.glob("***.mid**")):
在代码的后面,有一个到 GitHub repo 的链接,它带有经过训练的模型权重。按照说明,下载提到的h5
文件,并上传到 Colab。下载后,我只是直接上传了这个代码的文件:
weights = files.upload()
一定要上传那个h5
文件,它会让你立刻创作出音乐,而不是你自己训练整个模型,那要花大约 13 个小时。
最后,按原样运行剩余的代码。如果你卡住了:谷歌是你的朋友。最后,下载您生成的 MIDI 文件:
files.download('test_output.mid')
我把这个 MIDI 文件转换成 MP3,然后贴在了网上——就是这个。
真是催人泪下。
想法: 教师短缺是真实的,大量的,而且还在增长。我们为学生创造工具来获得他们对指定阅读的问题的答案,即使他们不能马上找到导师或老师。
**资料:**问题与语境。
**流程:**运行模型,回答问题,后期给学生做个 app。
打开下面的链接,按 ctrl+F9 运行所有代码,在底部你会看到一个以“gradio.app”结尾的可共享链接,在这里你可以输入提示,提出问题,获得答案。
colab.research.google.com](https://colab.research.google.com/drive/1RuiMJz_7jDXpi59jDgW02NsBnlz1aY1S?usp=sharing)
这里有一个例子,我问什么时候使用“岭回归”,这是一个相当典型的人工智能面试问题。
作者正在使用的 BERT-SQuAD Gradio 界面截图。
856 页的教材、 18 个月的 AI 培训项目,以及一条永不停息的 AI 行话传送带,让使用 AI 显得异常困难。因此,许多企业家不会研究人工智能,除非他们有数百万美元可以投资人工智能团队。
幸运的是,这个复杂的图像仅仅是一个图像。现实是,你现在就可以在一个可能让你吃惊的时间框架内构建人工智能。