Skip to content

Latest commit

 

History

History
382 lines (331 loc) · 53.1 KB

README-CN.md

File metadata and controls

382 lines (331 loc) · 53.1 KB

English | 中文

这个仓库整理AI相关的实用工具。

全部分类

评测

精选文章

ChatGPT及类似闭源大语言模型

名称 说明 链接 费用
ChatGPT openAI的chatgpt
应用示例:
B站视频:豆包 vs GPT,语音对决!豆包的魅力女友让人难以招架~
B站视频:这9款工具帮你榨干ChatGPT,解锁隐藏玩法
B站视频:格斗之王!AI写出来的AI竟然这么强!
可汗学院创始人Khan最新TED演讲:GPT-4作为AI学习私教,可能带来教育史上最大变革
URL 免费/付费
Claude Anthropic研发的AI助手Claude URL 免费/付费
微软Copilot 微软的Copilot,包含了多种AI工具和插件 URL 免费
Gemini Google 的对话式AI工具和最新的大语言模型,包括Gemini Nono,Gemini Pro和Gemini Ultra。Gemini Pro已开放api和sdk使用。api目前可免费使用,有每分钟60个请求的限制。新闻介绍 Gemini AI聊天助手
Gemini api开发者网站
免费
Le Chat Mistral AI 推出了为 Le Chat 的聊天助手 URL 免费
豆包 字节跳动旗下的AI聊天软件 ; 豆包chrome插件
体验测试视频:
B站视频:豆包 vs GPT,语音对决!豆包的魅力女友让人难以招架~
B站视频:百模大战-抖音子公司推出AI聊天机器人豆包
URL 免费
月之暗面的Kimi Chat 支持联网,支持上传文件(最多 50 个,每个 100 MB)接受 pdf、doc、xlsx、ppt、txt 等,文章总结能力比较强。chrome插件:Kimi浏览器助手
张鹏对谈月之暗面杨植麟:大模型创业需要新的组织范式
URL 免费
文心一言 百度的大语言模型 URL 免费
通义千问 阿里云的大语言模型
视频介绍: B站视频:国产AI到底行不行?测试完通义千问,我只想说两个字【我们离ChatGPT还有多远】
URL 免费
智谱AI 名为 ChatGLM 的人工智能助手,是基于清华大学 KEG 实验室和智谱 AI 公司于 2023 年共同训练的语言模型开发 URL 免费
讯飞星火 讯飞的大语言模型 URL 免费
百川大模型 百川智能的大语言模型 开发者体验中心 AI聊天助手:百小应 免费
零一万物 由李开复创办的AI公司,零一万物 API 开放平台为新用户免费赠送60元api的使用额度,开源了模型Yi 6B和34B 零一万物 API 开放平台
Github GitHub Repo stars
免费
腾讯混元模型 腾讯的大语言模型;API文档 URL 免费
中国国内发布的其他大模型 目前国内各大企业、科研机构和高校等单位已公开的 AI 大模型至少已经达到了 188 个。2023-12-17更新,更多信息

国内可使用的ChatGPT镜像站点

名称 说明 链接
carrot Free ChatGPT Site List 这儿为你准备了众多免费好用的ChatGPT镜像站点,当前100+站点国内可使用ChatGPT镜像站点 GitHub
GitHub Repo stars
awesome-free-chatgpt 免费的 ChatGPT 镜像网站列表,持续更新。List of free ChatGPT mirror sites, continuously updated. GitHub
GitHub Repo stars

GPT-LLMs应用

名称 说明 链接 费用
NotebookLM NotebookLM是谷歌推出的一款强大的虚拟研究助手,它可以将各种类型的文件,包括文本、视频、音频甚至数据集,转化成生动有趣的播客节目(播客音频目前只支持英语)。除此之外,NotebookLM 还可以生成常见问题解答、学习指南、目录、时间轴和简报等,并支持用户进行自由对话和事实核查。 URL 免费
Learn about 谷歌开发的人工智能学习助手。它是一个会话式的学习伙伴,能适应您独特的好奇心和学习目标,帮助您掌握新主题并加深理解。 URL 免费
Poe 美版知乎 Quora 构建的AI 产品,有web和客户端。目前的情况是ChatGPT、Sage、Dragonfly、Claude 机器人可以免费、无限制、实时使用。只需要一个邮箱即可注册。可以随时切换AI而对话不中断,并且对话记录是在线保存并且同步到客户端的。chatgpt-4可以每天免费使用一次
视频介绍:B站视频:神器!与chatGPT类似的新人工智能问答AI:Poe, 美国知乎Quaro最新产品,专业回答
URL 免费,有付费升级版
bot.360 360构建的AI对话机器人,集合了国内主要的一些大模型比如豆包、kimi、MiniMax、通义千问等 URL 免费
HuggingChat Hugging Face 的开源聊天应用程序 Hugging Chat. URL Github GitHub Repo stars 免费
monica AI助手,提供搜索、阅读、写作、翻译、绘画等多种任务的帮助。有独立应用和浏览器插件 URL
chrome插件
免费/付费
ollama 在本地环境中轻松运行和管理大型语言模型,如Llama 、Mistral、Gemma2等 Github GitHub Repo stars 免费
openai/openai-python OpenAI API 的官方 Python 库,它是使用Stainless根据OpenAPI 规范生成的 GithubGitHub Repo stars 免费,需要使用OpenAPI的apikey
sashabaranov/go-openai OpenAI API的Go语言非官方的SDK,支持ChatGPT、GPT-3、 GPT-4、DALL·E 2 GithubGitHub Repo stars 免费
langchain 是一个强大的框架,旨在帮助开发人员使用语言模型构建端到端的应用程序。它提供了一套工具、组件和接口,可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互,将多个组件链接在一起,并集成额外的资源,例如 API 和数据库。 Github GitHub Repo stars 免费
ChatGPT-Next-Web 一键免费部署你的跨平台私人 ChatGPT 应用, 支持 GPT3, GPT4 & Gemini Pro 模型 Github GitHub Repo stars 免费
anything-llm 开源的文档聊天机器人解决方案 Github GitHub Repo stars 免费
screenshot-to-code 插入截图并将其转换为简洁的 HTML/Tailwind/JS 代码,使用了GPT-4 Vision来生成代码,使用DALL-E 3生成图片 GitHub GitHub Repo stars 免费,需要有GPT-4 Vision的授权
Chatbox 使用ChatGPT API(OpenAI API)的桌面应用程序, 将所有的聊天信息和提示信息存储在本地,从而减少了数据丢失的风险。比网页版使用更稳定些 GitHub GitHub Repo stars 免费,需要使用OpenAPI的apikey
ChatGPT for Google 开源项目,浏览器插件,在搜索页面增加chatgpt的内容和对话框 GitHub GitHub Repo stars 免费,需要chatgpt账号
gpt-crawler 可以爬取指定网站中的内容,并生成json文件,可以直接上传到GPTs的知识库使用 GithubGitHub Repo stars 免费
ChatGPT-Shortcut 开源,让生产力加倍的 ChatGPT 快捷指令,按照领域和功能分区,可对提示词进行标签筛选、关键词搜索和一键复制。 GitHub GitHub Repo stars 免费
ChatGPT Sidebar ChatGPT 边栏是您在浏览任何网站时可以使用的人工智能助手。
视频介绍:B站视频:CharGPT初体验,浏览器安装人工智能侧边栏AI Sidebar扩展程序
URL 免费
WebChatGPT 开源程序,给chatgpt扩展联网的能力
视频介绍:B站视频:可以让ChatGPT直接联网的扩展程序
GitHub GitHub Repo stars 免费
AIPRM for ChatGPT 浏览器插件,提供一系列精选ChatGPT 指令模板,甚至还能够自己创建,还可以调整AI 语气和写作风格
B站视频:集大成者!ChatGPT百宝箱,内置多种功能,所见即所得!
URL 免费
GPTCache ⚡ GPTCache 是一个用于创建语义缓存以存储来自 LLM 查询的响应的库,类似于aigc场景中的redis。 它可用于降低依赖 LLM 服务(如ChatGPT)的成本,同时也可以有效减少服务响应时间,因为大模型推理一般都比较耗时。 GitHub GitHub Repo stars 免费
MindMac 功能丰富、隐私第一的 macOS 原生 ChatGPT 应用程序,可在一个地方使用 OpenAI, Azure OpenAI, Anthropic Claude, OpenRouter,旨在实现最大生产力。 目前有 15 种语言版本。 URL 免费,有付费升级版

AI图像创作

名称 说明 链接 费用
Midjourney 输入文字或图片进行图片创作。应用示例:
尝试用chatGPT+midjourney进行科研绘图,被效果震惊到了。。。
URL 付费/免费试用
Stable diffusion webui 开源项目,输入文字或图片进行图片创作, Stable diffusion webui是Stable diffusion的GUI是将stable diffusion实现可视化的图像用户操作界面,它本身还集成了很多其它有用的扩展脚本。
新手入门教程:https://www.bilibili.com/video/BV1Qo4y167AK/
AI风格化视频或AI真人视频的效果:
1. 【AI动画】欣小萌天台蹦迪 动画版
2. 死磕真人AI动作,人物和背景的终于不闪了,你们觉得哪个更好点?
3. 5分钟,教会你如何生成AI动画
GitHub GitHub Repo stars 免费
即梦AI 字节跳动旗下的文生图、AI视频生成和AI图片编辑应用 URL 免费/付费
Photoshop 生成式AI功能 在Adobe Photoshop中使用生成式AI填充功能。功能介绍:
1. B站视频:Photoshop 革命性新功能-生成式填充功能介绍
2. 巫师后期B站视频:引爆点——Photoshop核弹级更新(创成式AI填充)彻底改变图片行业!
URL Photoshop 订阅会员可下载Beta版本试用
firefly Adobe 的AI图片处理网站 URL 免费/付费
clipdrop stability.ai 公司旗下的图像处理网站,包含文生图、AI扩图、图生图、去除背景等功能 URL 免费/ 付费
civitai Civitai(C站)是一个用于分享AI图像创作模型资源的网站平台,拥有大量模型,已成为SD开源社区主要的模型交流场所 URL 免费
文心一格 百度旗下的文生图和AI图片编辑应用 URL 免费/付费
通义万相 阿里旗下的文生图和AI图片创作应用 URL 免费
美图的奇想智能MiracleVision 美图的文生图应用 URL 免费
ideogram.ai AI 文字生成图片的网站。前谷歌AI绘画4位大牛创立的公司推出的产品 URL 免费
Skybox AI 输入文字生成360度全景图片 URL 免费/ 付费
Microsoft Bing Image Creator Image Creator 是使用 DALL-E 技术创作图片的工具。试用了下生成人像图片不堪入目 URL 免费
remove.bg 一键删除图片背景 URL 免费/付费
简单AI 搜狐旗下的文生图和图片分享网站 URL 免费/付费
ControlNet 能够在一个text2image上训练的扩散模型进行高效finetune,并且结合特定的condition输入,得到可控的效果 Github GitHub Repo stars 免费
StreamDiffusion 实时AI互动图片生成的管道级解决方案 Github GitHub Repo stars 免费
visual-chatgpt 通过 ChatGPT 创作图片 GitHub GitHub Repo stars 免费
DragGAN 一种新的交互式图像编辑方法,允许用户通过简单地在图像上点击并拖动点来进行编辑 GitHub
GitHub Repo stars
免费
black-forest-labs/flux FLUX.1 模型的官方推理资源库 Github GitHub Repo stars 免费
HivisionIDPhotos 一个轻量级的AI证件照制作算法。 Github GitHub Repo stars 免费

AI视频创作

名称 说明 链接 费用
剪映 字幕生成语音、语音生成字幕、字幕翻译、一键图文成片,还有很便捷、强大的视频剪辑功能 URL 免费/付费
快手可灵 支持文生视频和图生视频 URL 免费
即梦AI 字节跳动旗下的文生图、AI视频生成和AI图片编辑应用 URL 免费/付费
Dream Machine 由 Luma AI 提供。Dream Machine 是一个人工智能模型,能根据文本和图像快速制作出高质量、逼真的视频。官方介绍视频 URL 免费/付费
Sora OpenAI的文本生成视频的模型。Sora技术报告:ikaijua#54, Sora的访问权限未完全开放,部分视觉艺术家、设计师和电影制作人获得了访问权限 URL -
Runway Gen-2: 文本/图像 AI生成视频
Gen-1: 根据视频AI生成视频
应用示例:
B站视频:数字生命卡兹克/我用AI做了一部《流浪地球3》的预告片
精选视频:https://runwayml.com/staff-picks
URL 免费试用/付费
海螺AI Minimax的AI视频生成平台 URL 免费/付费
MOKI 美图的AI短片创作工具 URL 免费试用/付费
Pika 文本/图像 AI生成视频 URL 免费试用/付费
krea.ai 提供文生图/视频、图片放大、模型训练等功能,Krea ai想做视频和图片界的 POE,目前集成了海螺、luma、Runway和可灵四家最好的视频生成模型。 URL 免费试用/付费
Fliki 將文字生成音频和视频的网站 URL 免费试用/付费
d-id 根据文字生成数字人的配音视频 URL 免费试用/付费
HeyGen 根据文字生成数字人的配音视频 URL 免费试用/付费
AnimateDiff Animatediff是香港中文大学团队开源的AI视频生成方法,基于Stable DIffusion的开源基建,8月份开源模型之后,一个月就把AI视频生成的质量提高了几个等级。
介绍文章:这款工具让你一秒成AI版宫崎骏,AI视频“ChatGPT时刻”快到了
Github GitHub Repo stars 免费
vivago.ai/video 文本/图像生成视频; 4K视频增强 URL 免费

ChatGPT Prompts

名称 说明 链接 费用
f/awesome-chatgpt-prompts This repo includes ChatGPT prompt curation to use ChatGPT better. Github GitHub Repo stars Free

开源大语言模型

名称 说明 链接 费用
Llama 3 Llama3是Meta AI开发的开源的大型语言模型, 它是Llama 语言模型v3版本。
Llama3在线测试地址:huggingface.co/Meta-Llama-3-70B-Instruct
GitHub GitHub Repo stars 免费
Mixtral-8x7B 法国人工智能初创公司 Mistral AI开源的一种具有开放权重的稀疏专家混合模型 (SMoE),在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5
论文地址:https://arxiv.org/pdf/2401.04088.pdf
论文主页:https://mistral.ai/news/mixtral-of-experts/
Github GitHub Repo stars 免费
grok-1 马斯克的xAI公司开源的大语言模型 Github GitHub Repo stars 免费
Qwen(通义千问) 阿里云研发的通义千问大模型系列
在线Demo地址:
Qwen-7B-Chat-Demo
Qwen-72B-Chat-Demo
Qwen1.5 72B 在线体验
Qwen-7B GitHub Repo stars
Qwen1.5GitHub Repo stars
免费
ChatGLM2-6B 中英双语对话模型 ChatGLM-6B 的第二代版本 GitHub GitHub Repo stars 免费
Phi-3 Phi-3是微软开发的开放式人工智能模型系列。Phi-3 模型是目前能力最强、最具成本效益的小型语言模型(SLM),在各种语言、推理、编码和数学基准测试中,其性能均优于相同大小和更大的模型。 Github GitHub Repo stars 免费

大语言模型排行榜

Name Description Links Fees
LMSYS Chatbot Arena Leaderboard LMSYS Chatbot Arena 是一个用于大语言模型评估的众包开放平台。收集了超过 1,000,000 次人类成对比较,用 Bradley-Terry 模型对 LLM 进行排名,并以 Elo 标度显示模型评级。
B站视频:量子位/1v1单挑90万轮之后,最强大模型是……
URL 免费
Artificial Analysis Artificial Analysis 是一个提供 AI 模型和服务商比较及基准测试的资源平台,帮助用户在选择 AI 模型和服务提供商时做出明智决策。平台提供多种流行 AI 模型的比较数据,包括 OpenAI 的 GPT-4、Meta 的 Llama 3 和 Anthropic 的 Claude 系列,涵盖了响应速度、延迟和成本等性能指标。 URL 免费

大语言模型训练-评估平台

Name Description Links Fees
FastChat 用于训练、服务和评估大型语言模型的开放平台。Vicuna 和 Chatbot Arena 的发布仓库。 Github GitHub Repo stars Free

集成了多个大语言模型的应用

名称 说明 链接 费用
chathub 浏览器插件,在一个应用中使用不同的聊天机器人,目前支持 ChatGPT、新的 Bing Chat、Google Bard 和 Claude (via Poe),未来将集成更多机器人, 同时与多个聊天机器人聊天,方便比较它们的答案 GitHub
GitHub Repo stars
免费,付费支持更多功能
ChatALL 同时与多个大语言模型聊天的客户端(支持Windows、macOS、Linux系统),支持ChatGPT、Bing Chat、Claude、Bard、MOSS、Alpaca、HuggingChat等。需要拥有可以访问这些 AI 的帐号,或 API token GitHub
GitHub Repo stars
免费

AI工具箱类软件

名称 说明 链接 费用
Paper2GUI 一款面向普通人的 AI 桌面 APP 工具箱,免安装即开即用,已支持 40+AI 模型,内容涵盖 AI 绘画、语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR 识别等领域。支持 Windows、Mac、Linux 系统。
B站视频介绍:补帧超分抠图配音,这个开源AI工具箱对小白太友好了!
GitHub GitHub Repo stars 免费

AI Agent

名称 说明 链接 费用
Auto-GPT 开源项目,使用gpt自主地实现你设定的任何目标。演示示例:爆火的自主人工智能AutoGPT,程序员表示开始真正有点担忧会失业了! GitHub GitHub Repo stars 免费,需要OpenAI API key
OthersideAI/self-operating-computer 一个使用多模态模型(默认模型为GPT-4v)能够操作计算机的框架 Github GitHub Repo stars 免费,需要GPT-4v
AppAgent 可以操作手机应用程序的AI Agent Github GitHub Repo stars 免费
microsoft/autogen AutoGen 是一个开源编程框架,用于构建人工智能Agent,并促进多个Agent之间的合作,以解决任务。 Github GitHub Repo stars 免费
Taskade AI 在统一的工作空间内构建、训练和部署自主AI代理,用于任务管理、团队协作和工作流自动化。通过结构化列表、笔记和思维导图提升团队生产力。 URL 每日免费AI额度 / 支持付费升级

ai搜索

名称 说明 链接 费用
秘塔搜索 搜索网络信息并提供汇总信息,并附有参考链接,还创建话题知识库 URL 免费
知乎直答 知乎的AI搜索,有通用搜索和专业搜索;介绍:B站视频朋克周/专业报告和学术期刊为你所用,AI搜索迎来新选择 URL 免费
You.com 结合对话模式的搜索引擎 URL 免费
Perplexity.ai Perplexity.ai 是一个基于 GPT-3 的 AI 工具,类似 New Bing 的搜寻引擎、会附上参考结果 URL 免费
MindSearch 中科大和上海人工智能实验室联合研发国产开源搜索引擎MindSearch(思・索),采用分层检索策略,先广泛搜索再精确选择,有效管理互联网上的海量信息。在线Demo Github GitHub Repo stars 免费

阅读

名称 说明 链接 费用
微信读书 “AI问书”功能,在阅读时遇到不理解的内容,可以通过AI问书功能获得即时解释。AI问书的回答通常包含注释和相关书籍推荐,并且可以通过点击回答中的链接跳转到相关书籍的特定选段,增加回答的可信度更多介绍 URL 免费/付费

写作

名称 说明 链接 费用
Notion AI AI辅助的笔记软件,主要包括AI创作文章、翻译、修正语法、摘要和总结等
视频示例:B站视频:Notion AI完整介绍 | 十个节省时间的神功能(ChatGPT般强大)
URL 有一定免费的AI试用次数,AI功能10$/每月
verse 印象笔记推出的AI写作工具 URL 免费
写作猫 集AI写作、多人协作、文本校对、改写润色、自动配图等功能为一体AI Native内容创作平台 URL 免费
Deep L Write 英文、德文写作工具,可以及時修正写作錯誤、改写句子。 URL 免費版本使用有文字字数限制/有付费升级版
grammarly 纠正语法、拼写、标点符号等错误的写作助手 URL 免费/有付费升级版
火山写作 写作润色、翻译 URL 免费

编程开发

名称 说明 链接 费用
GitHub Copilot GitHub 和 OpenAI 合作开发的一个代码编写助手
Github Copilot技巧和窍门
Github Copilot X的Chat功能介绍Copilot X申请页面
URL 付费
通义灵码 阿里云开发的代码编写助手,可根据当前代码文件及跨文件的上下文,为你生成行级/函数级代码、单元测试、代码注释等,支持 Java、Python、Go、JavaScript、TypeScript、C/C++、C# 等主流语言,同时兼容 Visual Studio Code、JetBrains IDEs 等主流编程工具 URL 免费
CodeGeeX 智谱AI旗下的代码生成大模型,支持200多种主流编程语言的生成及翻译。开源模型:
CodeGeeX2 GitHub Repo stars
CodeGeex4 GitHub Repo stars
【项目原作解读】清华大学郑勤锴:CodeGeeX大规模多语言代码生成模型
URL 免费
Cursor 使用 GPT进行协作的代码编辑器 URL 付费/免费试用
ai-code-translator 利用chatgpt将代码从一种语言翻译成另一种语言。 GitHub GitHub Repo stars 免费,需要OpenAI API key
Amazon CodeWhisperer 亚马逊开放的AI编程辅助工具,根据你的注释和现有代码,实时生成从片段到完整功能的代码建议。在各种IDE的插件中可以安装,支持15种语言, 包括 Python, Java, and JavaScript等。只需要按照流程注册一个aws builder账号即可。 URL 免费
Fitten Code Fitten Code是由非十大模型驱动的AI编程助手,可以自动生成代码,提升开发效率,调试Bug。还可以对话聊天,解决您编程碰到的问题。免费且支持80多种语言:Python、C++、Javascript、Typescript、Java等。并提供丰富的IDE支持,包括Visual Studio Code、JetBrains系列IDE等。
“技术胖”B站视频:清华初创对决微软Github,哪家AI编程助手更强
URL 免费
gpt-engineer 一个根据指示生成代码的AI工具,能直接构建整个代码库。B站上的介绍演示视频:gpt-engineer:100%替代程序员的AI程序员来了... GitHub GitHub Repo stars 免费
flappy 一个产品级面向所有程序员的LLM SDK GitHub GitHub Repo stars 免费
腾讯云AI代码助手 腾讯云 AI 代码助手主要提供两类功能:AI 助手对话功能和代码补全功能。 URL 免费
Mistral/Codestral Mistral.ai的代码生成大语言模型,官方介绍:Empowering developers and democratising coding with Mistral AI., 模型下载:https://huggingface.co/mistralai/Codestral-22B-v0.1 URL 模型选择Codestral 免费

翻译工具

名称 说明 链接 费用
immersive-translate 开源的,沉浸式双语网页翻译扩展 GitHub GitHub Repo stars 免费
Deep L 准确即时的翻译工具,目前支持 31 种语言 URL 免费/付费
openai-translator 基于 ChatGPT API 的划词翻译浏览器插件和跨平台桌面端应用 GitHub GitHub Repo stars 免费,需要OpenAI API key

AI聊天-口语练习

名称 说明 链接 费用
豆包 字节跳动旗下的AI聊天软件,有网页、客户端和app应用 ; 体验测试视频:
B站视频:豆包 vs GPT,语音对决!豆包的魅力女友让人难以招架~
URL 免费
pi.ai 一个公认很会聊天的AI,不用担心把天聊死了,并且支持文字和语音。语音输入需要借助苹果系统自带的输入。很适合练习英语对话和听力 URL 免费
Voice Control for ChatGPT chrome扩展程序,通过它可以与 ChatGPT 进行语音对话。可以帮助英语口语或其他语言口语练习。
视频示例:B站视频:免费口语老师:如何用ChatGPT练习英语口语
URL 免费,需要chatgpt账号
SpeechGPT 开源项目,SpeechGPT 是一个让你与 ChatGPT 聊天的网站。 GitHub GitHub Repo stars 免费,需要OpenAI API key

语音识别-生成字幕

名称 说明 链接 费用
whisper 开源,OpenAPI 开源的通过大规模的弱监督进行鲁棒性的语音识别的模型 GitHub GitHub Repo stars 免费
buzz 开源,基于OpenAI的Whisper识别语音并生成字幕的开源桌面软件,使用CPU进行处理 GitHub GitHub Repo stars 免费
WhisperDesktop 开源,基于OpenAI的Whisper,Windows系统的桌面应用,使用GPU进行处理,GPU性能好的话会比CPU上更快。使用介绍:https://www.appinn.com/const-me-whisper/ GitHub GitHub Repo stars 免费
whisperX 开源,一位来自牛津大学的博士生Max Bain开源的模型,WhisperX可以按照单词对齐时间戳,基本上生成的字幕都是完整的句子。生成结果除了srt还有json文件,里面有每一行里面单词的时间戳,可以根据需要二次整理字幕。还能识别发言人,准确率还可以。使用示例:
1. 在google colab上使用whisperX生成youtube视频字幕的代码whisperx_youtube_subtitle,可以免费使用colab的GPU,使用GPU T4,2小时40分钟的视频字幕生成6分钟左右,挺快的。
whisperX GitHub Repo stars 免费
飞书秒记 上传视频或者音频可转录为文字,并可一键导出到飞书文档。处理速度很快,一个将近 2 个多小时的视频,约 6 分钟完成。 URL 免费,有企业付费版
通义听悟 阿里旗下的语音转录应用 URL 免费/付费
whisper-web 在浏览器中运行ML驱动的语音识别! 使用Transformers.js构建。Demo链接 GitHub GitHub Repo stars 免费

文字转语音

名称 说明 链接 费用
微软Azure 文本转语音 目前最好用最真实的语音工具,包括自媒体配音最常见的云希和晓晓的声音;
效果演示:痕继痕迹:啊?这是AI合成的?- 盘点那些超逼真的AI语音!
教程:免费使用微软的Azure;Azure使用详细教程;
URL 付费/每个月有50万字符的免费额度
剪映 文本朗读有很多的音色选择 URL 免费/vip
TTS-Online 提供超过160种声音选项 美真人配音选择,包含主流的小帅 小美 微软的一些语音,如果你是二次元游戏迷之类网站还提供超过1000+的动漫游戏角色的声音。网站可以提供api。分享者:issue URL 免费
火山引擎TTS 火山引擎的语音合成 URL 付费
配音神器 有网页端、windows客户端工具,使用比较方便 URL 付费/非 VIP 每天可试用 5 次
coqui-ai/tts 用于文本到语音的深度学习工具包
在线体验Demo网页:https://huggingface.co/spaces/coqui/xtts
Github GitHub Repo stars 免费
elevenlabs 文字转语音的服务,提供多种语言 URL 免费/付费
netease-youdao/EmotiVoice EmotiVoice是一个强大的开源TTS引擎,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。 Github GitHub Repo stars Free
tetos 适用于多个文本转语音 (TTS) 提供程序的统一接口,支持Edge TTS、OpenAI TTS、Azure TTS、Google TTS、火山引擎TTS、百度TTS Github GitHub Repo stars 免费
ChatTTS ChatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。官网:https://chattts.com/ GithubGitHub Repo stars 免费
FunAudioLLM/CosyVoice 阿里开源的TTS模型 Github GitHub Repo stars 免费

音乐识别

名称 说明 链接 费用
shazam 下载shazaom app可以进行音乐识别,识别速度挺快的 URL 免费

声音克隆

名称 说明 链接 费用
剪映 目前只有APP端有声音克隆的功能,朗读一小段文字就能完成音色的克隆,音色效果很牛。当你添加文本时,在“文本朗读”那个功能中,点击“我的”tab,就能看到这个功能了 URL 限免
豆包 字节跳动的AI聊天应用,豆包app中声音设置可以选择“创建我的声音”,回答问题的时候就可以用克隆的声音来回答了 URL 免费

语音翻译

名称 说明 链接 费用
Seamless 可以实时翻译100多种语言,延迟不到2秒钟,说话者仍在讲话时就开始翻译。Seamless翻译不仅仅是文字上的转换,还能保持说话者的情感和语气、语调等,使得翻译后的语音更加自然和真实。Seamless模型统一了SeamlessExpressive、SeamlessStreaming和SeamlessM4T v2的功能。旨在实现多语言、表达性和流畅的语音翻译。在线体验Demo地址 Github GitHub Repo stars Free

语音合成

名称 说明 链接 费用
so-vits-svc So-vits-svc(也称Sovits)是基于VITS、soft-vc、VISinger2等一系列项目开发的一款开源免费 AI 语音转换软件,用户只需准备几十分钟到几个小时不等的语音或歌声数据,就能制作属于自己的 AI 声库,将一段语音或歌声转换为你想要的音色。更多介绍
B站视频:手把手教学!如何自己训练一个AI歌手 - sovits本地&云端训练教程
GitHub GitHub Repo stars 免费
open-mmlab/Amphion 开源音频、音乐和语音生成工具包, 在线使用:https://huggingface.co/amphion
文章介绍:机器之心:霉霉演唱《稻香》,国内团队的Amphion音频生成火了
Github GitHub Repo stars 免费

语音处理

名称 说明 链接 费用
vocalremover 分离人声和伴奏 URL 有免费的试用额度/付费
lala.ai 从任何音频和视频中提取人声、伴奏和各种乐器 URL 有免费的试用额度/付费

AI生成音乐-音效

名称 说明 链接 费用
海绵音乐 字节跳动推出的AI音乐创作网站,输入提示词和风格来创作音乐 URL 免费
suno.ai 使用AI通过文本来创作音乐 suno专题页面
应用示例:
韩雪:【AI音乐家】我在古镇用AI写歌!
URL 免费/付费
udio 使用AI通过文本来创作音乐 URL 免费/付费
elevenlabs/sound-effects elevenlabs 提供的通过文本生成音效的工具 URL 免费
suno-ai/bark 文本转音频模型 Github GitHub Repo stars 免费
audiocraft Meta开源的一个用于音频/音乐生成的开源库,其中主要包括两个模型,MusicGen:文本到音乐模型,AudioGen:文本生成声音模型。MusicGen在线Demo GitHub
GitHub Repo stars
免费
Stable Audio stability.ai旗下的AI音乐、音效生成应用 URL 免费/付费
OptimizerAI 音效生成 URL 官方推文介绍 免费/付费

视频翻译

名称 说明 链接 费用
easyvideotrans 着眼于从原始视频到翻译后最终视频的整个工作流程,在线网站 Github GitHub Repo stars 免费

学术科研

名称 说明 链接 费用
gpt_academic 为GPT/GLM提供图形交互界面,特别优化论文阅读润色体验,模块化设计支持自定义快捷按钮&函数插件,支持代码块表格显示,Tex公式双显示,新增Python和C++项目剖析&自译解功能,PDF/LaTex论文翻译&总结功能,支持并行问询多种LLM模型,支持清华chatglm等本地模型。兼容llama,rwkv,盘古大模型等。 GitHub GitHub Repo stars 免费

OCR图像识别文字

名称 说明 链接 费用
微信 微信对话框中的图片有提取文字的选项,识别效果很好,使用了几次基本没有什么识别错误。
2021-03月份 微信AI对OCR功能的介绍:三年磨一剑——微信OCR图片文字提取
免费
Umi-OCR 开源、免费的离线OCR软件。支持截屏/粘贴/批量导入图片,段落排版/排除水印,扫描/生成二维码。内置多国语言库。 Github GitHub Repo stars 免费

视频内容总结

名称 说明 链接 费用
ChatGPT for YouTube Chrome 插件,快速总结 Youtube 视频內容,需要登录chatgpt账号或者apikey URL 免费
Chat Youtube 给一个Youtube 链接,它能给出总结,还可以向它提视频內容相关的问题 URL 免费
BibiGPT 开源项目,音视频内容 AI 一键总结:哔哩哔哩、YouTube、网页、播客、会议、本地文件等 GitHub GitHub Repo stars 免费

AI生成模特试装和商品图

名称 说明 链接 费用
PhotoStudio 虹软PhotoStudio AI智能商拍为商家设置了极为简单便捷的使用流程:上传衣服图/人台图/真人图,选择模特库中的模特和场景,只需3步即可瀑布式产出服装模特商拍大片。 URL 付费/试用

人形机器人

名称 说明 链接 费用
Figure 01 获得了微软、OpenAI、英伟达和亚马逊等投资方的投资 URL
Altlas 波士顿动力新的电动人形机器人 URL
Optimus Gen 2 特斯拉的人形机器人 URL
Apollo Apptronik公司的人形机器人 URL
GR-1 傅利叶公司的人形机器人 URL
Digit Agility公司的人形机器人 URL
NEO 1x公司的人形机器人 URL
H1 宇树科技的人形机器人 URL
Phoenix sanctuary.ai公司的人形机器人 URL
MenteeBot 以色列人形机器人公司 Meetee Robotics 发布的首款双足人形机器人 URL

评测

大语言模型评测

精选文章

chatgpt相关文章

其他

Star 历史记录

Star 历史记录

赞赏支持

如果您喜欢这个项目,可以赞赏一下支持我们,谢谢您的支持!