一览AI开源列表，业界排行前面的都帮你列全了

访问量 1813 Posted 2024-03-29 Updated 2024-09- 12 53~69 min read

AI开源项目太多了，本页面列出了业界比较全的开源项目，含大模型、AIGC工具、解决方案项目等多个方面的开源列表，包含项目/工具的特性、功能等，方便读者可以根据自己的定位和场景的需要选择对应的开源项目了解，省得去网上大量搜索摸索。

大模型

想学习大语言模型(LLM)，应该从哪个开源模型开始？

Llama 3 26.5K

Llama-3共有80亿、700亿两种参数，分为基础预训练和指令微调两种模型。
与Llama-2相比，Llama-3使用了15T tokens的训练数据，在推理、数学、代码生成、指令跟踪等能力获得大幅度提升

开源地址：GitHub

介绍/使用

Meta Llama3 大模型在 Mac 上的部署和运行

DBRX 2.5K

1320亿参数，截止2024年3月最强大的开源大语言模型；
基准测试上超过了 GPT-3.5，并在质量上可与 Gemini 1.0 Pro 和 Mistral Medium 竞争，推理速度几乎比 LLaMA2-70B 快两倍，总参数和活动参数数量比 Grok 小约 40%。

开源地址：基础版微调版 GitHub

介绍/使用

开源大模型王座再易主，1320亿参数DBRX上线，基础、微调模型都有

Llama 2 55.2K

包含70亿、130亿和700亿三种参数变体
具备多模态能力，支持多语言
推理、编码、精通性和知识测试上都有优越的性能

开源地址：GitHub

介绍/使用

Llama-Chinese 9K

Llama中文社区，提供完全开源可商用的中文Llama大模型

开源地址：GitHub

QwenLM 系列

阿里云通义千问开源模型

开源地址：GitHub

介绍/使用

Baichuan-7B(支持中文) 5.7K

采用LLaMA的相同架构，在中文上做预训练。可商用

开源地址：GitHub

OpenLLaMA 7.3K

参考LLaMA的代码，在Apache 2.0 license下的重新实现和训练。使用了RedPajama训练集合

开源地址：GitHub

Alpaca 29.3K

lama7b + self-instruct数据指令微调
最早迈出LLaMA+SFT这一步的模型
1张8卡A100(80G显存)，52k数据，训练3个小时，成本大概100刀

开源地址：GitHub

Vicuna 36.2K

llama13b + ShareGPT对话数据，微调
受协议限制，vicuna模型公布的权重也是个delta，每个参数要加上llama原来的权重才是模型权重

开源地址：GitHub

GPT4ALL 68.6K

LLaMA用80w的GPT3.5的数据(code, story, conversation)微调而来

开源地址：GitHub

Chinese-LLaMA-Alpaca(支持中文) 18.1K

LLaMA + 扩词表 + lora
属于局部参数预训练
在Chinese LLaMA的基础上，仿照Alpaca训练了Chinese Alpaca

开源地址：GitHub

StableVicuna 15.8K

LLaMA + FT + RHLF，可以说是把ChatGPT的路径完整走了一遍

开源地址：GitHub

llama.cpp 63.8K

LLaMA 推理优化，用C/C++实现的推理，不依赖显卡

开源地址：GitHub

ChatGLM

MiniGPT-4

框架和工具

LobeChat 37.2k

一个开源的 ChatGPT/LLMs 聊天应用与开发框架，提供优雅的用户界面设计、流畅的对话体验和便捷的部署方式，支持语音合成、多模态、可扩展的（function call）插件系统。

开源地址：GitHub

介绍说明：

ollama 86k

可以让我们轻松在本地运行Llama2、Gemma等多种开源大模型，生态丰富
普通电脑可运行，一键安装，提供Rest Api服务
支持Llama 2、Gemma、通义千问、LLaVA(图片识别)等多种大模型

开源地址：GitHub

介绍说明：

轻松在本地运行Llama2、Gemma等多种大模型，无需GPU！

Open-webui 11.5k

专为LLM（Language Model）打造的先进Web界面工具，旨在为用户提供直观、高效的大模型交互体验。它支持多种LLM大模型，不仅兼容Ollama，还兼容OpenAI的API，让用户能够轻松集成和管理各类大模型。

开源地址：GitHub

GPT_API_free 14.7k

Free ChatGPT API Key，免费ChatGPT API，支持GPT4 API（免费），ChatGPT国内可用免费转发API，直连无需代理。可以搭配ChatBox等软件/插件使用，极大降低接口使用成本。国内即可无限制畅快聊天。

开源地址：GitHub

使用说明：

一个可以获取免费ChatGPT API Key的开源项目

LangChain系列 92.2k

AI开发重量级框架，是一个用于开发由语言模型驱动的应用程序的框架，含LangChain、LangGraph、LangSmith、LangServe、OpenGPTs以及相关Demo。

开源地址：GitHub

使用说明：

音频类

whisper 66.3k

可将视频和语音文件转为文字，效果可以比肩科大讯飞的收费产品，无需GPU，普通配置就可以运行。

开源地址：GitHub

介绍说明：

用openai开源的whisper部署自己的语音识别系统

图片类

Stable Diffusion 67.2k

一种机器学习方法，用于评估模型的稳定性和鲁棒性。它通过改变模型的参数或数据噪声水平来计算模型的稳定性指标。stable diffusion 方法主要用于研究和开发，可以作为机器学习模型的稳定性分析工具和框架。

开源地址：GitHub

使用说明：

AI绘画教程之stable diffusion【2.Windows系统本地部署】

Stable-diffusion-webui 138k

一个稳定扩散web界面，基于grado库开发，提供了友好的浏览器界面，方便用户对稳定扩散模型进行可视化和操作。

开源地址：GitHub

整体方案

Gpt-pilot 26.7k

帮助开发人员更快速地构建应用程序。它的工作方式是您指定要构建的应用程序类型，然后GPT Pilot会询问澄清问题，创建产品和技术要求，设置开发环境，逐步编写应用程序的代码，就像在现实生活中一样，而您则负责监督开发过程。

开源地址：GitHub

DIFY 42.4k

Dify 是一款开源的大语言模型(LLM) 应用开发平台。它融合了后端即服务（Backend as Service）和 LLMOps 的理念，包括对数百个模型的支持、直观的 Prompt 编排界面、高质量的 RAG 引擎、稳健的 Agent 框架、灵活的流程编排，并同时提供了一套易用的界面和 API。使开发者可以快速搭建生产级的生成式 AI 应用。即使非技术人员，也能参与到 AI 应用的定义和数据运营过程中，

开源地址：GitHub

使用说明：

官方文档

19类Agent（智能体）开源框架>>

LLM(大模型)

原创工具框架开源项目技术开发产品经理

License: CC BY 4.0