全书地图

AI知识体系结构图


算力资源

LLM(大模型)

  • 定义和原理
  • 视觉生成模型
  • 图像生成模型
  • 多模态大语言模型
  • 编码器/解码器
  • HuggingFace/魔搭
  • Ollama管理
  • LM Studio
  • Xinference
  • 实验和评估
  • 微调技术
  • 练习资源

AI开发与应用

安全/资讯

AI创业信息
AI研究报告
AI法规和标准
AI安全实践
AI道德与论理

人工智能技术结构图


应用层
AI产品
ChatGPT
Claude
Gemini
Sora
DeepSeek
Kimi
通义千问
Stable Diffusion
Midjourney
ComfyUI
Dify ...
开发框架
LangGraph
Semantic Kernel
AutoGPT
MetaGPT
核心概念
AIGC
MoE
CoT
Multi-Agent
Embedding
Fine-tuning
LoRA/QLoRA
Function Call
MCP
模型层
主流大模型
GPT-4/4o/o1/o3 Claude 3.5/4.5 Gemini 2.0 Llama 3/3.1/3.3 Qwen3/QwQ DeepSeek-V3/R1 GLM-4/GLM-Z1 Yi-Lightning Doubao DALL-E 3 SD 3/FLUX Sora Whisper ...
安全对齐
多模态融合
向量检索
模型训练
预训练
监督微调(SFT)
RLHF
DPO
PPO
RLAIF
推理优化
vLLM
TensorRT-LLM

量化(GPTQ/AWQ)
KV Cache
技术层
图像分类
目标检测
语义分割
实例分割
图像生成
图像增强
视频理解
OCR识别
3D重建
姿态估计
...
语音增强
语音转换
语音翻译
声纹识别
情感识别
语音克隆
降噪处理
音频分离
音乐生成
...
位置编码
并行处理
MoE架构
Flash Attention
Multi-Query Attention
Speculative Decoding
ViT (Vision Transformer)
DiT (Diffusion Transformer)
Mamba/SSM (状态空间模型)
推理技术
Chain of Thought
Tree of Thoughts
Self-Consistency
ReAct
Reflection
Few-Shot Learning
Zero-Shot Learning
In-Context Learning
基础层
算力
ASIC/FPGA
神经网络芯片
并行计算
集群/云计算
边缘计算
算法
学习
迁移学习
联邦学习
算法框架
PyTorch
TensorFlow
JAX
MindSpore
PaddlePaddle
数据
非/结构化数据
多模态数据
数据合成
数据清洗
数据标注
基础学科
统计学
语言学
生物学
认知科学
逻辑学
哲学
控制论
机器人学
信息论

阅读指导

底层及模型研究

面向人工智能底层基础设施研究和研发的人员,涉及到学科基础、计算机基础(机器学习、神经网络、自然语言处理、视觉音频、算法等)、人工智能系统工程等范围,内容比较晦涩,但干货满满。

详情>>

生态应用开发

人工智能的概念认知、基础底层能力的认知、大模型的使用和微调、各大模型开放平台的能力及使用方法,结合业务案例分析,适合产品经理、应用开发人员以及想利用AI创业人员的阅读内容指导。

详情>>

AI工具/平台使用

人工智能的概念认知、大模型开放平台的功能使用介绍;AIGC的各种工作使用说明,文生图、文生音频、文生视频,提示词工程知识;AI工具结合用于文案编写、图册设计、PPT制作、方案策划、报告编写、视频制作等实用技能。

详情>>

行业关注者

人工智能的概念认知、人工智能发展,各行业人工智能利用现状,人工智能新闻资讯、以及对社会经济各方面影响,法律法规,媒体新闻...

.

详情>>

©2025 AI全书. Some rights reserved.

    备案号: 浙ICP备06043869号-8