avatar
AI全书
首 页
分 类
全部文章
阅读指导
关键词学习
关 于

大模型配置硬件参考自查表

大模型部署需要的硬件配置参考表,包含大模型推理与训练通用硬件选配表(英伟达系列、各种模型参数对照、微调和推理所需、典型场景配置方案)、.DeepSeek R1各模型硬件需求以及DeepSeek R1硬件选配的一些思路

2025-03-09 管理和使用 939
手把手教你本地部署阿里QwQ-32B推理模型

手把手教你本地部署阿里QwQ-32B推理模型

本文是一篇详细的教程,旨在指导读者如何本地部署阿里 QwQ-32B 推理模型,帮助用户高效利用这一强大的语言模型进行开发和应用。文章分为三大部分:首先是通过 Ollama 部署模型,包括获取安装信息、本地部署、运行模型以及删除模型的步骤;接着介绍了使用 vllm 部署模型的方法,涵盖环境搭建、模型下载、Python 脚本测试以及创建兼容 OpenAI API 接口的服务器等内容;最后探讨了模型的使用方式,包括 Chatbox 配置和 API 调用示例。文章不仅提供了清晰的操作步骤和代码示例,还展示了模型在实际任务中的推理效果,适合希望在本地环境中高效利用 QwQ-32B 模型的开发者和研究人员阅读。

2025-03-07 管理和使用 2872
QwQ-32B:超越671B DeepSeek-R1的智能革命——更小、更快、更强

QwQ-32B:超越671B DeepSeek-R1的智能革命——更小、更快、更强

QwQ-32B是阿里巴巴最新发布的大模型,这款拥有320亿参数的语言模型通过强化学习(RL)技术实现了对数学推理、编程能力及通用问题解决能力的显著提升。在与DeepSeek-R1等顶尖模型的对比中,QwQ-32B不仅性能相当,而且资源消耗更低,成为追求高效能和环保AI解决方案的理想选择。本文深入剖析了QwQ-32B的特点、优势、部署方法及其应用场景,为开发者提供了一条通往未来人工智能的清晰路径。

2025-03-07 热门模型 439
Manus工作原理揭秘:解构下一代AI Agent的多智能体架构

Manus工作原理揭秘:解构下一代AI Agent的多智能体架构

Manus是一款基于多智能体架构的AI代理,能够自主规划和执行任务,具有任务理解、分解、执行计划制定、工具使用、记忆管理等功能。其核心模块包括规划模块、记忆模块和工具使用模块,通过多智能体协作完成复杂任务,具备自主规划能力、上下文理解、工具集成、安全隔离等特点,适用于旅行规划、金融分析、教育支持、商业决策、市场研究等场景,与传统AI助手相比有显著差异和优势。

2025-03-07 Agent(智能体) 4144
Cursor+Claude3.7的绝杀:从原型到app,两步完成app开发

Cursor+Claude3.7的绝杀:从原型到app,两步完成app开发

在当今快节奏的产品开发环境中,如何高效地从概念到原型是每个产品经理面临的挑战。本文将为你揭示如何利用Cursor 0.46版本与Claude 3.7的强强组合,迅速勾勒出产品原型的核心逻辑,并通过实际案例展示其强大的开发技巧。无论是交互设计、视觉布局,还是初步的前端功能实现,这一组合都能轻松搞定,让你的原型开发效率翻倍,节省大量时间和成本。如果你希望在短时间内打造出高质量的原型,这篇文章绝对不容错过!

2025-03-01 Cursor项目案例 5189
消费级显卡部署DeepSeek-R1满血版部署教程

消费级显卡部署DeepSeek-R1满血版部署教程

KTransformers作为一个开源框架,专门为优化大规模语言模型的推理过程而设计。它支持GPU/CPU异构计算,并针对MoE架构的稀疏性进行了特别优化,可以有效降低硬件要求,允许用户在有限的资源下运行像DeepSeek-R1这样庞大的模型。KTransformers实现了强大的CPU+DDR5+24GB显存环境下本地运行DeepSeek-R1满血版的能力,大大降低了部署成本和技术门槛。

2025-02-25 管理和使用 546
Figma + Cursor:用 MCP Server 实现设计到代码的无缝转换

Figma + Cursor:用 MCP Server 实现设计到代码的无缝转换

本文介绍了 Figma-Context-MCP 服务器,这是一个专为 AI 编码工具 Cursor 设计的解决方案,通过提供 Figma 文件的结构化布局信息,显著提升 AI 将设计转换为代码的准确性和效率,简化开发流程,助力开发者高效实现设计到代码的转换。

2025-02-21 MCP(大模型上下文协议) Cursor深度使用 6756
KTransformers:让DeepSeek加速27倍的国产推理框架

KTransformers:让DeepSeek加速27倍的国产推理框架

本文介绍下什么是KTransformers、架构、核心功能以及如何使用它,最后介绍下KTransformers的适用场景。

2025-02-14 管理和使用 493
Cursor中的项目管理技巧,让Cursor真正能在项目中用起来!

Cursor中的项目管理技巧,让Cursor真正能在项目中用起来!

结合自己的深度的实战经验,把项目管理概念引入到Cursor里面来,这样可以真正地利用Cursor的能力,帮你完成一些复杂的项目工作。

2025-02-11 Cursor深度使用 1951
Cursor不用Rules会让你的项目失控!一文告诉你怎么使用

Cursor不用Rules会让你的项目失控!一文告诉你怎么使用

让你的项目可控,介绍Cursor的高级使用——Cursor里的Rules是什么,能做什么,怎么使用Rules,一文让你看懂!

2025-02-10 Cursor深度使用 4669
  • 1
  • 2
  • 3
  • 4
  • …
  • 17

Recently Updated

  • 一文看完大模型微调技术:微调背景、分类和微调全流程介绍
  • 【推荐】Cursor网络搜索插件:基于MCP协议的搜索服务
  • 一文看懂什么是MCP(大模型上下文)?用来干什么的?怎么用它?
  • 人工智能(AI)编年史 ,持续更新中...
  • Augment实战-编写生产环境CICD脚本

Trending Tags

技术开发 理论研究 创意设计 原创 艺术家 算法 理论 自媒体 全民认知 工具框架

©2025 AI全书. Some rights reserved.

    备案号: 浙ICP备06043869号-8