欢迎来到人工智能与机器人产业平台!
智迎未来
数据资产登记
  • 全部智能领域
  • 智能制造 / 智能物流 / 机器视觉
  • 智能办公 / 智能家居 / 智能安防
  • 智能交通 / 智能能源 / 智慧零售
  • 智能文娱 / 智能金融 / 智能营销
  • 智慧党建 / 智慧政务 / 机器躯干
  • 智慧医疗 / 智慧教育 / 智慧农业
  • 机器小脑 / 智能传感 / 空间模型
  • 机器大脑 /
最新
最热
个人部署:Ollma 框架适合个人用户私有化本地部署,但在多用户并发场景下性能衰减明显。企业部署:推荐使用Transformers来快速验证模型能力,使用vLLM框架借助PagedAttention 技术实现24倍于Transformers的吞吐量实现大模型的高效推理,针对不同企业场景,则提供不同的企业级部署方案。其他方式:近期出现的KTransformers、Unsloth等多套低成本动态量化模型的DeepSeek部署解决方案。目前暂不够成熟。
2025-05-12
阅读(46)