【TechWeb】2月17日消息,近日,深信服一朵云面向AI进行全新升级,为用户打造更匹配大模型场景的智算承载、应用构建的AI平台,面向用户基于DeepSeek承载和应用的场景,提供一键部署、性能更优、快速开发应用的最佳实践方案。
1、 线下基础设施从传统业务承载平台向智算承载平台升级,广泛适配包括DeepSeek在内的最新大模型。
深信服现已打造「HCI+AICP新一代超融合」解决方案,只需在原集群基础上增加一台GPU节点,就能基于本地集群快速部署并承载DeepSeek在内的企业级大模型。
除了支持英伟达GPU,深信服AICP算力平台和多家国产厂商开展了广泛的软硬件兼容测试,可适配天数智芯、昇腾、海光、沐曦、燧原等多款国产卡,为用户实现算力异构管理。
2、 线上托管云上线全新AI服务目录,提供DeepSeek等企业级大模型服务,用户可通过订阅来快速获取AI能力。
深信服托管云已支持基于专属资源+AICP的方式,为用户提供专属的企业级大模型服务,可满足用户对于线上部署专属服务模型的需求。
深信服会持续丰富线上服务目录,用户可以很容易地通过订阅的方式,快速平滑地获取AI能力,如DeepSeek等模型服务。
3、 全新发布AI应用创新平台,助力用户快速构建大模型应用,让AI应用的开发和运营变得更简单。
深信服AI应用创新平台内置RAG最佳实践流程,支持智能分片与直连企业自有知识库。用户仅需通过简单操作,即可构建高质量的RAG应用。深信服AI应用创新平台支持基于业务评测数据集的应用效果评估,并自动生成优化建议,用户无需理解复杂技术细节,即可完成配置优化,实现效果提升。
据介绍,向AI升级后,深信服全面优化推理性能,让跑在一朵云上的大模九游娱乐型应用可以实现推理性能的大幅提升,降低大模型整体使用成本。
相比基于个人开发者常用的Ollama方案部署DeepSeek,深信服通过AICP算力平台的部署方案在多实例、并发推理场景中可实现5-10倍的性能提升。大模型并发度更高、吞吐量更大、推理响应延时更低,让用户在企业级AI应用构建及实际使用时,资源投入更低、体验更优。
以32B模型为九游娱乐例,日常问答场景(2k上下文),AICP并发是Ollama的8~10倍,总吞吐10倍以上。
知识库应用场景(4k上下文),AICP并发是Ollama的2倍,总吞吐4~8倍。
每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。
超ChatGPT,DeepSeek成全球增速最快AI应用!国产AI黑马是如何炼成的?
TechWeb微晚报:仿冒DeepSeek的手机病毒被捕获,特斯拉低价车型Model 2实车首次曝光
网宿科技旗下Cloudsway深度融合DeepSeek+AI搜索,打造更智能的AI体验
岚图汽车2025年All in智能化 全部车型将搭载华为乾崑智驾和鸿蒙座舱
Gartner:到2029年,中国60%的企业将把AI融入其主要产品和服务中
苹果iPhone SE 4销量有望好于前三代 预计今年出货约2200万部
消息称博通探讨收购英特尔芯片设计与营销业务 台积电在评估参与接手芯片工厂
马斯克透露xAI Grok 3将在一到两周发布 推理能力强于当前其他任何大模型
苹果新一代iPad、iPad Air和MacBook Air有望搭载自研Wi-Fi和蓝牙芯片
消息称特斯拉4座整车工厂都在生产焕新Model Y 最快本月就将开始交付
青云QingCloud EHPC 打造即买即用的全流程SaaS化超算服务
蚂蚁链发布BTN:可将区块链网络吞吐量提升186% 带宽成本降低80%
蚂蚁自研数据库OceanBase宣布开源 300万行核心代码向社区开放
版权所有:Copyright © 2024 九游娱乐 版权所有 粤ICP备19072226号