Gartner:2027年基于云的AI推理工作负载占比将达80%
- +1 你赞过了
10月18日消息,据市场研究机构Gartner预测,到2027年,中国的全部AI推理工作负载中,基于云的工作负载占比将从前的20%上升至80%。
DeepSeek于2024年5月6日推出了V2模型,价格仅为GPT-4 Turbo的1/75。几天后,字节跳动于5月16日推出豆包大模型,宣称比行业平均价格便宜99.3%。作为应对,阿里巴巴、百度和腾讯纷纷调整了其大语言模型API的价格。
Gartner指出,在计算企业GenAI解决方案的总拥有成本(TCO)时,需要将微调成本考虑在内。首先,可以使用高端GenAI模型来评估企业用例的技术可行性,然后使用企业自身的数据,对小型模型进行微调,以执行特定的下游任务。此外,在使用API将数据上传到云端时,还应考虑额外的数据安全和隐私要求。与规模较小的模型相比,最先进的大语言模型的价格变化并不显著,这将进一步减轻价格变动的影响。
另外,企业应根据业务重点来选择AI部署方式,尤其需要从六个角度比较云部署和本地部署方案的优劣势,这六个角度分别是:企业数据的主要存放位置、安全和监管合规、专门的基础设施、平台/集成的优劣势、运营支出(OpEx)与资本性支出(CapEx)、人才和技能集合。
最新资讯
热门视频
新品评测