3377体育
手机站 - 网站地图 - 广告服务- 信息公开
您的当前位置:3377体育 > 资讯 > 供应链 > 正文

国产大模型井喷式发展下的繁荣与隐忧-3377体育

来源:现代物流产业网 作者:贾奥胜 时间:2025-04-03
导读:近期,国产大模型领域呈现出“周周有新品、月月有突破”的井喷式发展格局,在通用模型、垂直场景及开源生态等方面均取得了显著成果,令人目不暇接。

文 / 现代物流报记者 贾奥胜

近期,国产大模型领域呈现出“周周有新品、月月有突破”的井喷式发展格局,在通用模型、垂直场景及开源生态等方面均取得了显著成果,令人目不暇接。

(图源:deepseek3377体育官网)

今年的《政府工作报告》提出,持续推进“人工智能 ”行动。

近日,交通运输部已启动综合交通运输大模型(简称交通大模型)建设工作,并组建工作专班,多次组织专题调研和论证,研究交通大模型架构和建设路径。

这一繁荣景象的背后,不仅有技术迭代的推动,更有政策与资本的双重助力,同时在交通、能源等多个行业也涌现出诸多创新应用案例。

国产大模型井喷式爆发

交通运输大模型建设采用“1 n x”体系,即基于1个通用基础大模型,开发n个行业垂域模型,服务于物流调度、交通规划、应急响应等典型场景。对物流行业意义重大,有望推动物流行业的智能化升级,提高运输效率和服务质量。

这一建设工作的起步,实则是国产大模型蓬勃发展的有力见证。

2024年11月,深度求索deepseek-r1以数学推理和代码生成能力为核心,借助强化学习显著提升了性能,成为首个对标openai o1的国产深度推理模型。

一时间,引燃ai热潮。

第三方即配平台顺丰同城成为首批接入deepseek大模型的物流企业,将依托deepseek低成本、高性能、高开放度的三重优势,为顺丰同城全场景业务和全生态链参与者提升智慧化赋能。

同期,阿里通义qwq系列推出32b参数推理模型。12月,月之暗面kimi-k1突破200万字长文本处理能力,重点优化法律合同解析与学术研究场景,成为长文本领域的标杆。

今年2月,阿里通义qwen2.5-max基于moe架构的千亿级模型,在chatbot arena盲测中综合性能跻身全球前五,多模态能力显著提升。华为昇腾deepseek系列接入国家超算互联网平台,实现低成本推理服务,获微软ceo纳德拉公开认可其计算效率。

一季度,minimax-text-01和首个全国产算力训练的深度推理模型讯飞星火x1相继问世。

助推物流业新生态构建

国产ai大模型的爆发式增长,背后是供应链全链路数字化升级的必然结果。

我国通过政策引导和资本投入,大力推动算力基础设施的规模化建设。如今,覆盖全国的智算中心和算力网络已初具规模,如合肥第二总部、中国移动“九天”大模型平台等。

(图源:新华社)

我国庞大的用户基数和丰富的应用场景,如电商、物流、工业等,产生了海量多模态数据,为ai大模型训练提供了丰富的“燃料”。同时,数据基础设施不断完善,minedata平台、国汽智图等通过数据脱敏、合规传输机制,有效解决了数据安全与隐私问题,加速了数据流通,使得数据能够更好地服务于模型训练。

国产ai企业纷纷通过“芯片-框架-模型-应用”全栈布局,形成闭环生态。京东物流超脑大模型与智能仓储硬件实现端到端调度,提高了物流运作的智能化水平。

供应链各环节的智能化需求倒逼大模型技术创新。在制造业,ai大模型用于需求预测,菜鸟“天机π”将交付周期缩短;在物流领域,智能调度和ocr识别技术得到广泛应用,百度地图物流大模型做到了运输成本的优化。

国务院国资委将出台专项支持政策,持续深化中央企业“ai ”专项行动,工信部“大模型产业化应用”政策等为技术研发和场景落地提供了有力的政策支持。例如,北京市车路云一体化项目通过政企合作探索数据共享机制,推动了ai大模型在智能交通领域的应用。

我国ai大模型的爆发是供应链全链路数字化升级的必然结果。上游算力与数据的突破、中游技术生态的整合、下游场景需求的拉动,叠加政策与资本红利,共同推动了国产ai大模型的快速发展。

狂欢背后的冷思考

ai大模型的爆发助推了我国全社会物流成本的有效降低。但在繁荣背后,也面临着诸多隐忧与挑战。

从技术层面来看,技术同质化与资源分散问题较为突出。当前,大多数机构研发的大模型集中于通用对话、代码生成等场景,导致在这些领域竞争激烈,而在部分垂直领域,如农业、能源等,仍缺乏高质量模型。这不仅限制了国产大模型在更多行业的应用,也造成了资源的浪费。

同时,尽管国产芯片适配率有所提升,但大部分头部模型仍依赖英伟达a100/h100进行训练。华为昇腾等国产算力集群虽然取得了一定进展,但尚未完全解决软件生态兼容问题,这使得国产算力在市场竞争中处于劣势。

训练资源的限制也是一大难题。据公开信息,训练gpt-4消耗了约2.4亿度电,使用2.5万块英伟达a100 gpu(每块功耗 400w),单次训练耗时3个月。

而国内拥有1万枚gpu的企业很少,且单枚gpu普遍弱于英伟达a100。由于英伟达a100及以上性能gpu被列入管制清单,中国企业能获取的替代品为英伟达a800,但a800也存在缺货和溢价的情况。这导致国内大模型训练面临硬件资源不足和成本高昂的双重困境。

商业化与可持续性难题同样不容忽视。多数厂商依赖api调用收费,但deepseek- r1等开源模型的出现挤压了付费空间,得部分创业公司因资金链断裂而退出市场。

(图源:小红书)

面对这些挑战,国产大模型需探索从“量”到“质”的转型路径。国产大模型在取得一定成绩的同时,需警惕低水平重复与资源分散问题。通过开源协作、数据共享与垂直深耕,推动从“量”到“质”的转型,才能实现可持续发展,在人工智能领域占据更有利的地位。

 

责任编辑:崔哲源
全媒体热线 : 4000-5656-98
微博
微信
视频号
上一篇:
下一篇:
信息公开中物汇成帮助中心广告服务网站地图 │ 违法和不良信息举报电话:010-83775637 │ 24小时新闻热线:010-83775637
3377体育 copyright © 2005-2020 现代物流产业网 3377体育的版权所有 客服热线:4000-5656-98
《现代物流报》社有限公司授权 北京中物汇成工程技术研究院有限公司 为现代物流报3377体育官网 管理方
www.xd56b.com和www.z56c.com两个英文域名同时使用一个主体网站
英文域名:www.xd56b.com   
英文域名:www.z56c.com   
3377体育的技术支持:现代物流报社技术部
top
网站地图