商汤股价爆发,或因日日新5.0大模型_顶尖财经网
  您的位置:首页 >> 财经频道 >> 风险投资 >> 文章正文

商汤股价爆发,或因日日新5.0大模型

加入日期:2024-4-25 19:03:32

  沉寂良久的AI企业商汤科技近日迎来爆发。4月24日,商汤高开3.28%,开盘后公司股价迅速拉升,盘中涨超30%,之后11时15分起公司股票暂停买卖。暂停交易前,商汤股价涨幅31.15%,股价报0.8港元/股,成交量远高于前几日。当日晚间,商汤在港交所发布公告称,已向港交所申请4月25日上午9时起恢复买卖。

  4月25日延续了此前的好光景,商汤复牌后续涨3.75%。

  业界将商汤股价大涨归因于日日新5.0大模型的发布。商汤科技也公告称,除了日日新5.0的推出外,董事会不知悉有关价格及交易量变动的任何原因。

  在此前的4月23日,商汤正式推出“日日新SenseNova5.0”大模型,自2023年4月首次问世至今,商汤“日日新SenseNova”大模型体系已推出五个大版本迭代,最新的5.0版本采用混合专家架构(MoE),超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。

  商汤科技董事长兼CEO徐立表示,本次更新主要增强了知识、数学、推理及代码能力,全面对标GPT-4 Turbo,主流客观评测上达到或超越GPT-4 Turbo。

  实际上,自百模大战后,端侧大模型一直是AI巨头的兵家必争之地。所谓端侧大模型,是指运行在设备端的大模型,通常比通用大模型参数量要小,因此可以使用端侧算力直接运行。对网络条件的要求也更低,隐私不必离开设备且无需云端算力,端侧AI都可以生成回答,因此拥有更低的成本。

  在日日新5.0大模型体系中,商量端侧模型SenseChat-Lite成为了此次发布的最大亮点。在基准测试中,该端侧模型全面超越了MiniCPM-2B、Phi-2等同量级的大模型,并且还越级比肩一些7B、13B大模型。

  因为成本更低,端侧模型有望对消费产业带来积极影响,包括汽车、手机、XR等设备,让更多平价的电子设备接入大模型的智能体验,无需考量算力成本。