千帆竞发 智潮涌动 | 透过网络洞察大模型应用发展脉络
2024-2-20 14:32:24 Author: www.aqniu.com(查看原文) 阅读量:7 收藏

千帆竞发 智潮涌动 | 透过网络洞察大模型应用发展脉络

日期:2024年02月20日 阅:19

在刚刚过去的2023年,各类大模型服务发展相当迅猛,从“百模大战”逐渐发展为“万模大战”。据报道【1】,目前国内已经通过备案和注册的大模型产品超过40家。国内大模型在模型精度、生成速度、模型理解等方面均有显著提升。大模型的应用场景也在不断扩展,涵盖了金融、医疗、教育等行业。与此同时,国内竞争格局也日趋激烈,各大科技公司纷纷加大投入,加速研发,力求在大模型领域取得领先优势。本文拟从电信大网视角,观察国内大模型网络调用情况,感知大模型相关业务的发展态势(报告详细版本请关注中国电信安全公众号并在后台回复“大模型态势2023”获取)。

  • 模型选择

基于中国电信安全公司(下文简称“电信安全”)的全网视角,我们试图从域名解析及网络流量角度分析我国在大模型使用方面的基本情况,并进一步探究国内用户大模型访问习惯及偏好。基于各大模型发布时间及成熟度,我们共选择了包括文心一言、星火大模型、智谱清言等15款国内主流的大模型产品,和包括ChatGPT,Claude等7款国外大模型产品作为分析对象。

  • 主要洞察
  • 国内用户市场份额已经基本形成,从模型使用量上,国内外模型均呈现一家独大的态势

01国产大模型产品使用情况

通过对流量数据进行初步分析,我们发现许多国产大模型被观测到的访问量非常低。为了更准确地展示主要趋势,我们选择了7款具有代表性的大模型产品进行流量统计,包括文心一言、讯飞星火、智谱清言、通义千问等大模型产品。

图1、国产大模型访问趋势及流量占比(直接访问+API)

从国内用户使用国产大模型的情况来看,文心一言持续稳定地占据了国内大模型市场份额的绝大部分,份额稳定在90%~95%之间。自2023年11月份百度发布文心一言4.0并开放用户注册以来,其访问量持续上涨,主要是由于用户主动直接访问的增加。此外,大模型的访问呈现以周为单位的周期特性,工作日访问量较大,周末相对较小。这表明大模型的使用场景当前主要与工作紧密结合。

因此,文心一言在国内大模型市场中占据绝对主导地位,而其他大模型产品则面临持续的竞争压力。

02国外大模型产品使用情况

我们继续观察国内用户对国外大模型的访问情况。同样地,我们将剔除流量极小的模型产品,包括Cohere、Mistral和Gemini等。

图2、国外大模型访问趋势及流量占比(直接访问+API)

图2显示了国内用户对国外大模型的访问趋势。从图中可以看出,ChatGPT在国内用户访问的国外大模型市场中占据了最大的份额,其次是Anthropic公司的Claude。相比之下,谷歌的大模型Bard在国内市场的受欢迎程度较低。

综上可以看出,国内用户对于大模型的使用已经形成比较稳定的竞争态势,文心一言及ChatGPT作为国内和国外大模型产品的领军代表,均呈现一家独大的态势。

  • 各省份在使用大模型上偏差较大,发达及沿海省份呈现出更积极的使用态势,而西部相对落后省份则相对欠缺

同样我们将大模型产品分为国产大模型和国外大模型来进行分析。

01国产大模型产品省/自治区/直辖市使用情况

图3、国产大模型访问量及大盘流量各省/自治区/直辖市分布

图3展示了各大模型访问量在Top10省/自治区/直辖市的分布情况。广东作为访问量最大的省份(超过20%),之后是江苏(10%~20%)。其他8个省/自治区/直辖市如浙江、四川、广西、湖南等也贡献了较大流量,占比在2%~10%之间。

考虑到各省/自治区/直辖市发展不均衡(如图3右侧饼图所示),为了更公平地衡量大模型使用的积极性,我们对大模型份额流量Top10的省/自治区/直辖市与大盘流量Top10的省/自治区/直辖市并集,共得到13个省/自治区/直辖市。对这些省/自治区/直辖市在大模型调用和大盘流量下的占比进行归一化统计,采用两者占比之差表示大模型使用指数。该值越高,说明该省/自治区/直辖市用户更积极地使用大模型;反之,则相对滞后。

图4、国产大模型各省/自治区/直辖市使用指数

图4显示了我们计算得到的国产大模型使用指数。沿海及相对发达的省/直辖市如广东、浙江、北京、上海、重庆等展现出更积极的使用态势。而一些中西部相对落后的省/自治区如广西、贵州、四川、湖南、新疆等,在国产大模型使用方面则稍显落后。

02国外大模型产品分省使用情况

图5、国外大模型访问量各省/自治区/直辖市分布

图5展示了国内用户访问国外大模型的省/自治区/直辖市分布情况。与访问国内大模型的趋势相似,广东省和江苏省的访问量最大(超过20%),其次是浙江省(10%~20%)。其他7个省/自治区/直辖市如四川、北京、新疆、上海等也有较大的流量贡献,占比在2%~10%之间。

为了更全面地了解国内用户对国外大模型的使用情况,同理,我们计算了国外大模型使用指数。该指数采用大模型使用流量占比与大盘流量占比之差来衡量。

图6、国外大模型各省/自治区/直辖市使用指数

图6显示了国外大模型的各省/自治区/直辖市使用情况指数。从图中可以看出,与国产大模型的使用态势相似,一些相对发达的省份和直辖市如广东、北京、上海、浙江等展现出更积极的使用态度。而经济相对欠发达的省份如广西、贵州、四川、云南等,在大模型使用方面仍存在局限性。

值得注意的是,与国产大模型使用态势不同的是,新疆维吾尔自治区在使用国外大模型方面相对更加积极,这需要国内大模型进一步思考如何更好地支持少数民族语言,提升大模型整体效果。而重庆市用户对国外大模型的使用则相对较少,他们更倾向于使用国产大模型。

  • 在调用方式分布上,国产大模型整体API占比呈现上升态势;一些新产品的发布会有较好的拉新效果。
图7、国产大模型流量访问形式

图7展示了国内用户,对同时具备API及直接访问入口的5个国产大模型的流量来源占比。通过观测其在不同时间点的流量来源占比,我们可以进一步了解用户在访问大模型服务时,调用形式的选择性偏好。

从图中可以看出,目前整体国产大模型调用形式主要包含3类:

第1类:文心一言

这一类别大模型已经积累了相当一部分的API访问用户,这部分用户通过API接口调用来访问大模型服务,形成比较稳定的流量来源和相对完善的生态。但随着文心一言其2023年11月开发新的产品服务,拉新到大量直接访问的用户,API占比有所下降。

第2类:星火、智谱

这两个国产大模型的访问行为相似,其主流(约80%)仍然是来自用户的直接访问,多数用户呈现直接访问大模型服务的情况。但从时间趋势上来看,其API访问占比逐步得到提升,会逐渐累积一部分核心用户。

第3类:百川、腾讯混元等

此类大模型流量来源基本全部来自用户直接的网页访问,尽管其开放了API调用接口,但基本上这部分用户极少。这进一步说明了用户仍然在持续尝鲜和验证的阶段。

综上所述,国产大模型的流量来源呈现出一定的多样性,用户在不同模型的调用形式时表现出一定的偏好。随着技术和应用场景的不断发展,用户对于大模型的使用习惯和偏好可能会进一步发生变化。

  • 境外用户使用国产大模型整体仍然处于比较激烈的竞争态势,局势尚不明朗;各个国家或地区对于国产大模型的使用呈现较大的差异性。
图8、境外用户对国产大模型访问趋势及流量占比(直接访问+API)

与境内用户访问国产大模型的情况相比,境外用户(包括港澳台等地区)对于国产大模型的访问情况呈现出多强鼎立且竞争突出的特点。文心一言虽然份额相对稳定,但其占比对比其在国内访问份额却显著下降,周均仅占25%左右。星火和智谱清言则处于第二梯队,并且智谱在某些阶段还会有突发性增长。此外,一些大模型呈现搅局态势,例如通义千问,依靠其市场影响快速崛起,这一点与国内的情况相同。Minimax公司发布的ABAB大模型,尽管在国内份额占比极小,但在境外用户中具备一定的认可度,在某些时间段呈现较高的份额占比。

可以看到,对于境外用户访问国产大模型而言,各模型占比变化相对频繁,存在较大的变数。这为国产大模型出海提供了一定的先决条件。国产大模型厂商可以通过不断提升技术实力和服务质量,积极拓展海外市场,以满足更多境外用户的需求。同时,也需要关注境外市场的竞争态势和用户需求变化,制定合理的市场策略,以取得更好的发展。

图9、境外使用国产大模型使用指数

图9展示了境外用户使用国产大模型的使用指数。从图中可以看出,相比于大盘流量,华人占比相对较高的亚洲、欧洲及美洲地区,拥有高于该国大盘份额的使用占比。例如,中国港澳台地区、美国、新加坡、印尼、德国和马来西亚等地的用户更倾向于使用国产大模型。这可能是因为这些地区的华人群体较大,对于中文大模型的需求更高。

相比之下,相对华人占比较低的国家,如荷兰、保加利亚、韩国、俄罗斯等地的用户,其使用国产大模型的驱动并不强。这可能是因为这些地区的用户对于中文大模型的需求较低,或者他们更倾向于使用本地化的大模型产品。

国产大模型在华人占比相对较高的境外国家或地区具有一定的市场前景,但也需要考虑到不同区域的用户需求和文化背景,制定相应的市场策略,以更好地满足用户需求并拓展市场份额。

图10、重点境外国家/地区的模型选择偏好

如图10,从不同国家或地区对于国产大模型的选择偏好来看,呈现出比较强的个性化色彩。文心一言在马来西亚和德国占比较高,通义千问则在韩国份额呈现压倒性优势,星火大模型则在泰国具有较强的优势,腾讯混元则在荷兰表现较为突出等。这一方面与各个大模型在不同国家的发力和推广政策有关系,例如百川在美国有业务宣传等。另一方面不同模型提供的差异化服务,可能也是不同国家用户在使用大模型时的首要考虑因素。

(5)大模型服务安全问题值得持续关注,内容安全逐步引起各监管部门重视。

之前我们曾经提到过大模型被频繁DDoS攻击的分析【2】,此次我们在分析数据过程中,发现流量数据中存在大量由于遭受攻击而未成功建立的连接。为了更加全面地揭示过去半年各家大模型受到的攻击情况,我们将各个大模型服务对应的IP地址作为目标地址,去回溯这些IP曾经被作为DDoS攻击目标的历史。

图11、重点模型DDoS攻击峰值流量分布

电信安全云堤·抗D统计数据来看,2023年到2024年1月份,多个大模型均遭遇DDoS攻击,累计69次,图11展示了重点大模型的DDoS攻击流量分布。其中,针对国产大模型如智谱清言、盘古等均受到了较大流量的攻击。豆包大模型虽然高攻击流量占比不高,但其最大一次攻击的峰值流量达到了600Gbps以上,高于其他大模型的峰值流量。

此外,除了大模型服务的稳定性问题外,大模型在自身的内容生成方面可能面临严重的安全风险。恶意用户可能会利用大模型的强大生成能力来生成虚假信息、传播谣言,对社会造成不良影响。同时,大模型还可能被用来生成具有误导性的内容,操纵公众舆论,危害社会稳定。此外,大模型还可能被用来生成恶意代码,对网络安全造成威胁。

针对大模型的安全问题,电信安全已经搭建了完备的大模型内容生成风险评测框架。该框架旨在测评、引导大模型向善,以降低法律风险,保护用户权益。同时,电信安全从大模型全生命周期视角出发,打造了大模型安全护栏服务,提供针对大模型输入输出的风险检测和安全防护能力,确保大模型服务的安全可信。

三、总结

电信安全作为信息时代的守护者,拥有强大的全网数据感知能力。这种能力不仅局限于基础的网络安全防护,更能深入到行业的每一处脉络,精准洞察其发展趋势和态势。通过这一独特的视角,电信安全为各行各业提供了宝贵的发展参考。

为了更好地适应日益繁杂的网络环境,电信安全将持续发挥运营商资源优势,基于不同于传统安全厂商的差异化视角,做到“守土有责”,在全网态势感知及分析领域扮演更加重要、不可替代的角色。通过深入的数据挖掘、精准的分析研判,电信安全可以帮助千行百业有安全需求的客户预见潜在风险,实现业务的稳健、高质量发展——这是电信安全在新时代的使命,也是我们不断创新、提升服务价值的动力所在。

引用:

【1】又有一批大模型及应用产品通过备案 

https://stcn.com/article/detail/1106421.html

【2】大模型也会被DDoS?重新审视AI时代下大模型的安全需求

https://mp.weixin.qq.com/s/xRyQVDdCvIuHOBwHnp-lUQ

*若您想进一步了解电信安全大模型内容生成风险评测框架、大模型安全护栏服务,请关注中国电信安全公众号并留言联系

天翼安全科技有限公司是中国电信集约开展网络安全业务的科技型、平台型专业公司,以研发运营一体化方式,整合全集团云网、安全、数据等优势资源和能力,进行统一运营,为内外部客户提供云网安全、数据安全、信息安全等各类安全产品和服务。公司始终坚持以传承红色基因守护安全中国为使命,致力于成为数字时代最可靠的网络安全运营商!


文章来源: https://www.aqniu.com/vendor/102607.html
如有侵权请联系:admin#unsafe.sh