字节大模型策略:自研加平台
(资料图片仅供参考)
这周,字节跳动旗下云计算服务火山引擎推出方舟大模型平台,引入了智谱 AI、MiniMax 等 7 家创业公司 / 研究机构的大模型,对外出售服务。相关公司和机构在火山引擎活动会场开设展台,创始人或联合创始人到场宣布未来会和火山引擎有更深入的合作。
为了吸引创业公司把模型放在火山引擎上,字节跳动把抖音等业务的空闲计算资源极速调度给火山引擎,并比同行更低的价格出售算力服务。火山引擎总裁谭待说中国大多数大模型公司都用火山引擎训练,在火山引擎上做推理也顺理成章。
今年初,为了抓住人工智能大模型的机会,字节跳动组建了至少三个团队开发大模型,找英伟达下单超 10 亿美元的 GPU,两年前卸任 CEO 的创始人张一鸣也开始看相关论文,与一些团队交流心得。
投入大量资源的字节跳动,目标不只是像 OpenAI 那样开发出大模型,还希望凭借丰富的 GPU 储备建立一个平台,作为中间商帮创业公司训练、出售大模型。
按照谭待的说法,他们将来还会引入更多大模型,字节跳动自研的大模型,除了应用到业务中,也会放在平台里对外销售。他说这么做基于两个判断:大模型市场不会出现少数几个大模型通吃的局面、企业会用多个模型开发应用或改造业务。
“超级大模型效果好,性价比不高,不是所有问题都需要超级模型”,谭待接受采访时说,再加上不同行业解决问题不同,模型训练数据也不一样,因此会有针对特定行业或者不同参数量(决定成本)的大模型存在。
大模型是中国云计算公司的机会已经形成行业共识。但它们抓机会的方式有差别——百度和阿里都是先自研大模型,然后对外提供服务。腾讯现在还没有发布自研模型,马化腾说 “不急于一时”,腾讯先做的是建立平台,吸引行业方向的大模型进驻,对外提供服务。(贺乾明)
关键词: