“大模型训练一次就要花500万美元”。
今年2月,原美团联合创始人王慧文高调入局AI时,就曾因为5000万美元的资金遭到过一阵“嘲讽”。
两个月过去了,这股始于ChatGPT的AIGC浪潮不仅没有偃旗息鼓,反而愈演愈烈。越来越多的互联网大佬下场创业,体量较小的企业也纷纷推出自己的大模型。围观者惊叹,原来高投入的大模型从来都不只是“大厂之间的游戏”。
【资料图】
“诸神之战”
一天之内,大模型领域迎来了三位重量级的嘉宾。
先是搜狗公司创始人王小川,一封公开信正式宣告了“百川智能”的诞生。据了解,百川智能旨在打造中国版的OpenAI基础大模型及颠覆性的上层应用。
紧接着,两家公司先后官宣。在当天的技术交流日上,商汤科技董事长兼CEO徐立展示了“日日新”体系下的语言大模型“商量”,据悉,这是一个1800亿参数的中文大语言模型,可实现多轮对话、逻辑推理、语言纠错、内容创作、情感分析等。
与此同时,昆仑万维(300418)也表示,即将推出对标ChatGPT的双千亿级大语言模型“天工”3.5,并定于4月17日启动邀请测试。当晚,昆仑万维发布2022年年报,明确提到“未来10年将坚定的‘All in’AGI与AIGC”。
大模型成了这一轮AIGC浪潮的兵家必争之地。百度“文心”、阿里“通义”、腾讯“混元”、京东“ChatJD”、华为“盘古”,传统大厂无一掉队。
垂直领域诸多企业纷纷入局,除商汤科技及昆仑万维外,科大讯飞(002230)也在互动平台表示,将于5月6日发布讯飞预训练大模型的详细信息,大模型将用于教育、翻译等领域。
互联网大佬们更不畏惧大模型的“从0到1”。公开报道显示,王慧文的 “光年之外”A 轮融资后估值已达到10亿美元,前商汤科技副总裁闫俊杰新公司MiniMax的首款大模型产品 Glow累计用户已突破百万。
华西证券研报总结了现有国产大模型的两个特征:一是头部厂商主导,To B为主要模式,赋能原有优势业务;二是均未对公众大面积开放,未有明确的ToC入口,实际水平不透明。
通用还是垂直
AIGC产业主要分为基础和应用两个层面,前者包含理论框架的搭建、大模型的训练以及算法等,大投入、智力密集和长期性三个特点缺一不可。而后者主要是将别人开发出的东西与自己的业务进行整合,见效快,成本相对也较低。
而这也是当下中国AIGC企业押注的两个方向,有人势要成为中国的OpenAI,但也有人将目光瞄准了垂直领域的应用。
天使投资、资深人工智能专家郭涛表示,根据AI大模型应用范围的不同,可以分为通用型大模型和产业型大模型,通用型AI大模型在企业级与消费级市场都拥有广泛的应用场景,如OpenAI旗下的ChatGPT;而产业型的AI大模型主要应用于垂直行业或细分应用场景,如京东旗下的ChatJD。
“整体来看,通用型大模型应用场景相比产业型大模型更为广泛,随着规模化、多样化应用场景的落地,促使算法模型快速迭代升级,不断丰富和拓展新的应用场景,市场竞争力也将会不断增强。”郭涛认为。
但全联并购工会信用管理委员会专家安光勇则提到,通用大模型在应对多样化任务时具有竞争力,而专业大模型在特定领域有深厚的技术积累和应用优势。
安光勇认为,体量相对较小的企业在大模型领域与“大厂”抢的主要是技术创新和应用场景的拓展。相较于大厂,“小厂”在技术创新上通常更加灵活和敏捷,能够迅速响应市场需求,快速推出具有差异化和竞争力的大模型产品。
此外,小厂在应用场景上可能更加专业化和垂直化,能够深入某一领域或行业,提供定制化的解决方案,满足特定客户的需求。此种专业化和灵活性为小厂在大模型领域与大厂竞争中带来了一定的优势。
“‘大厂更适合做模型’其实是一种惯性思维。”元语智能联合创始人兼COO朱雷解释称,通用的大模型解决不了具体行业的问题,尤其是在国内,大部分高质量中文语料都在行业内,而不在公域的互联网内,即便是大厂也很难拿到行业数据,从这个角度上看,专用的模型在特定领域的效果一定要比大公司的通用模型更合适。
“这也决定了,在发展的过程中,大厂和初创公司的机会都是均等的。双方都会选择自己擅长的领域,再慢慢扩大,就看是谁先在这上面演化出了更优秀的产品。可以断定的是,在这个巨大的浪潮面前,无论是初创企业还是大厂,都不会错过这一波机遇。”朱雷补充称。
AIGC该降温了?
不久前,国际权威咨询机构IDC发布的《2022中国大模型发展白皮书》中预测,2026年中国人工智能软件及应用市场规模将达到211亿美元,人工智能进入大规模落地应用关键期。数据显示,自2020年起,中国的大模型数量骤增,仅2020-2021年,中国大模型数量就从2个增至21个,和美国量级同等,大幅领先于其他国家。
萨摩耶云科技集团首席经济学家郑磊认为,在通用大模型方面,中美存在时间差,而应用层则各有千秋。大模型训练成本高,初创企业目前投入的资金很快就会消耗光,需要多轮融资,而商业应用前景不确定,这类投资不太适合存续期较短的创投基金投资,“建议政府将其作为新基建项目,引导社会资金共同投资”。
此外,郑磊提到,由于还存在可能替代大模型的其他技术路线,国家也应关注,及时加强研究支持,缩小与欧美技术差距。对于中小企业来说,可以根据市场定位和行业发展趋势,选择已有的合适的大模型作为垂直应用研发的基座,逐步形成AI赋能的产品和服务,借助市场力量推动产品研发,形成在细分领域的竞争优势。
上个月末,一览科技推出业界首个基于GPT大模型的“文本+图片+虚拟人”视频AIGC全域工作流,彼时,一览科技创始人兼 CEO 罗江春就曾提到,AIGC工具只会越来越多,同质化非常严重,说是新一轮“百团大战”也不为过,关键的问题是谁能解决某一个垂直领域用户的根本需求。
“大模型需要降温了。”于资本市场,深度科技研究院院长张孝荣做出了这样的判断。在他看来,大模型是人为炒作起来的一个现象,前期是国际巨头推广产品,后期是国内资本市场跟进,炒作相关企业股价,许多公司股价脱离理性轨道,在短短几个月的时间内翻了数倍,导致资本市场发烧。
北京商报记者 杨月涵
标签:最近更新
- 世界视讯!跟大厂“GPT”抢时间的昆仑商汤们,到底在抢什么2023-04-12
- 世界即时:北京3月CPI环比下降0.2% 同比上涨0.7%2023-04-12
- 美联社:机器狗警犬重返工作岗位执勤 曾引发争议而下岗2023-04-12
- CNN:韦伯太空望远镜有新鲜镜头 一颗恒星爆炸后留下绚丽残迹2023-04-12
- 昆仑万维推大语言模型对标ChatGPT?深交所多次下发关注函,2022年营收净利双下滑 每日热点2023-04-12
- 全球快播:通用股份内外交困2023-04-12
- 环球通讯!双塔山风景区坐几路_双塔山风景区2023-04-12
- 厂商鏖战中端智能手机市场 机构看好下半年市场机会 世界新要闻2023-04-12
- 多特蒙德与德国国脚布兰特续约至2026年_今日报2023-04-12
- AI可以让我们一周工作四天吗?2023-04-12
- 科技部等多部门:进一步支持西部科学城加快建设 天天观点2023-04-12
- 博菲电气:公司产品目前未应用于光伏电池2023-04-12
- 世界航天日丨航天知识大考验,你了解几个?|全球快消息2023-04-12
- 安冬青教授谈络病理论的推广、发展及临床应用-世界即时看2023-04-12
- 世界观热点:科技助力春播春管 筑牢丰产基础2023-04-12
- 天天新资讯:发展下线400多人!靖边警方破获一起“名车汇”网络传销案2023-04-12
- 热门:中小城市打造文旅名片如何破局2023-04-12
- AI“复活”逝者难度大幅度降低 55%网友表示不接受_焦点播报2023-04-12
- 焦点资讯:全域数字经营榜重磅发布 解码2023数字商业“风向标”2023-04-12
- 河南行政村5G覆盖率今年底将超90% 当前播报2023-04-12
- 井下400米!5G无人车穿梭自如2023-04-12
- 今年一季度中小企业发展指数升至89.3-即时2023-04-12
- 《“十四五”工业绿色发展规划》实施情况座谈会召开|今头条2023-04-12
- 田玉龙检查督导成都大运会无线电安全保障工作|每日快看2023-04-12
- 多国要调查ChatGPT ,TA碰了什么红线?2023-04-12
- 星河之约丨水星迎来东大距,怎样才能准确观测到水星?2023-04-12
- 阿森纳官方:对本队与切尔西赛程的调整表示失望2023-04-12
- 绿色建材下乡试点扩容2023-04-12
- 【环球新要闻】京东将事业群改为事业部 自营与POP商家团队打通2023-04-12
- 环球热消息:四川:以数字链接创新与梦想 千名青少年齐聚赛场2023-04-12