行情资讯

☞立即开户

50ETF300ETF500ETF创业板ETF期权_零门槛低费用

ChatGPT中国变形记

像一颗兴奋的火种,ChatGPT正在中国科技公司急速蔓延。

百度CEO李彦宏直接把自己2023年的OKR定为:“引领搜索体验的代际变革”。一位百度内部人士对36氪表示,李彦宏认为这次机会绝不能错过,不同于元宇宙火时他持怀疑态度,从没在公开场合讨论,但AIGC(人工智能生成内容)、ChatGPT却多次说过。
对这家中国搜索公司来说,这项火遍全球的突破性人工智能技术,为它带来了全新的想象力。2月7日,百度宣布将发布类似ChatGPT的项目“文心一言”后,其港股股价应声而涨12%。市场是如此期待中国也能尽快推出类ChatGPT产品。
多位百度人士告诉36氪,高层下了死命令,要在一个月时间内看到产品,“3月完成内测”。
一股自上而下的压力全面袭来。“所有OKR推迟,就搞文心一言。”多位百度员工向36氪描述了公司内部当前的紧绷状态:“技术琢磨怎么研发、产品经理思考怎么接入、销售在想怎么卖。”用来训练数据模型的稀缺资源——英伟达A100芯片,“全部调用给文心大模型,其他组都借不到”。
紧张的倒计时下,北京西二旗的科技园里,百度的算法工程师们迎来一个个封闭开发的不眠夜。由百度CTO王海峰担任总指挥,协调两大事业群、百度核心AI人才组队攻坚——百度在用一种最高级别的战备姿态来迎接这场“搜索代际变革”。
36氪获悉,字节跳动也已集结了几个核心部门,组成团队布局类ChatGPT产品。
“头部的平台公司里面,字节肯定是反应最快和投入最坚决的。”一位投资人评价,比如去年字节AI把人脸卡通化的应用已经火过一波。业内也对字节的表现充满期待。
“像ChatGPT这样的人工智能,与个人电脑 、互联网同等重要。”连比尔盖茨都如此公开表示。微软在ChatGPT推出后,对孵化该产品的公司OpenAI又宣布追加100亿美元投资,让这家仅有500人的创业公司估值高涨至290亿美元。
中国股市情绪汹涌。2月上旬开始,“ChatGPT概念股”如雨后春笋,包括汉王科技、海天瑞声、科大国创、科大讯飞在内的多支股票接连大涨,即便他们的业务只和ChatGPT底层的AI技术有部分关联,也并没有成型的产品。
科技属性、流量纪录、资本疯狂……ChatGPT成为后疫情时代的第一个绝佳故事脚本,没人不爱它。
大公司在狂欢,创投圈也在骚动。
2022年底,一家美元基金的年轻投资人Kevin被派到硅谷,彼时,硅谷已经因ChatGPT陷入疯狂,他所在的基金敏锐地觉察到这个变化,因此那阵基金各个赛道的投资人“都在关注AI的变量”。甚至有人相信,这“可以让TMT投资人续命15年”。
过去几年,互联网增长见顶的讨论不绝如缕,人们不得不向投机味道浓重的Web3、元宇宙投注热情。而当ChatGPT横空出世,人们共同体验了它似模似样地捉刀作业、起草邮件、书写代码,甚至富有逻辑地胡说八道后,共识前所未有地快速成型。

ChatGPT中国变形记 行情资讯  第1张

全球互联网人口在过去一年增长了近1亿,增长率仅约2% 来源:Datareportal

短短两三个月,热潮就从硅谷传到中国,从去年年底的“新时代来了”,变为今年年初“人人都知道新时代来了”。
随着前美团二号位王慧文发布自带5000万美元入局AI大模型、广纳技术英雄的招募贴,热烈的情绪走向高潮。
AI公司出门问问创始人李志飞最近也与王慧文面议AI大模型到深夜。“ChatGPT把去年躺平的中国创投圈都炸醒了,”李志飞几天前在朋友圈写道,此时“堪比2010年左右开启的移动互联网,听到最多的词是All in”。
盘点“天选之人”时,36氪原本认为,卖掉搜狗的王小川错过这次机会堪称憾事——清华计算机系毕业的王小川创立搜狗18年,业务涵盖搜索、输入法、翻译,均与AI语言模型相关——但意外听到他也在计划创业,回归做AI大模型的消息。

36氪向王小川求证,他承认,自己在“快速筹备中”。上头派、冷静派

此时一个最实际的问题是:中国能否沿着相同的路径,复刻一个ChatGPT?
在硅谷看过一轮之后,投资人Kevin的情绪却从热烈走向冷静。他发现,中国的复刻之路远比想象的要艰难。
钱是第一道门坎。OpenAI出世之时由几位硅谷大佬承诺出资10亿美元。在ChatGPT发布前,微软就已经在2021年悄悄向OpenAI投资了20亿美元。与之对应的,是OpenAI的巨额支出,业界推测其核心语言模型GPT-3的单次训练成本高达460万美元。换算下来,王慧文为此次创业筹备的5000万美金,只供GPT-3进行十次训练。
在提及入场AI大模型“报名费5000万美金起”仅一天后,李志飞又发朋友圈说,在饭局上“惊闻门票可能已经涨价到一亿美金了”。“现在的感觉真是AI圈一天人间三年,一天不学习和思考就跟不上吃瓜群众的认知了”。
钱还是最容易迈过的一道门槛——在OpenAI已经探明道路、还发了论文的情况下,Meta还开源了一个类似的AI大模型,后来者已经能节省很多试错的训练费用。即使考虑到AI大模型后续还需训练,微软又追加了100亿美金投入——中国互联网历史上,在诸如打车等风口,募资过百亿美金的案例并不在少数。
第二道门槛要难迈得多,至少对小公司来说如此。由于美国对中国禁售芯片,而运行AI大模型需要大量GPU芯片——芯片上受的钳制,又影响了做AI大模型。
AI公司“彩云科技”的创始人袁行远告诉36氪,要想跑通一次100亿以上参数量的模型,至少要做到“千卡/月”这个级别,即:用1000张GPU卡,然后训练一个月。
即使不用最先进的英伟达A100,按照一张GPU五万元的均价计算,1000张GPU意味着单月5000万的算力成本,这还没算上算法工程师的工资。
“但是中国历史上买的A100卡肯定是够的,后面哪怕禁运了,但公有云厂商以前买的那些卡,复刻ChatGPT是非常绰绰有余的。”Kevin对36氪分析。
阿里、华为、腾讯、百度、字节……这些大厂都有公有云业务。多位业内人士对36氪分析,短时间内,芯片(意味着算力资源)至少对大厂还不是太大问题。
第三道门槛,人才的流向,有点灵魂拷问。考虑到OpenAI不过500人规模,而经历过上一轮AI热潮的中国公司动辄数千人,凑个人头应该不在话下。
但Kevin认为,现成的优秀人才,都在四大美国科技公司的AI Lab里。不同于上一波硅谷人才回国潮之时,如今世界局势、国内财务自由前景都截然不同,如何让人才“系统性回国”成为挑战。而上一波AI人才是否能顺滑转换做AI大模型,还要打个问号。
至于商业变现,似乎前景无限,但又不甚明朗。
Kevin预测,AI大模型在中国的变现之路,一定不如美国“清爽”。他以云服务做类比,在美国,可以直接按租用服务器收费,其他都不用管,正如ChatGPT可以直接按调用次数收费。但在中国,面对大企业和政府,技术公司得做全套服务、甚至是定制开发。
这项技术与大用户产品结合,更可能爆发无穷威力。例如ChatGPT与搜索结合——这带来了颠覆Google搜索的想象空间,让投资了OpenAI并获得使用授权、拥有Bing搜索业务的微软,市值在过去一个月里大涨1631亿美元——但在实际落地上还有障碍。
一位百度搜索业务的员工告诉36氪,公司对于ChatGPT业务与搜索的结合尚有担忧:“搜索广告的本质是给用户展现更多结果页面,可ChatGPT是更精准、更有逻辑地推送答案,两者结合后可能会影响搜索广告收入。”
上头派和冷静派——从目前的情绪上,李志飞把业界分为这两派。上头派“满腔鸡血不管不顾只求第一个进入,希望获取先发红利,让资金和人才向其靠拢”;而冷静派“谋定而后动,希望全面梳理人才架构、技术路线、国家态度、接下来互联网巨头的合纵连横、潜在商业模式等关键问题”。
哪一派能最后能胜出?

即使目前是上头派,最终也得面对冷静派考虑的这些问题。

ChatGPT中国变形记 行情资讯  第2张类ChatGPT=CheatPPT?

多位从业者都对36氪说,中国做出类似ChatGPT的产品“只是时间问题”。但对复刻一家OpenAI的公司,却大多表示悲观。

OpenAI为什么没有出现在中国?这个问题有点过于触及灵魂了。

耗时长度,就可能超乎想象。

“小冰做AI Being的时候,我还是个小伙子,现在做了10年了。10年来我们没有变过方向,磨了不一定有结果,不磨更没有结果。”小冰CEO李笛对36氪感叹。从微软亚洲互联网工程院拆分为独立公司的小冰,是目前国内不多的拥有完备人工智能框架的AI 公司。几年前的小冰已经能写诗、作画、唠嗑,算跟ChatGPT非常类似。
“磨”,是指对模型背后 Instruction(行为逻辑模版)的打磨。当机器将表示无奈的“。。。”误以为所有标点符号都要重复三个时,粗暴的处理方式当然可以禁止机器重复标点,而要想让模型更聪明,需要人为地写入更多 Instruction,告诉机器什么情况下可以使用“。。。”,什么情况不能。
“你得有工匠精神,得死抠 Instruction才有机会做得很好,OpenAI的优势,就是它真的死抠。”李笛说,“国内外的科研能力差距并没有很大,但从业者需要耐得住寂寞去打磨。”
道理看似简单,但做起来却难。
一位大厂AI工程师看不惯内部急于出成果的做法,他们私下把类ChatGPT产品叫 “CheatPPT”,“就是交个PPT,给领导画个饼”。因为“从技术到到应用又是一回事”,他对中文大模型在短时间内做产品,“还蛮悲观的。”
训练一个有一两千亿参数的大规模语言模型,需要大量的人工调教和用户数据反馈。云启资本合伙人陈昱认为,这也是很多大厂短期内拿不出和ChatGPT相媲美产品的原因,因为这些都不是“匆忙应战”所能解决的。
况且,时至今日,大模型仍未找到最优解,就算最接近图灵测试的ChatGPT,在知识性和逻辑理解能力上依然有所欠缺。李笛将打磨过程视作“够天花板”:“人工智能的思维上限,要用无数次Instruction的微调去试探。”
而且,死抠也不见得立竿见影,OpenAI的成功,在今天看来仍有偶然性。
OpenAI成立时,业内主流人工智能路线是“监督式深度学习”,需要人工将语义、图片打上标注,机器才可以识别相似信息,典型的应用场景是客服回答与直播鉴黄。但OpenAI选择的“非监督强化学习”技术路线,是将巨大的语料库不经标注地直接投进模型,等待机器吐出一个未知的结果。
经费在燃烧,结果却无从预料,这种九死一生的创新模式,成了大多数公司无法承受之重。
一位明星AI创业公司工程师向36氪描述了急于追逐ChatGPT的难堪一幕:为了成为投资人眼中的OpenAI,该公司的底层算法直接照抄GPT-3流传的复刻版;拿不到数据语料,就去中小学生的QQ群投放语音聊天包,结果收回来一堆带有颜文字的聊天纪录。
“模型越训练,效果越匪夷所思,这个模型最后使用的成本,肯定比招一个人工客服贵。”这位工程师对36氪说。
大模型所需的语料,是对耐心的重大考验。
“所有的文本数据都在互联网上,但难度在于怎么清洗出好数据。”昆仑万维CEO方汉对36氪表示,昆仑万维从2020年开始做自有AI多国语言大模型,仅仅是用自己的专有算法清洗数据,就整整花费了近两年,从百亿级数据里筛出了10%的好数据。
不少AI老兵多少都经历过坐冷板凳的岁月。清洗数据的“脏活累活”,聆心科技CEO黄民烈和清华的课题组做了数年。在中文语境下训练出一个ChatGPT,要面临更复杂的语言体系。黄民烈介绍,中文的语法较英文更松散灵活,也没有空格对词语加以区分。
深入AI大模型的训练细节,“耐心”是一项反复出现的关键要素。如何更有耐心地重视基础科研,也许才是一个真问题。
但尴尬的是,过去三年,在降本增效的大背景下,身披光环的AI科学家们成了科技巨头中的尴尬存在。2019年末,腾讯AI Lab主任张瞳离职,去了港科大;2020年,字节跳动AI Lab负责人马维英离职,去了清华;2022年,阿里M6大模型带头人杨红霞离职。一位曾在大厂AI实验室工作过的员工告诉36氪,在大厂里做基础科研的一个尴尬细节是,“连OKR都没法定”。
至于在上一波AI投资热潮中出现的“AI四小龙”,基本都在做视觉识别、挣安防领域的钱,似乎已经离AI通用大模型有一段距离。在风险投资“5年+2年”的投资周期要求下,创业公司需要在这个周期内走到商业变现一步,而做基础研究很难养活自己。
此刻,缺乏耐心的故事正在再度上演。
为了迎合投资人的口味,有创业公司正试图将自己强行包装成“中国式OpenAI”。一位国内明星AI创业项目的工程师告诉36氪,ChatGPT爆火后,公司CEO要求模型效果达到与ChatGPT近似水平,工程师们只能通过粗暴改写程序等方式,强迫机器按照他们的想法运作。
“比如AI会把每句话里的标点符号重复三次,后来发现是因为训练数据里,很多用户会用‘。。。’表示无语,机器就误以为这是人类的正常表达,我们就只能写一段逻辑,强制机器不要重复标点,但这样模型不会提高任何能力。”这位工程师对36氪无奈表示。
上述案例还属于正经AI公司临时作弊。一位双币基金投资人曾在两年内3次遇到过同一个团队:第一次是在元宇宙概念爆火,第二次是Stable Diffusion带火图片生成,第三次则是在最近,他们又开始做NLP(自然语言处理)。
“发展路径不清晰,实现希望很渺茫,商业价值不明确,一旦突破改变世界”,很可能是受到OpenAI的刺激,王慧文发帖说,如果自己新组的AI公司有剩余股份,想成立一支“非盈利性”基金,投资这样的科技探索。

而具备头3个特征的创业项目,往往都是拿不到融资的。要求一般投资人投这样的项目,也违反常理。

而具备头3个特征的创业项目,往往都是拿不到融资的。要求一般投资人投这样的项目,也违反常理。但是,这些创业者必须认识到,在创投市场中,真正的大公司才是赢家,也才能真正理解大公司的难处,想得更深。

大浪淘沙的创投市场

投资人为什么要投创业?答案有很多,比如为了获取资源,比如为了学习新的东西。

但是最根本的一点是——投资、赚钱。这是很多创业者和投资人都认同的一点。

“创业者和投资人都不会关注具体的数据或者数字。更多注意力放在他们有什么资源可以利用、有什么方法能解决问题、有什么成长空间……”周鑫说。而对于大公司来说,投资一家创业公司最重要的目的是为了让这家公司产生价值——这是一切交易、所有合作最终会得到体现的基础。但是,从2014年开始,这一切都变了。

“国家出台了很多政策去扶持创业,其实是在鼓励大家去创业。国家也希望用这样的方式来带动经济增长,刺激消费。所以有很多政府层面的项目出台。”周鑫说。

“国家也在做大量投资,比如新能源汽车等行业其实也是鼓励大家去创业,因为有了国家政策的引导,企业才能够快速发展起来。”周鑫说:“从2014年开始,我们感觉到整个市场环境发生了变化——原来一些没有想清楚商业模式的创业者、一些传统行业转型过来的人出来做投资人……其实都是很正常的。因为现在市场上真的有很多人才在提供这样的机会和平台。”

关键词:

相关文章