米乐体育网页版登陆

服务规范化的高素质队伍

当前位置: 首页 > 水泵配件水泵配件

国产大模型:从关注度到生产力转变

时间: 2024-02-27 13:32:45

  发达的媒体,敏感而躁动的长期资金市场,在今天发生一轮“科技革命”并不是什么难事。元宇宙的硬件远远落后于幻想,室温超导的期待太过超前于科学,但从AlphaGo到ChatGPT,AI革命明显已拥有了硬件支撑,以及经过上亿人应用复现的技术成果,是狂风飞猪中少有的一只真正有望自主高飞的大雁。

  AI革命还在深刻地演化着。今年上半年,全球风投对AI的投资减少了几乎一半,6月起,ChatGPT的访问人数、访问流量和人均浏览用时也慢慢的出现达峰回落。资本和大众热度的下滑不仅不能说明AI革命已经“凉了”,反而摆脱了猎奇的外部审视,进入新一轮加快速度进行发展的技术沉淀期。

  ChatGPT的开发者OpenAI公司仍在不断推出新的图像语音功能,并着手推动ChatGPT的多渠道商业化。

  8月末,OpenAI预计在未来12个月可借助销售ChatGPT软件及算力获取逾10亿美元收入,而其上下游带动的产业利益也极为可观。继挖矿热潮后,生产高端AI训练显卡的英伟达再次赚麻,净利润上涨800%以上。微软、谷歌等科技巨头也纷纷杀入AI市场,推动自己的大模型研发应用。

  向下游看,大模型AI可以极大提高医疗、法律等专业领域乃至普通白领的工作效率,麦肯锡预测,生成性AI可在未来生成2.6万亿到4.4万亿美元的经济效益。

  超越单纯的经济效益来看,人类在改造客观世界的过程中,必须依赖一定的算力。为客服大脑算力的生理能力约束,从结绳到算盘再到电脑,人类一直在改进辅助计算的工具,而生成式AI就是拓展人类智慧资源的最新成果,个人和社会算力的增长无疑会提升人类分析和处理系统复杂度的上限,以此来实现认知、生产和治理能力的飞跃。

  显然各大经济体已经认识到了AI的战略意义,美国早已把AI训练的高端A100显卡列入禁止对华出口清单,软件技术、人才交流乃至上游原材料也都在禁运之列,就在10月17日,美国再次全面升级对中国AI芯片的制裁。

  美国制裁已经成了荣誉勋章、工业皇冠认证和科技攻关风向标,AI已和半导体一样,站在中美科技软硬件竞争的最核心位置。

  国内的大模型追赶之路大抵起始于去年ChatGPT正式对外发布,起步晚意味着周期晚,当前国内大模型发展仍然处于投资赛道的喧嚣期。近3个月来发布的大模型数量多达上百个,但质量参差不齐,甚至有一些所谓“大模型”只是投喂ChatGPT得到的输出结果。

  为了真正利用后发追赶优势,我们有必要从喧嚣的赛道中沉下心来,在每一段拉力赛中找准比较优势,尽快进入务实发展技术和寻求商业化应用的阶段。

  此外,国内发布的大模型同质化倾向非常严重,类似ChatGPT的通用模型数量达到80多个,与大模型“聊天”门槛低、新鲜感强,天然自带流量光环,在网络舆论中引发了广泛的关注和讨论,用大模型对战“弱智吧”甚至成为了一种新奇的娱乐方式。

  但通用大模型也在很大程度上把公众甚至企业对生成式AI的认识局限在了“看热闹”心态,没形成在本专业领域运用AI的意识和动力。

  未来无论供需双方,都应该真正地把大模型下沉对接到广阔的垂直市场,以需求拉动供给端技术进步,并加速大模型向生产力和实体商业经济价值的转化。

  一方面是线上线下的分割。中国的文字数据材料浩如烟海,但巨量的信息资料还没有全部完成电子化录入的最基本发掘工序,没有实现数据化、资源化的转换。

  这里面,既包括公共文字内容,比如未电子化、未标准化录入的书刊、古籍,也包括公共部门压箱底的各种文字资料。出于保密的顾虑、部门利益的分割、怕麻烦的惰性等等原因,公共机构往往也是信息化变革最犹豫最迟缓的一批。即使已经电子化的数据,也存在大量的非标准化、非规范化的问题。

  另一方面则是数据资源池之间的分割。一些互联网公司基于自身发展形成了相对独立完整的生态系统,这确实保障了企业的差异化优势,也是面对国外互联网公司的重要护城河,但客观上也影响了数据发挥规模效益。

  当务之急,是通过数据要素市场建设,循序渐进,在尊重历史和现实的基础上,持续释放数据要素的市场化红利。

  此外,公共数据资源池也因为各个公共部门的信息管理原因,也存在独立、分割的情况。这些都需要稳妥、渐进地推动共享和开放。尤其是在中文的国际通用性尚不如英语的阶段,国内训练语料的有条件共享、互通对于自主大模型的训练就显得更重要了。

  有了数据的原材料,还必须有优秀的厨艺才能做好大模型的精细菜肴。虽然AI训练被戏称为“炼丹”,但实际训练过程并不是一股脑把数据塞进去,剩下交给黑箱就万事大吉。

  训练模型涉及高度复杂的算法设计,包括数据配方、数据清洗、设置参数和流程等等。算法创新的过程,既需要创造性的模型设计和算法规划,同时也是一个不断试错、不断调整、一直在优化的进程。

  如何快速凝聚高品质人才团队,加速算法核心技术的突破创新,是发展国内大模型必须回答的重要命题。

  最后,我国的需求端还没有为大模型的到来做好充足的认知准备。担心大模型造成失业的卢德主义言论在社会化媒体上占有一定声量,数据隐私、AI污染人类信息等担忧也被提出,而垂直模型的相对缺乏使得企业仍然没有全面认识自身潜在的大模型服务需求。

  发展的问题要在发展中解决,不能因为可预见的问题而因噎废食。现在国家已经发布了《生成式人工智能服务管理暂行办法》,对一些大模型潜在问题风险进行了预见性监管

  在监管框架下,应该鼓励相关企业迈开步子,开发并把大模型投入到现实场景中试用起来,这样才可以契合AI训练“干中学”的特性,充分的发挥我国数据基数的优势加速赶超。而且,供给能创造自身的需求,也正是在实用的供需互动中,才能产生更多符合各专业公司制作现实的垂直大模型。

  首先,要打牢基础设施。两部流浪地球都有这么一句经典台词:没有硬件帮助你破解个屁。破局中美AI竞争,也必须打好硬件基础。从上游的计算芯片自主化,到超算算力的扩容和共享,国家的主导协调作用不容忽视。

  其次,是加强数据资源共享。利用好已发布的数据二十条,加快公共数据的电子化,打破各个数据孤岛之间的壁垒,做好数据提供方和使用方的权责划分,让数据要素流动起来,重建开放高效的数据分享生态,让大模型成为有源之水。

  第三,踏踏实实创新算法。一切资金和人才的进入,最终都要归到务实的技术创新上来。算法就是大模型的核心技术,无论是避免重蹈卡脖子的覆辙,还是成为浪潮褪去后的裸泳者,相关企业都应该踏踏实实地解决好算法技术的课题。

  第四,加强全行业、全社会的支持和参与。大模型来自全社会的智力成果积累,也要回到社会智力应用当中去,才能同时实现自身的完善和社会经济价值。监管者和大众可以在运用尝试中不断评估大模型,及时有效地发现和解决其蕴含的风险;而实体企业也可以更多参与到大模型的应用当中,助力大模型转化为切实的生产力。

  当然,在大模型等新技术的产生和投入应用的初期,也需要各方面更多的容错度,调戏归调戏,监管归监管,对于国产大模型发展的基调仍然应是支持、帮助和鼓励,不能因为个别的错误和过失,而一竿子打翻一船人。毕竟在当下我们国家科技正在卯足力气进行全方位突破的时候,我们应该有耐心、有气度去支持所有具备弯道超车潜力的技术和产品。

  《数字化的经济智库评论》面向数字经济领域实务研究、决策咨询的智库机构和专家学者,力求为各兄弟单位的研究人员带来更多有深度、有思想、有价值的精选内容。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  女企业家讨工程款被批捕,前时政记者叫板当地政府:你们回应媒体的通报是在耍流氓!

  中央定调,一竿到底!2024年3月开始暗查这5个问题,见一个抓一个!事关每个普通人!

  每个孩子的成长过程中,都应该有这套漫画版《素书》,实例分析孩子实际问题,给出解决方案,正面引导孩子