科学多面体|清华大学聂再清:中国一定要有自己的大模型,初期多一点也无妨

扶学振
导读 原标题:科学多面体|清华大学聂再清:中国一定要有自己的大模型,初期多一点也无妨 ...

原标题:科学多面体|清华大学聂再清:中国一定要有自己的大模型,初期多一点也无妨

出品|搜狐科技

作者|郑松毅

编辑|杨锦

在百年未有之大变局的当下,科学技术作为推动经济社会发展的第一推动力,她的每一次革新都为大众瞩目。搜狐科技《思想大爆炸-科学多面体》栏目,力图展现不同视角,争鸣基础科学和前沿科技领域的重大进展与突破。

GPT拉开强人工智能时代的序幕后,“学院派”“大厂派”“创业派”争上大模型,到底有没有必要投入重金做自己的大模型?ChatGPT能称得上技术革命吗?围绕这些热点问题,本期对话清华大学国强教授、智能产业研究院(AIR)首席研究员聂再清。

嘉宾简介

聂再清,现任清华大学国强教授、智能产业研究院(AIR)首席研究员。师从美国人工智能学会前Subbarao Kambhampati教授,本科和硕士毕业于清华大学计算机科学与技术系。2017年加入阿里巴巴,任阿里巴巴人工智能实验室北京负责人和阿里巴巴天猫精灵首席科学家,带领团队从无到有实现天猫精灵的所有相关算法研发和创新工作。此前就职于微软亚洲研究院,任首席研究员。发明的知识图谱相关技术等,被广泛应用于互联网搜索引擎、聊天机器人等领域,在微软期间被授予Microsoft Golden Star奖。

划重点

1、中国至少要有一个大模型可以给咱们中国人使用,多一些做大模型的人是一件好事。

2、大模型的智能涌现能力是ChatGPT被认定为重大技术革命的原因之一。

3、目前业内对于大模型“大厂派”“创业派”“学院派”的分类方法并不科学,“学院派”的产品最终也大概率会走向产业。”

4、参数的需求实际和数据量之间是强相关的,如果有用数据太少,参数太多是没有意义的。

5、AI造成一些现有工作的减少是必然的,但技术进步也会带来新的工作机会。技术进步改变了服务模式,但对于人的需求是持续存在的。

6、企业的工作可以更了解市场对于技术的实际需求,而院校研究机构更为灵活,可以更专注于科研工作,做一些有兴趣想做的研究。

就在刘慈欣忧虑“科技发展变慢了”之际,今年年初,ChatGPT的爆发开启AI大航海时代,为下一轮技术变革带来新的动力与可能。

“一人捅破窗户纸,千军万马独木桥。”正如周鸿祎所说,OpenAI捅破通用人工智能的窗户纸后,国内科技产业内外伺机而动,就在4月,从大厂到高校,从华为、阿里、百度、商汤,到清北、复旦、浙大,再到王小川、李志飞、李开复......这些噤声已久的大公司和大佬纷纷高调起来,卷入大模型混战。

“中国至少要有一个大模型可以给咱们中国人使用,多一些做大模型的人是一件好事。”

近日,聂再清在与搜狐科技对话时表示,在当前比较初期的阶段,竞争会促进大模型技术领域的不断更新,随着大模型技术的发展,尾部的一些研发机构自然会向头部机构聚拢。

据搜狐科技不完全统计,目前国内各派大模型主要玩家总和已40有余。而关于要做自己的大模型,还是接入大厂的大模型,业内争议很多,有大佬表示,“通用大模型不一定适合所有人,商业应用价值是首先需要考虑的因素。”也有声音认为,“每个行业、企业甚至每个人都应该有自己定制的GPT大模型。”

《2022中国大模型发展白皮书》指出,中国的大模型数量从2020年骤增,仅2020年到2021年,中国大模型数量就从2个增至21个,和美国量级同等,大幅领先于其他国家。

在聂再清看来,大模型大致分为两类:通用大模型和专用大模型。通用大模型是各行各业的基础模型,未来也会包含多模态的信息,处了文字外,也可以把视觉、语音等多模态信息用来学习一个通用大模型。专用大模型更多聚焦某一个领域,例如生物医药,研发或选用哪一种要根据实际任务选择。

同时,他认为,目前业内对于大模型“大厂派”“创业派”“学院派”的分类方法并不科学,“学院派的产品最终也大概率会走向产业。”

从技术的角度看,大模型发端于自然语言处理领域,参数规模逐步提升至千亿、万亿,同时用于训练的数据量级也显著提升,带来了模型能力的提高。

谈及这一轮技术变革,聂再清分析称,大模型的智能涌现能力是ChatGPT被认定为重大技术革命的原因之一。

在“大模型是否需要持续增加大量参数”的问题上,他与OpenAI创始人山姆·阿尔特曼的观点一致:参数的数量需求是与数据量相关的,当数据量并未大幅增加时,也没有必要持续大量增加参数。

以下为对话实录(经整理编辑)

搜狐科技:您认为大模型可以分为哪几类?

聂再清:当前大模型大致可以分为两类:通用大模型和专用大模型。通用大模型是各行各业的基础模型,未来也会包含多模态的信息,除了文字外,也可以把视觉、语音等多模态信息用来学习一个通用大模型,用户所表达的问题含义机器模型大致都可以理解。专用大模型更多的是聚焦某一个领域,例如生物医药,那么大模型将只懂生物医药方面的知识,别领域的理解不如在生物医药领域深刻。具体研发或选用哪一种大模型还是要根据实际任务进行选择。

搜狐科技:有大佬表示大模型并不适用于所有人,您认为企业、机构有没有必要都去做自己的大模型?为什么?

聂再清:中国一定要至少有一个大模型可以给咱们中国人用,至于是否每个人都要做,我认为肯定不需要每个人都做,但是在开始阶段多一些人一起做也问题不大。随着大模型技术发展,尾部的一些研发机构自然会向头部机构聚拢,发展的过程可以让更多人参与思考和学习,那么也就培养了更多做大模型的人才。同时,竞争也会促进大模型技术的不断更新。

搜狐科技:您认为大模型具备哪些优势?

聂再清:其实包含两方面,一方面是开放域的任务完成,之前的闲聊技术(ChitChat)时代发现用户在与机器聊一段时间后觉得没意思就不聊了,那现在可能你想干啥机器都可以帮你完成(虽然还有些回复不能保证准确性)。面对陌生任务,他可以通过之前对于其它任务的学习,来提升对于陌生任务的处理性能,也就是说越来越多通用性的能力出现了。另一方面,是大模型的智能涌现能力,这也正是ChatGPT被认定是重大技术革命的原因之一,对于问题的处理性能会突然有一个加速式的提升,随着参数的增加,其回答问题的准确率也在提升。

搜狐科技:OpenAI创始人阿尔特曼在近期的一场演讲中表示,“下一阶段并不会以持续增加参数为发展方向,更多的会选用其它的方式增强人工智能的应用性”,您怎么看待这个问题?

聂再清:这是一个好问题,参数的需求实际和数据量之间是强相关的,如果数据太少,参数太多是没有意义的。也就是说,当数据量没有大幅变化的时候,也没有必要去增加太多参数。我想下一阶段增强人工智能应用性的一个很好的方式是从优化算法结构出发。

搜狐科技:您所在的团队一直致力于研究生物医药领域大模型,但您实际上是计算机专业背景出身,是什么样的契机让您选择了生物医药领域的大模型研究工作?生物医药大模型能带来哪些影响?

聂再清:生物医药领域是我加入清华后开始做的,是清华非常看重的一个研究领域,但其实生物医药大模型与我一直从事的工作领域也是有密切关系的。我之前很长一段时间是在微软从事学术搜索的研究工作,现在思考的是如何把不同学术文献中科学家多年研究积累的知识、结构化知识图谱、及分子结构蕴含的知识都融合在一个大模型里,期望利用大模型技术通过分析基因序列等信息找到药物靶点(药物靶点:药物作用相应位点),从而推进更多新药物研发的进程,缩短药物研发周期,为当前无法有效治疗的病症带来希望。

搜狐科技:近期ChatGPT因信息泄露、造谣产生不少丑闻,马斯克也签署联名信呼吁暂停训练更强大的AI系统至少6个月,且应及时制定AI强监管政策,您认为这是马斯克给自己的AI公司争取时间,还是AI真的需要及时的强监管政策了?

聂再清:为AI制定有效的监管政策是有必要的,尤其对于AI可能会造成的重大恶性影响方面是100%需要制止的,但是,当前AI技术总体上都还在控制范围内,通过对具体的技术和产品提供方提要求都可以对功能进行更改(或暂停某个具体的产品和技术),因此暂停所有AI系统的训练是没有必要的。

对于负面事件来说,还是应该归责到人,承担责任的应是AI应用的提供者,严格的审核及监管制度是尤为重要的,全球各地监管政策也应根据实际情况差异化制定,这样才能更好的发展。当然我们还是需要给予AI创新工作一些包容的。在安全可控的前提下,既要鼓励创新,又要严格限制有害创新。

搜狐科技:很多人担心AI的快速发展会冲击就业市场,造成大范围失业,您怎么看待这个问题?

聂再清:在我看来,一些现有工作的减少是必然的,但技术的进步也会带来新的工作机会。曾经在人力车时代只靠人每天拉着车跑,后来随着技术的发展有了汽车,也衍生出了出租车司机、维修工等职业。技术的进步实际上是改变了一种服务模式,但对于人的需求是持续存在的。

搜狐科技:了解到您之前一直在阿里、微软这样的企业工作,并做出了很多产品研发贡献,请问您为何最终选择回归到院校研究机构继续工作的呢?

聂再清:企业的工作经历让我更了解市场对于技术的实际需求,但企业可能会因为业务线的规划调整会限制一些短期看上无用的科研创新工作,而院校研究机构更为灵活,可以更专注于科研工作,做一些有兴趣想做的研究。

标签:

免责声明:本文由用户上传,如有侵权请联系本网删除!