首页
首页 > 学术科研> “做题家”的突围:一位博士生走了10年“弯路”

“做题家”的突围:一位博士生走了10年“弯路”

2024-08-28阅读量:5
【摘要】齐炜祯目前还是中国科大2019级在读博士生,学术方向为近年最热门的自然语言生成与预训练。他不甘把自己束缚在学术界,所以在读博期间到处“出击”:研究生一年级就发表了多篇论文,在美国实施量化宽松政策时做过热点金融投资,搭过量化交易程序,给网络大V训练过数字分身,参与过大模型创业……

“做了很多尝试,也走了不少的弯路。”这是齐炜祯对自己27岁人生的归纳,而他的大部分“弯路”是在18岁进入中国科学技术大学以后走的。


齐炜祯目前还是中国科大2019级在读博士生,学术方向为近年最热门的自然语言生成与预训练。他不甘把自己束缚在学术界,所以在读博期间到处“出击”:研究生一年级就发表了多篇论文,在美国实施量化宽松政策时做过热点金融投资,搭过量化交易程序,给网络大V训练过数字分身,参与过大模型创业……


他虽然通过投资赚到了钱,但由于经验不足,没能利润最大化。如今他递出名片上的身份是北京一家投资公司的合伙人。


履历貌似纷乱,但这位来自山东聊城的年轻人清楚知道自己的初衷,他要打破自己身上“做题家”的枷锁。他给自己树立的做事准则是,尽可能多地收集信息去作选择,“最怕的就是埋头干,但不知道为什么这么干”。


他想要做到不可替代,不至于被时代抛弃,这是他的初衷。


2023年4月26日,齐炜祯在中国科大北京校友会的活动现场。中国科大北京校友会供图


从飞扬到沉着   


《中国科学报》记者上次见到齐炜祯是2023年4月26日,他在北京给200多名中国科大校友作了一次关于GPT-4的普及分享。他当时的身份是中国科大与微软亚洲研究院联培博士生。


那天的活动从下午6点半开始,一直到晚上10点多,26岁的齐炜祯不疾不徐一连讲了近4个小时。他谈吐稳健,颇有大将之风。现场气氛活跃,人们纷纷提问:有人关心GPT的发展瓶颈是不是硬件,有人关心人工智能的管理规则,还有人关心GPT在量化金融领域会有什么作为。齐炜祯都给出了有理有据的分析,其解答让现场的人折服。


实际上,当时的齐炜祯已经准备从微软离开了。


在微软,有不少重要的研发工作是由他们这些联培博士生完成的。齐炜祯不仅发了很多论文,也做了不少工程化的工作,其中一项工程是帮助必应广告做预训练的生成(包括美国市场和欧洲市场),相当于重新开发了其广告推送系统。他说,他们团队的这个工作帮助必应的广告收益率提高了近两个百分点。


另外一个值得提及的工作是,他们团队合作在2023年开发了一款视觉ChatGPT,可以实现看图、聊图片、画图等功能。该项目发布后,在很长一段时间内成为全球最大代码托管平台GitHub上最受关注的项目。这个工作是他们花了一周时间赶出来的,那时候他们就是想做出一个“大新闻”。


他也做过不少无用功。他们开发了一个PPT自动生成的技术,需要去做结构化代码生成,“特别苦,数据处理起来又脏又累”,等做出来才知道其他部门早已有了大模型能力,已经实现了自动生成PPT,“白干了”。


再次见到齐炜祯是在2024年7月28日的中国科大2024级新生嘉年华活动现场,他作为校友出席。一年多过去了,齐炜祯显得老成了不少,眉宇间少了一些飞扬,多了一些思虑。


活动上有新生问:如何才能跳出“小镇做题家”的窠臼?这个问题让他心头一紧:这个新生不就是10年前的自己吗?


2024年7月28日,齐炜祯在中国科大2024级新生嘉年华活动现场。中国科大北京校友会供图


从物理到计算机   


齐炜祯自认为是典型的小镇青年。父母都是一眼能望到尽头的体制内普通工作人员,家庭只能解决基本生活问题,对个人成长规划提不出高水平的建议,只能靠自己去试去闯。


2015年,齐炜祯被中国科大录取进入物理学院。他是全国中学生物理竞赛复赛(山东赛区)第40名,“高中只知道数理化,尤其是数学和物理基本上都接近满分,所以就选择物理”。


在聊城不比在省会、大城市等发达地区,他们大部分时间以自学为主,只有寒暑假才能赴济南或青岛找名校的奥赛教练指导学习。


刚刚进入大学的时候,齐炜祯以为自己这辈子就研究物理了。但很快,他发现前路迷茫。军训时,他看到很多新生拿着小红书在背英语单词,很不理解。有师兄告诉他们应该早点进实验室,然而物理学院有300多个新生,去哪个实验室?找哪个教授?去了应该干吗?齐炜祯一头雾水。


中国科大物理专业众星云集、人才辈出,在全校乃至全国都是实力极强的,然而齐炜祯担心的是,自己若是没有创造足够多的价值,没有足够的竞争力,不知道能否在枯燥的研究工作中存活下去。还有就是,“如果我在物理实验室里,天天花着纳税人的钱烧出来一些没有用的东西,我觉得就没有存在的意义”。所以他在大一下学期就有点慌。


他争取优先做那些当时认为应该做的事情。班长、学生会干部、社团成员、学生会的外联,这些角色他都经历了。他甚至还进了相声社去说相声,并参加了安徽省曲艺巡演。


大学时期,齐炜祯(右)参加了安徽省曲艺巡演。受访者供图


在现在的齐炜祯看来,凡此种种都是“弯路”。他当时并没有想清楚自己需要什么,只是身边的人告诉他应该当学生干部,应该学好数理化,但不知道每一步后面代表什么意思。现在他知道了:如果当年沿着物理专业学下去,拥有高超的物理建模能力,就有很多实用的应用场景,例如,挖出有效的因子去进行量化交易等。


他后来还做过学生记者,采访了多位郭沫若奖学金获得者,那是中国科大本科生的最高荣誉奖学金。他的这些采访是夹带了私心的,他想知道这些优秀的学生是怎么看待自己专业的,又是如何在大一结束时做出专业选择的。


齐炜祯最终找到了自己的答案,他要换专业。就这样,他成了中国科大的1511校友。15指的是2015级入学,11则是计算机科学与技术系的代码。


多年以后,齐炜祯反思了他当年转专业的行为。就在7月28日的新生嘉年华活动上,有新生提及学物理“不成功则成仁”的担忧,齐炜祯给出了自己的见解:如今物理学的前景其实是更好了。比如核聚变和量子计算这两个方向,在硅谷和上海、北京,这两年相关的创业公司多了起来。如果大学期间就能在这些方向中找到自己的兴趣,那么你将成为极少数掌握下一个巨大赛道的核心技术人才。


从中国科大到微软   


齐炜祯在计算机科学与技术系的4年不是平铺直叙的。


本来他打算做芯片研究,是软硬件结合的方向,毕竟那是当时中国科大计算机系的强项。他大二时还被公派到 台湾大学去学芯片设计。


那里的学生远远没有中国科大学生这么“卷”,所以齐炜祯就有了不少的自由时间。他去参观台大的人工智能实验室,看到研究人员在做植物叶子的分类,那是视觉人工智能的工作,他顿时对人工智能来了兴趣,原来在这个领域可以做这么多的事。


齐炜祯很快发现,中国的视觉人工智能是特别发达的,有几家公司已经做得很成熟了,“如果我那个时候再选择计算机视觉,毕业的时候应该就没有竞争力了”。他要在人工智能里面选一个最难的、最不会被攻克的方向,“这样等到我四五十岁的时候,就可以占有一席之地”。


最终,他选择了自然语言作为自己的研究方向。在当时,自然语言是人工智能中很弱的,即使在中国科大也没有自然语言的实验室和专职研究人员。那时“Siri还像一个傻子一样”,这样他就可以“在这个方向上做一辈子研究”,慢慢等待机会的成熟。


齐炜祯打算好了,他要留出大四一年的时间去实习,不过这让他的大三生活变得无比虐心。他要在一年内把下一年的课都学完,还因为大一是物理专业需要补计算机的学分,加上大二去台大学习,他需要把欠下的课程一并补上。那时候,他的课经常是两节或者三节叠加在一起上。考试的时候更加窘迫,他告诉任课老师:“容我考完别的,抓紧时间跑到您这儿再考”。


他是一个思虑周密的人。微软面试前,齐炜祯已经主动了解了面试的规则,最终以中国科大计算机学院第一名的成绩被微软的导师录取。


5年后,在谷歌学术上,齐炜祯有共计23篇论文,被引次数接近2000。不过他并没有去申请奖学金,因为他很快就通过金融投资赚到了人生第一桶金。他把奖学金留给了更需要的同学。


齐炜祯在微软。受访者供图


从科研到商业   


2021年,齐炜祯认识了一位在量化领域耕耘的中国科大同学,二人一见如故,开始了金融投资的合作。挖到第一桶金后,齐炜祯选择在2022年初回来继续科研,回归技术为本的轨道。


之所以离开金融投资,还有一部分原因是他博导的一席话:这值得你做一辈子吗?长远看它是不是能造福全人类?


齐炜祯回答:应该不是,它只是造福了少数人。


他想明白了:如果做所有人都需要的产品,就意味着所有人都离不开你,无论是在金钱、话语权还是重要性上。


2023年初夏,齐炜祯有了离开微软的打算。那时候微软正在大力进行结构调整,能够继续进行的研究工作没有之前那么有吸引力了。


他首先关注创业方向,去参加了某个孵化创业公司的培训课。他发现,创业项目你方唱罢我登场,看起来热闹非凡,其中很多不过是草台班子,“结果是啥都没做出来”。但这也让他对创业有了想象空间。


他先去了一家从事数据交易、数据安全和可信计算的初创公司,他负责早期大模型的加密。因为人们在大模型上的所有问题和答案都是明文,这就相当于用户在大模型上裸奔,齐炜祯给这些问答加上了一层隐私保护。


做完这部分工作,齐炜祯还没来得及谈费用、专利和股份就离开了。因为当时有另外一家更具光环效应的大模型创业公司向他伸出了橄榄枝。讽刺的是,夏天还没过去,这家公司还没等到齐炜祯入职就被收购了。他同时失去了两个机会。


几经周折,齐炜祯痛定思痛,想要找到曲折背后的根源:为什么会走出如此曲折的路径?


他甚至去找职业顾问专家咨询。他找到了一个比自己的经历更复杂、更传奇的人,二人惺惺相惜。齐炜祯最终得出了结论:自己并没有破除小镇青年的见识壁垒。


在成为投资公司合伙人之前,齐炜祯还揽了一些杂活儿。比如他给某个网红直播大V做数字人,也就是把其直播视频转成文字,然后用GPT把问答的语料清洗出来,再经过训练放在大V卖课的微信小程序上做答疑。


齐炜祯很快意识到,自己做的这些杂活儿都是一锤子买卖,并没有变成自己的产品,其实很多技术是可以用来创业的。然而,一想到创业的风险,他还是有些胆怯。


这时候,一位从事投资的中国科大校友想要开展人工智能的创业孵化业务,于是就邀请齐炜祯做合伙人。齐炜祯也很高兴,这是他了解如何找渠道和资源、融资上市的好机会。


“做题家”的反思   


尽管齐炜祯说从来不后悔自己的决定,但自然语言大模型在近年的迅速崛起,打乱了他原来的计划。


齐炜祯发现,很多大学都能培养写代码的计算机人才,但大模型的竞争力主要是数据、算法和算力,计算机专业学生在毕业的时候很难做到不可替代。


他本来的想法是,在工业界或者学术界把技术做好的同时,掌握项目运营能力和团队管理能力,当机会来临时再去做一番事业。然而,在他还没做好充分准备的时候,自然语言大模型领域就爆发了。


其实他也没什么可追悔的:来到中国科大,又来到微软,还发了特别好的文章,这一路上所有的选择都是自己当时能力的极限,是当时最好的选择。


更为重要的是,所有的“弯路”都是他自己主动选择的。这也使他得到一个聊以自慰的结果:在遭受打击的时候,他的抗压能力比其他同学要好很多。


作为对照,齐炜祯提到了自己的同级同学刘泽,那是一位明确自己路径的“狠人”,他在一条竞争激烈的赛道上做到了极致。同样是中国科大与微软亚洲研究院联培博士生,刘泽以第一作者署名的论文在2021年国际计算机视觉大会(ICCV 2021)上从1612篇被接收论文中脱颖而出,获得了ICCV 2021的马尔奖。这个奖项每两年评选一次,是计算机视觉领域的最高荣誉之一。


齐炜祯对刘泽的印象很深。后者充分利用了微软的显卡资源,在短时间内得到了无与伦比的实验性能,在物体检测和语义分割等任务中实现了一种远超他人的结果。今年毕业的刘泽加入了马斯克刚刚创办的人工智能公司xAI。


齐炜祯分析:“我们走的是完全不同的路。我是把所有的错都试完了,然后走到了这里;刘泽却是在一条路上勇猛无敌,然后一路猛下去就做成了。”


齐炜祯的风险意识很强,他认定自己不会走刘泽那样的路,“我不太敢选这条路,风险太高了,如果做不到第一,就没办法凸显自己的竞争力”。


他会从各种 宗教书和哲学书里面去寻找答案,最终形成了自己的价值观:他来到世界上就是为了收集更多的信息,这是人和人之间的主要区别,“我要把这辈子活明白,人类社会是怎么运行的、世界是怎么运行的,我要更多地体验”。


至于自己的事业,齐炜祯有一个略显天真的想法:如果能在人工智能领域做出加上主动性思维的插件,“那将是一辈子值了的体验”。


投资公司合伙人的角色或许只是齐炜祯事业上的一个节点。他给了自己一个时限,到30岁之前找到值得一辈子投入的事业。他还有很多可能性。


收藏