Skip to main content

6 posts tagged with "总结"

View All Tags

2025暑期总结

· 18 min read
ayanami

由于这个夏天确实发生了很多事情,所以打算写一个夏季的总结,也算是一反春秋两季总结的常态吧www

一时不知道从哪里说起,就按照时间线顺序吧

2025.6

在5月底6月初的时候,我结束了我的第一段实习,回到了学校;由于这个学期我并没有什么课,所以一直到期末考试结束,我反而是放假的,当时的初步打算是休息休息、沉淀沉淀,然后在9月开学的时候再投下一段实习

但说实话,第一段实习主要做的是AI应用,虽然有涉及到不少算法工作,但本质上是公司太草台了根本没有专门做这个的算法岗,所以实习生当全栈用,于是当时其实不太知道投些什么好,在学校的帖子中是这么写的

楼主准备在八九月分投下一段日常实习,目前还在

  • LLM应用
  • 搜推
  • 后端

中摇摆,大概到时候都会投一些,而从现在到八月的时间空闲不少,楼主认为有必要沉淀沉淀 遂开此楼,记录一下楼主在准备力扣八股中的思考,不过力扣估计是7月份才会启动,最近主要是战八股。

于是当时就开始看一些传统后端八股,之前没学的东西,当时还列了一个学习list,从mq到spring cloud, dubbo等等(虽然最后也只看了mq),顺带看一些大厂技术博客,主要是RAG方向(沿着实习的继续看,例如美团对向量搜的优化等等,当时对搜广推的想法主要是搜索),还有像是王树森的搜推基础

然后在这个时候发生了一个很有趣的事情,让我又开始找起来了实习。起因是一直想参与一些开源工作,当时GSoC已经错过了,但是ospp还是可以报的,于是花了不少时间在ospp项目的筛选和查看上。结果进到一个项目的群里,三四十个人抢一个机会,当时就感觉很离谱,然后就润了,在和很多同学的交流过程中也对AI到底有多火拿到了新的认知。

但ospp没拿到机会,突然又觉得暑假没什么事情做,尝试联系了一两个老师,做的项目又总是很草台或者很没意思(例如,benchmark),于是打算还是找一段暑期实习吧,看看有没有什么机会,就开始再刷刷力扣和招聘软件。

2025.7

但比实习面试更先一步肘击的是我们学校的暑假小学期课程,这门课程就是把人关在教室里面结对开发,一周五天从早到晚,属于是没含金量没钱没需求的实习了。于是6月底和7月前半的生活主要在写这门课相关的项目(自命题了个想做的写,主要做文档补全相关的东西,在其中把之前接触相对较少的vllm等推理引擎和很多文档补全的算法和设计接触了一下,比如Fill in the Middle, 多模态rag,reranker的调优等等)

而在找实习方面,也是第一次直面了就业市场的压力(第一段实习其实算是实验室合作项目),投了100家就几个面试,最后offer的更是寥寥(不过后来发现其实已经算好的了,交大title还是好用的),白天上课推项目晚上投实习刷八股力扣,中间抽空面试,到后面是真的负能量很多很破防。

最后面下来的结果是几个offer, 一个华为的AI rag实习生,但做的是培训这种听起来就很草台的业务;一个是百度的文档理解实习生,但百度实在是太抠了200/d,再加上学长同学都觉得百度业务不行,最后接的是另一个百亿私募的offer,说做AI工具这一块(不过后来又出现了奇怪的经历www),面下来还是收获很多的:

  • 对面试过程有了正确的了解,在去年面字节的时候说实话完全不能算是经验,就是完全没达到标准还,在7月的时候已经面麻了,真有一种对简历也好其他也好越来越得心应手,知道面试官会对哪些内容感兴趣的感觉
  • 建立了对转行的信心,学期初对跑路AI应用这件事情惴惴不安,在5月的时候也完全不敢碰算法岗,但百度的offer真的极大增强了找算法岗的信心,原来这样工程的简历在算法侧也是有公司肯要的,当时就和同学说“感觉后面再做一段应该能找到大厂的算法实习”(现在看来实则不一定www,当时过于乐观)
  • 在6月份到7月份的沉淀过程中逐渐了解了学界和业界都在做什么东西,配合自己写的项目,对整个rag链路的了解更深了,实习期间因为业务原因没机会做的一些东西也做了起来

由于第一段比较草台,说实话没对quant或者qd岗有什么额外的了解,于是接了私募的offer打算再做一段正经些的qd。

2025.8

后半个七月+八月是很有趣的实习time

实习期间干的东西特别神奇,半个ai infra+半个devops,说好的ai tools呢,几乎只有入职后的landing任务是ai tools(笑)

由于涉及到一些保密政策,所以不能说很多。但主要是在做两个方向,一个code agent,第二个是模型部署和推理优化

但很搞的是,我不会ai infra啊!但在和+2的第一次meeting中,+2说了一句现在这个还没人做,你就做这个方向吧,实习任务就是这个了,其实我更想做当时+2提出的训练侧和文档理解agent相关任务来着(笑,不过现在看来未必是坏事, +2说没事你可以学啊!

于是草台对草台,稀里糊涂的就接了部署k2的任务,目标就是打到一个指定的qps来支撑公司后续的ai服务

还没说的是在公司的第一周有一个很完善的入职培训,真被强制要求学了一些quant相关的基础知识,感觉还是很开眼界的,看了2天视频(笑

开始是在显卡云厂商上部署,mt帮我配好了nccl之类环境,我再加装了deepEP之类,一边是看着vllm/sglang文档开关各种参数测性能,另一边是在测的时候也就顺带看看这些参数对应的论文和博客,了解一下是什么意思。当时因为觉得从来没做过ai infra写算子之类肯定没什么产出,所以一直在看投机解码这个方向的文章想看看能不能训个草稿模型加上去(了解到投机解码也是6月份沉淀的时候www),倒是真用specForge训了点,但一个是对k2这种新模型支持不好,另一个是训练的结果并没有很出彩......所以就没太多产出吧

然后这一小块结束之后就是上k8s,也是苦痛和成长(?)的来源(至少我之前确实没操过k8,遑论是gpu集群)

+2最开始想用的是ome,说让我们先调研一下,于是看了production stack, ome等,然后+2就给了个k8s集群,说那你们开始部署吧!谁能想到这个aws集群是苦痛来源呢......

这个aws到底为什么恶心呢?

  • 给到我们的aws的pod不是“裸”的(aws hyperpod sagemaker),在上面有专门的nvidia plugin pod,不能直接装gpu operator不然会把集群干爆.......

  • vllm/sglang社区没有对aws sagemaker这一aws新推出的产品做适配,只有普通版本的aws eks的解决方案,而我们因为租不到机器只有sagemaker可用

  • 我的aws经常缺各种权限,整个context也非常神秘,aws自己的文档也是大芬,控制台界面一点都不清晰,十分难用,多亏了mt的扶持......

  • aws的网络栈问题: aws的pod是没有InfiniBand的!!!取而代之的是一个叫做efa的网络系统,在我解决了九九八十一难安装好lws,cert-manager,理解和处理好s3,pv,pvc等问题之后,尝试部署ome的时候又发现缺这个缺那个,设备map里面没有sagemaker...之后,发现部署不起来的原因是这个b没有eth0网卡!太神人了太抽象了,于是后面涉及到的大量组件都没有支持,全是我们和aws那边自己打镜像装驱动打出来的,比如基本的nccl, ucx和deepgemm......

  • 然后production stack那边,kuberay方案倒是能正常跑起来,但lmcache和MLA模型的兼容到我离职还没修好,在和aws的人一起战完ome和production stack宣布倒下之后转向了裸sgl部署.....

  • 这个sagemaker启动还很麻烦,开开关关,每次都要重新下载模型,完成配置等。最开始还没有ssh这种权限,全靠ai告诉我怎么写一个k8s job去启动下载......中间看过一点k8s operator相关的东西,但说实话没怎么看明白;后期装了node-shell插件之后倒是好了些,也知道node-shell省去自己写debug container,再看host宿主机了

  • 整个这个方向就是特别草台,比如在实习期间起aws的hyperpod的时候,有一次起不来,看了一下log发现在s3失败了,找了很久终于找到是因为名字写得太长(流汗黄豆,aws会在你的名字之外拉一坨哈希之类的东西,又只给了64的长度,还没有报错);结果修了之后还是炸,发现是helm add nvidia的gpu operator炸了,原因是nv那边推了一个错误的commit到主分支......

在整个过程中天天就是敲kubectl logs events describe apply delete+各种搜github issue, 感觉代码都不会写了(残念);不过也因为部署这个活,抽空看了不少论文,infra & rl & rag & code & agent

反正最后的结果是32H200的k8集群,k2在32k上下文80%cache hit rate下差不多 5.5 QPS,感觉对我自己来说还是一个可接受的值吧,lmsys 博客里面那个数据有点太玄幻了,好像也是在短上下文测的 ...... pd分离也做过没感觉有提升吞吐,dp-attention更是不知道为什么纯负优化,可能是姿势不对;

在公司还享受到一个福利是用上了最新的AI工具,cursor&claude code,还是有很多之前copilot没带给我的体验的,也为后续做codellm打了一定基础吧

然后在 8月底到9月初 这段时间吧,有点想离职了,一方面是做的方向确实和未来发展不搭:在干了一个月之后我比较确定后面是不想做ai infra的,还是算法更有意思一些;另一方面是学校那边各种事情也没完全结束,例如组会,例如勾搭到了另一些机会去做一些正统的llm4code研究,也通过相关的一些经验拿到了字节的offer......

于是就在9月中旬结束了这一段,一个是处理学校那边的事情,另一个是开启了下一段字节旅程,这次应该是做“算法”了.......

除此之外可记的主要就是一些娱乐的东西,比如打mai,或者丝之歌

整体上来说,这三个月确实对对整个眼界也好还是对AI算法的了解也好有了很大的breaking change,包括经常和一些很厉害的同学交流,有人在美国的、有大二就开始大厂实习的、有经验丰富的研究生和博士...... 包括自己看的一些论文吧,对可能前沿在哪边大致有一个轮廓了。

另一个比较有意思的是和aws那边的接触,感觉和他们开了特别多会www,在后面的时候,有一个他们那边的产品(?)来上海和我约了下咖啡,然后聊了一些关于我们的项目的事情,并对我大二跑出来实习这件事情感到很惊讶,说后面感兴趣也可以试试能不能去他们那里实习。然后和aws那边说我应该快要离职的时候,他们也挺惊讶的,问我是去新公司还是还在学校,并问我博几了(笑,绷不住了),然后我和他们说是本科,还有两年才毕业www

整体上也算是体验了一把系统工作,还低成本的体验了oncall(主要是看aws和mt oncall,笑)

但还是可能会感觉量化做的东西比较小家子气,所以下一段实习比较坚定地选了去大厂看看整体的技术深度也好,对产品或者业务的理解也好,去接触一些真正scale out的项目,其实也有和同学们聊天,更清晰地认识到了同一个方向,大小厂做的可能完全是两种东西的现状。

2025秋季学期总结

· 14 min read
ayanami

时间飞逝啊,站在26年回望去年的自己,当时估计完全想不到现在的情况吧。

这一年主要是两个大的变化:一是找到了比较喜欢的方向,也在这个方向上做了一些工作;二是实习了几乎一整年,对业界有了非常多之前难以想象的了解

书接暑期总结,处理完学校的事情之后,开始了我第一次在大厂的实习经历,入职字节

在前一个半月的时候,对大厂的一切都还处于一个非常新奇的状态,像海绵一样汲取着各种文档和其他同事见解的知识。字节的一个半月是飞速成长的一个半月, 大厂的各种东西确实和外界有很大不同,强烈建议所有同学至少去大厂实习一段,无论是学术、工程还是想躺平我觉得都是大有裨益的。

刚入职的时候,日记上是这么写的:

先说结论: 字节跳动对策性极强,泛用性极强,属于超大杯上,主包感觉第一天就要变成节孝子了,之前过的什么苦日子啊。电脑是m3pro 32+512;食堂是免费的,挺好吃的感觉大于学校;咖啡机刚上新,味道不错;mt人也很好,我直接没什么业务要做叫我多学学看看文档和paper;文档都可以看,技术栈深得很,吃饭就是听mt三个算法老ass讲设计拆方案,聊到自己的什么想法就能甩出几篇相关文档看。今天和mt讨论了一个多小时算法,真的爽聊了

对字节印象最深的就是bytetech和组内不间断的交流,当你的周围全是老算法工程师和顶尖Phd的时候,光是看他们每天在做什么、如何分析一个问题都能学到相当多的东西,更何况大家还是一起在研究一个共同的方向,能吃到一大堆业内的动态和最新最热研究成果,有人带着你拆openai/anthoropic的布局设计,有人能讲我之前就在阿里和微软工作,你看的这篇就是我们组之前干的,有人能写出来质量大于外场综述的技术文档、机器人给你推送不同组横跨多个领域的顶尖工作......如果有技术热情的话,你很难不被这种工作氛围深深吸引,“我们正在改变世界”。

曾经有一个同学和我说“你永远可以相信字节ld的技术insight”,确实如此,进来实习之后比起具体技术的提升,自觉收获更大的是对技术的一种嗅觉。在ai如此火热的当下,每年arxiv能产出几万甚至十几万篇文章,然而纷繁芜杂的论文背后,究竟哪些是值得follow的技术方向,哪些受限于资源难以做成,哪些是局部的优解但几个月后就会失去价值,又是哪些是rubbish paper?这些藏在学校头部实验室的top phd/教授的脑子里面的信息,在大厂里却能海量接触到:在厂里面你们是同事,随时询问,热心解答;厂外大家来自五湖四海,各自都在领域内有所建树,或许在学术会议上social半天还未必social得到...agent memory的落地,context的管理,搜索技术的边界,强化学习的落地,曾经不解的、质疑的、萌芽的想法在这里都得到了或阶段性或实验形式的答案,在和mentor提出一个设想的时候,被回答一句“你说的这个很有意思,之前豆包做过一个类似的东西,我给你看看文档了解一下他们怎么做的”,怎不会有一种和他人共鸣的强烈爽感?甚至有一次看到了某篇论文,感觉似乎挺有趣,一看trae组做的,就和那边约了一个meeting讨论,这种交流的感觉相当好。

除却技术眼界上的进步,字节给我带来的还有大厂生活的一窥:完善的基础设施建设、加班与赶工需求、组间的“小心机”、休息时对其他产品的吐槽......带来了一种小团队不会有的“真实感”,工业级需求到底是什么,技术方案设计究竟是什么样子,互联网是一种怎样的行业,字节给了一种近乎野蛮生长的体验,正如友人的评价

自己觉得现在正走在对的路上就会越走越轻松,主包现在就是步入正轨了所以越干越年轻

学术界主要承担的还是探索的作用,但是到底哪些想法能够落地?这种敏感性不在企业是锻炼不出来的,对需求判别和可行性判别做了强化学习说是。

另一个感觉值得一提的是某个小红书的AMA,

Q:课题组没卡,怎么做大模型?

A:如果卡少,就做inference加速,不怎么吃资源;如果有钱,就做Agent;啥都没有建议躺平

说的是真没错,如果实验室两个都不能满足的话,还是积极出去找工吧。 在llm这种scale up的场景,没卡真的是没得做,按照现在的情况来说,大部分实验室连跑个小训练或者调api做原型验证的财力都没有。校企合作是对的,不放正常企业的老师是有问题的

如友人评述:

企业的资源太丰富了,包括软性的各种交流、文档和硬性的软硬件,真没得比

在后一个半月的时候,看文档的时间相对变少了,主要原因是在做一篇llm coding相关的paper,从10月份和学长讨论决定做做试试,再到11月训练出来模型work,然后再是适用范围的放广,下游实验的不断加多,迭代训练和数据......一个非常幸运的是实习也恰好在遇到了对应的问题,然后伟大的mentor和+1大手一挥给了自由时间可以上班做这篇paper(相当于校企合作),于是也是在月初以一作投出去了

说起这篇paper还有一个很有趣的事情,书接上文在暑假的时候对代码补全起了一些兴趣,然后小红书给我推了一个招科研实习的,练习了一下发现居然是本院的博士(笑)还有找回自家来这么有趣的事情,经过一些paper reading和交流之后也是做起了RA,并且一起做了两篇paper,也建立了比较长期的合作关系......

在实习的这段时间和做科研的时间里面,感觉也算是找到了一个相当感兴趣的方向,即代码大模型,或者更广义一些是ai4se,一个原因是感觉这个方向处在一个微妙的ai和系统工程的叠加态,算是走回舒适圈;二是它在工业上的应用真的相当广泛,也是现在ai最能落地和解放生产力的方向之一,让所有人都能通过代码进行创造是一个相当promising的愿景。

除此之外好像就是正常上班,做一些业务需求,和前辈讨论一下新的idea和最佳实践。还有就是迷上了打乌蒙,也是在期末周上了w4了wwwww,正如某个群聊里面的给自己起的群昵称,上班磕盐舞萌ing。感觉就是一个正反馈循环,作息极其阴间的同时还挺享受的。

在上班下班的时间里面也和不少人聊天,再次仔细地想了想未来的一些规划,感觉现在一是继续深造不一定能吃到这一波大模型红利了,其实很赌;二是观察了几个做ai4se的组,感觉组内的去向最后也就是大厂相关方向实习;三是总体来看,厂里面做这个在资源、选题和成果的质量上都感觉远超学界,感觉学界相当多工作真没啥意义。倒是也想过去港新读一年硕,但经济开销和一些互联网里面对于硕士的观点好像也感觉没太多必要,感觉本科能找到的话硕士学历似乎好像没啥用,可能真想要的是一些休息的时间或者说眼界上的开拓,但国外情况越来越差、国内硕士的最好情况又是纯放养变成实习仙人——那倒是还不如早点上班,说不定不用做横向还更wlb一点。

还有一个体验是基模组的作息和出差,感觉真的很累,之前和同事聊也有类似的感受,真的一定要卷基础模型吗(我承认确实有一些美化滤镜)?还是说做一些更业务的算法方向比如偏agent、搜索之类的,但有机会还是想要体验一下,虽然我看我知道的大部分基础模型的老哥的工作也就是洗数据然后给infra搭好的训练基架提任务(笑),真能做模型架构创新的还是蛮少的,并且产出相当不稳定。

至于本学期的校内课,确实丢到犄角旮旯里面去了(心虚),成绩估计是烂完,基本就是不挂科吧。说实话我感觉这些课对我的未来规划没啥用。

除此之外产出了一些公共的贡献吧!在校内论坛发了不少精品技术帖,包括bytetech也搬运了一些www,给学弟学妹也提供了不少建议,感觉还是体验很好的。

之后就是寒假!希望我能稍微干点活www,前面其实积攒了不少idea,也有挺多社区的新paper也可以看,看看还能不能在秋招之前再产出一些成果吧,相信道路是曲折的,前途是光明的

2025春季学期总结

· 8 min read
ayanami

这学期的生活模式还是和前几个学期完全不同的,所以有必要讲一讲。

在上学期,迎来了第一个面试(虽然以字节一面挂告终www),也尝试在一些稍微大一点的学校里面的开源项目上进行贡献,但整体技术性的成长感觉并不是非常多,例如后端涉及的那些东西墨迹了一个学期也没学多少,还在和微内核缠斗(虽然这些OS的知识到现在也再没有用到过......)

而在这个学期,迎来了第一段实习,在某家quant做AI workflow,整体体验比较难绷,就感觉公司里面其实没有懂这个的人,很多数据和文档防实习生又和防贼一样,要不是有其他实习生的互帮互助,估计真中间就跑路了。但整体来说,也算是在这个领域自己学习了很多东西,基本上市面上的怎么做的都有了一定了解和实操,除了直接调LLM因为资源限制没太做过之外,下游的那些任务都基本接触过了。而在五月底结束实习的时候,其实就一直在想后面往哪里去走,本科就业还是本校保研,以及这个后端要不要继续往AI方向靠(AI应用有持久性吗)

而在实习的同时,在学校这边来到了新实验室做一些新的研究,学长学姐和老师都非常nice,大家一起摸鱼(笑),虽然不是什么非常成功、非常热门的实验室和研究方向,但胜在氛围舒服轻松,暑假也可能会迎来第一篇paper的发表。在实验室主要做的是强化学习的空地一体化,学期中间看paper的时候,有时候到也会感觉有点好笑,看的paper怎么这么多自动化和OR的,还是cs科班的学生吗(bushi)。

这个学期感觉也是MLsys再上一筹的学期,虽然我自己没有接触过,但周围做这个的同学可谓是捷报频传,收割offer和业界的认可就像是割草一样,感觉也是很好的吃到新兴期的红利了,还是有点羡慕的,之前几个要好的同学说可以来他们实验室做相关的研究,但到现在也没有去尝试,有点不太想做系统了。

说到系统就想起来几件事,一是ATC(系统顶会)在之后停办,二是某系统网红实验室的博士老大哥之一跑AI学院当AP了,还有就是之前校内论坛有AI方向的学长经验分析的时候的无心之言“当然还有计算机系统、安全、理论计算机、图形学之类奇奇怪怪的方向”,系统已经沦为“奇奇怪怪的方向”了,感觉心情有点难以表述,咱们软件学院的也算是图形系统TCS安全牢九门兼备了,很难评。

然后就是暑假,暑假这边有一个小学期非常恶心,专业特有的必修一个月在学校组队上课开发玩具项目,可以说非常逆天了,只能是苦衷作乐,自选了一个感觉有一点意思和挑战的题目,打算做个类似copilot的东西,不过等做出来再说了。非要在小学期里面塞一周五天的必修课,学生想去实验室和实习都非常恶心,做的又是shit,形式主义的事情又贼多(上班的时候都没有填过这种难绷的开发表,画UML图,每天开会......),只能说这课确实是一坨答辩。

最近也在投下一段实习,打算是大三上的时候再去实习一下,希望做的能更solid一些,也能获取到不管是算法还是工程上的一些指导。在约面试的过程中,也逐渐感觉云原生和AI infra还是现在后端机架方向的招工大头,缺少相关知识确实挺吃亏的,和马上过期的算法知识不通,底层的知识相对还是稳定一些,有空的话确实想要做一些cloud相关的工作。

还有就是实习的一些随感?例如,即使实习做的再toy,接触的也是工业的需求,要求的完成成熟度不是校内项目能比的;例如,实习出去一个人租房真的很爽,经济独立的感觉也非常好。

以及逐渐有一个暴论是:基础课真的应该早点刷完,因为上课(不管是校内的还是公开课)真的没有行业竞争力,这个竞争力都不是技术方向的,而是资源性的东西。例如算法的有没有跑过集群训练,工程的项目有没有上线经验之类,整个学校在本科生课程上真的没有投入任何资源,所有的资源都在实验室里面,所以从这个角度看,现在的小朋友确实应该早点进入实验室,早点确认自己的方向。

话是这么说,但其实我自己也没有确认方向,这个学期本身就是一个盛大转型和跑路,谁知道后面会怎么样呢,早些日子我一心本科就业,最近被硕士和paper卡麻了也在重新考虑要不要还是读个硕士,既是积累技术也是留自己一段几年的“gap”时间,好好观察和探索自己想要做的事情。

还是看看投递结果如何吧,约到了好多面,如果能在下学期去大厂实习的话,再走一步看一步,如果找不到心仪的实习对象的话可能就再补补知识继续沉淀一个学期,总归有路可走的,如果算本科就业也还有两年呢。少焦虑,多做事,多休息,否则身体真的会出问题,已经不想再去医院力。

2024秋季学期总结

· 17 min read
ayanami

如果照搬以前几期总结的格式, 我应该先写2024我看了什么书、学了什么课、了解了什么技术, 等等等。这些作为反思个人的学期效率和总结的环节固然是好的,对于show一下也是不错的选择, (毕竟若无这袈裟,世人怎知我...), 但我这次倒是先想从别的部分讲起

这个学期对我而言, 真正带来很大影响的是两件事: 第一件事是沉迷mygo, 第二件事是尝试申请实习。

mygo与符号

先讲mygo吧, 我真的很喜欢这部番, 目前在个人心目中在十年的看番经历中是第一, 虽然他质量并没有那么好。但他真的是看到我的心里去了, 在这个迷茫的时代"迷子"和就算迷路也要前进的几位主角真的是很入脑。本人已经在校内论坛和微信群聊go了一学期了, 还有一群同学、神秘助教、技术组长等一起go, 真是赛博盛世啊。甚至暑假去西安玩, 发现因为上大学几年没见的发小竟然也是纯血gop, 两个人一起在华山顶大喊"想成为人类"实在是太酷啦(并非, 其实只有他在喊, 本人在狂笑)。

最上头的角色是千早爱音丰川祥子, 知乎不是有个经典问题是"觉得自己和mygo的XXX很像,...", 偶尔也会有这种想法就是, 但看着go里面主角们的家资也会流下贫穷的泪水。但不扯远, 我从最开始的并不喜欢粉毛到后面的阿农gachi其实确实有在anon身上找到很多自己的影子的原因。又菜又爱出风头, 还喜欢当逃兵, 这不就是我吗(anon唐笑也很好听!), 无非比anon再多一个怕麻烦, 以及并非anon那样的甜菜; 而大祥老师就是太白月光了, 后续的黑祥又很有反差的美, ave mujica里面的软糯小祥又把我反差腐乳了。

anyway, 我觉得mygo的几位主角都像是普通人, 而她们的挣扎也好重力也好迷茫也好, 对我来说也是很有借鉴意义的, 而尤其是大祥老师这一个角色, 更是被二创塑造成一种对生活无常的反抗和叛逆的符号了, 而爱音对我而言则是代表一种和自我的和解与超越(看少女乐队品人生的也是神人了, 是谁看完mygo之后天天沉迷假药和同人文, 什么赛博小祥如龙小灯木遁睦头水岛玲乃灰爱音...), 总是希望自己能更加作为anon那样的黏合剂, 或是成为白祥那样的给人希望, 又或是能像灯皇诗超绊那样爆发勇气...

实习与流水账

再讲实习, 其实原定计划是11月底12月初开始找25春的日常实习, 大体定的方向是java/go的后端开发。也因为总感觉还有时间所以暑假并没有紧张起来, 所以暑假更多的还在探索阶段(其实就是摆了), 在大伙还在实验室/班上坐班的时候就早早润回家旅游去了, 后面也就写写开源(校内的选课社区项目jcourse), 随便学学(例如玩了玩godot, 看了一点编译), 打打游戏(五天全心全意通关黑猴), ...时间很快的就从7月1飞到了9月1, 惊呼"不能这么摆了!"遂回校

9月1到开学前这两个多星期把网络速通掉了, 经典的cs144, 他的课讲得感觉也就是差不多的水平, 可能听感上类似61C和081, 但稍微更有激情一点没让我中间睡着(), 但他的lab还是很有价值的, 主要写的真的很优雅, 测试也非常的全, 简直让我感觉我的代码完全不配出现在这样完善优雅的框架里面, 我写一个函数几十行, 他写上百个测试来测这个我真的哭死,每一个测试还都给了类似状态机的log,用不同颜色标出来到底是在哪一步不对了, 体验真的是很好。

9月底的时候, 打算写点DB, 当时想的是差不多一个多月写完, 再刷两星期力扣八股, 就去面实习, 然后当时刚开个头呢, 就收到了一个意外的大厂后端组的面试机会, 是某个学长的空位找继任, 于是紧急看了一天八股就被拉去面试了——最后一坨答辩。课程项目人家根本不care, 力扣easy题写崩了(平时不刷算法题又依赖IDE导致的!), 八股sql调优答不出来, 架构设计的答案也欠佳, 就只有刚学的网络答得还行, 又被面试官问了很多比较无厘头的问题(比如一直追着我问为什么用pg不用mysql),心态比较炸,收到一面拒的结果之后心情颓丧了好几天, 又借着这次机会复盘了一些企业的招人逻辑和学校培养的区别之类。

在10月中旬的时候, 先是速通了黑马点评(事实证明他其实讲得不算烂, 能以这样甚至取巧的方法给完0基础的人讲明白也确实是有东西的, 对他的"鄙夷"是错误的)把缓存相关的知识恶补了一通, 然后振作起来去找jcourse的leader(伟大的ddl)要了点活, 自己一个人做着, 调研、写实现、测试、pr、按照leader的review意见修正...也算是写了几个feature, 但是由于其他人的工期问题这个项目估计还得开发几个月, 在其中感觉还是比较锻炼人, 对后端开发逐渐有了一些自己的理解, 也在看一些系统架构的东西, 辅以这学期的应用系统体系开发这门课(主讲中间件和db, 虽然比较泛泛而谈但也还算开眼界) , 也是能有所收获。

而在10月底, 两个意外(这学期太多意外了...)的事情又打乱了我的计划, 一个是OH俱乐部周会上之前做项目的导师问我要不要去读读OS的源码(老师是研究可信环境的), 并提议让我带几个小朋友一起读读, 体验一下如何组织一个项目, 我当时想着闲着也是闲着就同意了, 并且如果没这个活我可能就回去看xv6了; 另一个是从另一位老师那里得到一个难得的机会, 说寒假可以帮我推推实习, 于是就没有在学期中继续自己投...(虽然也不知道寒假的结果怎么样, 如果不中的话再说, 可能去接横向实习, 可能自己广投, 也可能先把学校后面的课修掉再等一年), 总之在10月之后我的生活就进入了有活干和没活干的叠加态。

但是11、12月的进度是令人欠奉的, 一方面是学校发力了, 应用系统体系架构的事情其实不少, 上学期的项目在加了34个db六七个微服务各种中间件之后飞快地变成屎山, 还经常炸环境/需要改前端...另一方面, 因为转专业补的课有三门, 离散数学、ics1(计算机系统基础1)和sep2(软件基础实践2), 再加上一门我旁听的CSE, 这几门也干了...

  • ics1: 虽然整过csapp, ics2, nju ics和61c,OSTEP, 对计组应该是比较熟悉了,但我确实没怎么玩过二进制拆炸弹和位魔术, 于是和小朋友们一起写bomb lab和data lab等, 并且写的还没有小朋友好(知耻啊知耻)。在小朋友们感觉真好玩的时候, 老登特有的吃着碗里的看着锅里的让我觉得这玩意和我做的好不搭,这不是隔壁IS的CTF pwn吗...然后疏于练习导致考试爆炸了(悲
  • 离散数学: 久仰大名, SE神课之一, 奈何还是限制于工科平台, 无法自由发挥, 课是没去一节的, 只能看着回放补着超过课上难度的作业再看着各种奇奇怪怪但挺有趣的特供额外讲义这样子(和lab配套,都是自动求解、程序证明相关的)。lab短小而有趣, 分别是sat solver算法, smt solver算法, 调用微软的库证明几个最简单的程序之类,很快就能写完, 就是作业的传统数学还是真得控制我了
  • sep2: 风评还行但我作为一个老登对这门课意见很大。这门课主要的问题在意义不明, 明明什么也不讲(可能是讲了, 但讲了又不太可能)实质上就是把一群人拉到同一个教室自习, 但lab的考核方式却又是无意义工作量又是神奇评分(指不告诉你有几个bug也没有任何测试的debug lab和想要上成missing semester实际效果却是让push都pu不明白的小朋友去研究git revert的edge case还有gui绑死的c++qt框架)小朋友也觉得这东西没啥意思, 大朋友更是一身花活玩不出来 & 连第一次体会GUI编程的新奇感也老早被夺走了,只剩"哎呦我勒个qt嗯糊没有任何设计啊我能不能用pyqt/electron/游戏引擎...啊" 故被气晕(bushi)
  • CSE: 实际上我只上了一半的课就中期跑路了, 也就写了lab1的单机文件系统, 后面的因为当时主要想推jcourse的feature进度, 后续在补其他课的作业就咕咕了。但这门课其实体验挺不错, 不愧其名声。前中后分别讲文件系统、分布式和网络,4个lab层层递进是实现单机fs, 分布式fs, raft, mapreduce。讲课的老师是system的新星Xinda Wei老师(博士5篇sys顶会的含金量!), 他讲得很好就是太快了...

中间还有周会之类暂且不表

整点薯条?与焦虑

总之抛开最后几周的小测和选修课任务不谈, 这两个月还是玩得比较愉快的, 把力扣hot100刷得差不多, 把OS Lab的源码基本看了, 刷了jyy OS的课(他讲得超级新鲜! 可惜没空写lab了), 看了本讲linux网络的书, 看了本系统架构相关的书, 水了水人月神话啊, 玩了玩flutter、网络脚本, 用docusaurus重构了个人网站并写了点随笔, 看了看godis之类的源码, raft之类的协议, db八股, 改善了自己的CI/CD工作流, 偶尔上论坛和朋友同学们扯两句课程改革、线下约约饭散散步之类...

这学期论坛和线下上对于专业课程的节奏都挺大的, 具体就不在这里谈了, 也常常令人深思在这样的AI时代, 我们这些人究竟应该去干什么呢? 同学A从db跑路到云又跑路去mlsys了,同学B开始申请phd, 但我还在原地自娱自乐也偶尔令人焦虑, 一个学期过去了简历却并没有什么可以更新...手上虽然有几个机会, 但感觉都挺“打破常规”, 或许得有一些破釜沉舟、重新开始的勇气...

如果说上学期是"沉淀"和"磨练", 这学期的关键词就是"不确定性"和"迷路", 我要走向何方? 这学期和人交流得也变少了, 一方面是自己确实又宅又懒, 另一方面是还没有重新找到那种“就是你了!”的热情, 希望在寒假能给自己一个"确定性"的答案吧(估计也就是在寒假了, 虽然我深知"估计"是很扯淡的

朋友说"我尚且处于学什么都有意思,干什么看上去都能干下去的阶段", 故"找不到方向";我却有点正好相反的味道, 看了不少东西, 却总是嫌弃这个那个, 静不下心, 磨不下苦功, 总想在cs里面找到最有趣的部分, 又有之前的一股牢味和现实气息, 十分矛盾。

但现在起码有一件事情是确定的:

即使迷路, 也要继续前进!

2023秋季学期总结

· 7 min read
ayanami

学期末总结(2023/12/16)


这学期也没做什么事情。

看过的书:
  • OSTEP大致看了一半,并行相对看得最少,持久化复杂一点的也没看,只能寒假再说了

别的就真没啥好说的了,看书太少了,都是浅尝辄止看了一两章这样


做过的事:
  • 转专业:学期前半段的重头戏,鬼知道我在复习、整简历、和学长交流面试经验、背稿子上花了多少时间,不过好歹最后是成功转入软院了,算是达成了一个阶段性的大目标
  • 奖学金:也是很烦人的东西,各种材料的不断重复+流程的冗长,一直打断我的工作流,为了申到国奖还是废了不少力气

2024春季学期总结

· 11 min read
ayanami

上学期是转入软件工程专业的第一个学期,也是我的新大一下。

在转入之前,我有很多美妙的幻想,无论是声名远扬的实验室和校内最好的本科教学,还是软件学院向来高标准严要求,被学长们交相赞誉“XX为数不多的值得读的专业”,而JYY的课程让我更是早早地期待起了这学期的讲课水平。虽然本人也有很多类似的失望经验了,但人总归对新环境有一种期许的。

与此同时,老师整了个全新的项目——挺新奇、也挺有挑战的一个课题,同时水源的开发也算是委派了第一个新人试水级别的任务,看似前途一片光明——在开学的前三周,我就在一种喜悦的充实感之中度过,总感觉真是大有可为,会是飞速成长的一个学期。

然而事实却给了我两个大嘴巴子——贪心不足蛇吞象,这也要那也要的结果就是都干不好——另一个原因也是我依然高估了自己的能力,低估了软院课程的工作量, 一学期2w行代码真不是说着玩的。同时课程质量各个课之间的差距也特别大,距离赶上国外尚任重道远乎......

上学期上了哪些课呢?

  • ICS2,计算机系统基础2,csapp剩下的全本+ostep的部分+许多Linux拓展,在原本的CSAPP Lab上也加了新的手写assembler和simulator。体系结构讲得很难,后面的系统讲得很广,总体上除了后几个lab文档确实不怎么样之外体验还是好的,能体验到许多新奇的东西——slab, vma, elf和动态链接的各种细节,等等等,但也就是这学期唯一的希望之光了。唯一一门有国外公开课水平的课,体感优于15213,和61c差不多(广度倒是远大于),差于NJU ICS。

  • ADS,高级数据结构,粪课。内容为radix tree,rbtree,splay tree等各种树+kmp+快选+skiplist+bloomfilter+cuckoo hash+高阶图算法、并行图算法(三种并行最小生成树+pagerank。有12个hw,不少带实验报告,4个lab和一个proj。他的讲课真的很烂,一度有让我产生“什么?这不是华五正统科班,这是带专,课程吸水变高变大”之感,又是签到狂魔和作业狂魔,给分还差,导致体验非常不好。lab和proj还算是这门课最后的良心——虽然是助教的功劳。一个Huffman压缩,一个基数树,一个HNSW+并行优化(这个我是真喜欢),还有一个重量级LSM Tree。LSM tree真是一个好项目——虽然我写了很久(算上沟槽的实验报告在80个小时以上),但写完还是收获非常大,从c++17到db设计中的各种技巧和权衡乃至debug、写测试、管理项目的能力——从0开始手写一个支持键值分离、GC、持久化(还有选做的并行)等feature的LSM真是很磨练人。这门课最大的问题在于耗时间太多,且有些东西太过琐碎,虽然学了不少东西,但浪费的时间也是很多。几位助教真是辛苦了,硬生生把这门课程从依托变成了还算能看的东西。

  • Web, 互联网应用开发。前端React+后端Spring Boot+JPA的手搓全栈开发课——很有培训班的风格。老师前半学期讲前端的时候挺无聊的,毕竟寒假自学过,后半学期对着《Database System Design》来讲的时候倒是很有意思,从JPA的底层讲到数据库范式、同步等机制,还是挺有意思,加上给分也好,算是一门还行的课。下学期还有他的Web2, 讲讲各种Redis,MQ,Cloud, 全局搜索之类的东西,还是可以期待一下。

  • math4cs:垃圾课,完全不知道在教什么。今年这门课发生了改革,把自动机的部分去掉了,导致整体更没法看。前半是信息论和凸优化的最基础的东西,后半又开倒车回到了线代——SVD,QR,LU,...,结果大作业又是train两个AI model,不知所云的课。

  • 量子力学:沟槽的工科平台,软件工程的学生学牛魔量子力学。