跳转至

LLM智能应用开发

25Fall情况

授课情况

笔者基本上没上课,徐老师在b站上有账号,会录课。Slides 上课收获:主要是作业,手搓llama的模型框架,主要是用torch搓了推理(forward)部分的模块代码,没有涉及训练。

考核

给分:没有考试,中规中矩。笔者把作业基本上写完(加上bonus中极少一部分),最终得分91。

选课建议

一个大黑点在于这个课的很多作业测试的精度是很难对齐的,所以导致你作业完成的难点会变成和他对齐一模一样的推理代码,而不是逻辑上。 好处在于没有期末考试。

从学习的角度来看, - 如果你之前对大模型一无所知,而且有强烈学习的想法,还是能学有所获的。但是也建议把这个课和国外公开课混着上。 - 如果你已经对传统transformer有基本的了解,但是不系统,如果你想要获得实践经验,我建议你去写CS336的作业,比这门课的作业好太多,如果你想要学习更系统的理论,去上国外的公开课。 - 如果你只是想水学分,这门课我觉得勉强达标,主要是作业确实恶心,因为调精度不是你的问题,是他测试的问题,你无从debug。

评论