My Notes


A place to document my daily learning journey and encountered bugs
  • Linux分区调整--gparted

    Post thumbnail
    Post thumbnail
    分区分配上,/相当于windows的C盘,/home可以理解为d盘,在/目录下是需要sudo,软件的安装大多是在/目录,所以建议大一些,但是个人的数据是存在/home,以及一些配置文件(./zshrc,/.jdk等等)。 [Read More]
    Tags:
  • LLM-Evaluation

    Post thumbnail
    Post thumbnail
    Perplexity of fixed-length models PPL(perplexity) is one of the most common metrics for evaluating models. If we have a tokenized sequence $X = (x_{0},x_{1},\dots x_{t})$, the perplexity of X is \(P P L ( X ) = e x p \left\{ - \frac { 1 } { t } \sum... [Read More]
    Tags:
  • RHLF(基于人类反馈的强化学习)

    Post thumbnail
    Post thumbnail
    在监督式微调之后,RLHF 是一个用于使大型语言模型(LLM)的答案与人类期望对齐的步骤。这个想法是从人类(或人工)反馈中学习偏好,这可以用来减少偏见、审查模型或使它们以更有用的方式行动。它比SFT更复杂,通常被视为可选的。 [Read More]
    Tags: