Differences

This shows you the differences between two versions of the page.

--- ml:scaling_laws [2025/05/01 04:00] – [Papers] jmflanig
+++ ml:scaling_laws [2025/06/01 23:09] (current) – [Related Pages] jmflanig
@@ Line 14: / Line 14: @@
 ==== Emergent Abilities ====
+See also [[nlp:Language Model#Origin of Capabilities|Language Model - Origin of Capabilities]].
   * GPT-3: [[https://arxiv.org/pdf/2005.14165.pdf|Brown et al 2021 - Language Models are Few-Shot Learners]] GPT-3 showed emergent abilities.  See for example Fig 3.10.
   * [[https://arxiv.org/pdf/2206.07682|Wei et al 2022 - Emergent Abilities of Large Language Models]]
@@ Line 23: / Line 25: @@
   * [[Hyperparameter Tuning]]
   * [[nlp:Language Model]]
+  * [[nlp:Language Model#Origin of Capabilities|Language Model - Origin of Capabilities]]
   * [[nlp:pretraining#Pretraining Methodology]]