solidrust
/

dolphin-2.9.4-gemma2-2b-AWQ

Text Generation

4-bit precision

Inference Endpoints

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Suparious commited on Sep 3, 2024

Commit

23985de

·

verified ·

1 Parent(s): 07cb191

Update README.md

Files changed (1) hide show

README.md +4 -0

README.md CHANGED Viewed

@@ -27,7 +27,11 @@ quantized_by: Suparious
 - Model creator: [cognitivecomputations](https://huggingface.co/cognitivecomputations)
 - Original model: [dolphin-2.9.4-gemma2-2b](https://huggingface.co/cognitivecomputations/dolphin-2.9.4-gemma2-2b)
 ## How to use

 - Model creator: [cognitivecomputations](https://huggingface.co/cognitivecomputations)
 - Original model: [dolphin-2.9.4-gemma2-2b](https://huggingface.co/cognitivecomputations/dolphin-2.9.4-gemma2-2b)
+<img src="https://cdn-uploads.huggingface.co/production/uploads/63111b2d88942700629f5771/ldkN1J0WIDQwU4vutGYiD.png" width="600" />
+This one is special because I used [GrokAdamW](https://github.com/cognitivecomputations/grokadamw) and [Liger Kernel](https://github.com/linkedin/Liger-Kernel)
+GrokAdamW is intended to enable fast Grokking, to increase generalization.  (I am not certain this occurred because this checkpoint is 4 epochs, and it probabaly take more epochs to achieve grok.)
 ## How to use