Model save

Files changed (3) hide show

README.md CHANGED Viewed

@@ -36,15 +36,15 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
-- train_batch_size: 3
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 8
-- total_train_batch_size: 24
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
-- num_epochs: 1
 ### Training results
@@ -54,6 +54,6 @@ The following hyperparameters were used during training:
 - PEFT 0.13.0
 - Transformers 4.45.1
-- Pytorch 2.5.0+cu121
 - Datasets 3.0.1
-- Tokenizers 0.20.1

 The following hyperparameters were used during training:
 - learning_rate: 0.0002
+- train_batch_size: 4
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 8
+- total_train_batch_size: 32
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
+- num_epochs: 3
 ### Training results
 - PEFT 0.13.0
 - Transformers 4.45.1
+- Pytorch 2.4.0
 - Datasets 3.0.1
+- Tokenizers 0.20.0

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fecd8ef19c0400cf1cd2ec3073f5d2439005e406cde8dcd564faf5520243d4f0
 size 4372840

 version https://git-lfs.github.com/spec/v1
+oid sha256:d952afae5683332c171b4991117b033c1074dfa8dc42502bbc08ac97da637962
 size 4372840

runs/Nov08_06-55-47_863353abc655/events.out.tfevents.1731048951.863353abc655.30.2 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:080e858b652af29e15167603cb5b1c4fb964c682972e1b426374dcd0e73bf1eb
-size 8409

 version https://git-lfs.github.com/spec/v1
+oid sha256:87d3bc8f15e0c9ef7464d289674eabfeb863f4769e6637422ffaca4793ed4397
+size 9792