mspl commited on Mar 13

Commit

dea1660

1 Parent(s): 21e0521

Initial commit

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

README.md +32 -0
models/deberta-v3-large-finetune_20240925121914_semeval-seed1337/config.json +35 -0
models/deberta-v3-large-finetune_20240925121914_semeval-seed23/config.json +35 -0
models/deberta-v3-large-finetune_20240925121914_semeval-seed271/config.json +35 -0
models/deberta-v3-large-finetune_20240925121914_semeval-seed314/config.json +35 -0
models/deberta-v3-large-finetune_20240925121914_semeval-seed42/config.json +35 -0
models/deberta-v3-large-finetune_20241009160411_esnli-seed1337/config.json +35 -0
models/deberta-v3-large-finetune_20241009160411_esnli-seed1337/model.safetensors +3 -0
models/deberta-v3-large-finetune_20241009160411_esnli-seed1337/training_args.bin +3 -0
models/deberta-v3-large-finetune_20241009160411_esnli-seed23/config.json +35 -0
models/deberta-v3-large-finetune_20241009160411_esnli-seed23/model.safetensors +3 -0
models/deberta-v3-large-finetune_20241009160411_esnli-seed23/training_args.bin +3 -0
models/deberta-v3-large-finetune_20241009160411_esnli-seed271/config.json +35 -0
models/deberta-v3-large-finetune_20241009160411_esnli-seed271/model.safetensors +3 -0
models/deberta-v3-large-finetune_20241009160411_esnli-seed271/training_args.bin +3 -0
models/deberta-v3-large-finetune_20241009160411_esnli-seed314/config.json +35 -0
models/deberta-v3-large-finetune_20241009160411_esnli-seed314/model.safetensors +3 -0
models/deberta-v3-large-finetune_20241009160411_esnli-seed314/training_args.bin +3 -0
models/deberta-v3-large-finetune_20241009160411_esnli-seed42/config.json +35 -0
models/deberta-v3-large-finetune_20241009160411_esnli-seed42/model.safetensors +3 -0
models/deberta-v3-large-finetune_20241009160411_esnli-seed42/training_args.bin +3 -0
models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed1337/config.json +35 -0
models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed1337/model.safetensors +3 -0
models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed1337/training_args.bin +3 -0
models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed23/config.json +35 -0
models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed23/model.safetensors +3 -0
models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed23/training_args.bin +3 -0
models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed271/config.json +35 -0
models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed271/model.safetensors +3 -0
models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed271/training_args.bin +3 -0
models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed314/config.json +35 -0
models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed314/model.safetensors +3 -0
models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed314/training_args.bin +3 -0
models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed42/config.json +35 -0
models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed42/model.safetensors +3 -0
models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed42/training_args.bin +3 -0
models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed1337/config.json +35 -0
models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed1337/model.safetensors +3 -0
models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed1337/training_args.bin +3 -0
models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed23/config.json +35 -0
models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed23/model.safetensors +3 -0
models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed23/training_args.bin +3 -0
models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed271/config.json +35 -0
models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed271/model.safetensors +3 -0
models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed271/training_args.bin +3 -0
models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed314/config.json +35 -0
models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed314/model.safetensors +3 -0
models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed314/training_args.bin +3 -0
models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed42/config.json +35 -0
models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed42/model.safetensors +3 -0

README.md CHANGED Viewed

@@ -1,3 +1,35 @@
 ---
 license: cc-by-3.0
 ---

 ---
 license: cc-by-3.0
 ---
+Adaptive Prompting: Ad-hoc Prompt Composition for Social Bias Detection
+=======================================================================
+Finetune baseline models for the paper [Adaptive Prompting: Ad-hoc Prompt Composition for Social Bias Detection](https://arxiv.org/abs/2502.06487).
+For details, please see the published paper and the [GitHub repository](https://github.com/webis-de/naacl25-prompt-compositions).
+```
+@inproceedings{spliethover-etal-2025-adaptive,
+    TBDTBDTBD
+    title =      "Adaptive Prompting: Ad-hoc Prompt Composition for Social Bias Detection",
+    author =     Splieth{\"o}ver, Maximilian and Knebler, Tim and Fumagalli, Fabian and Muschalik, Maximilian and Hammer, Barbara and H{\"u}llermeier, Eyke and Wachsmuth, Henning,
+    booktitle =  "Proceedings of the 2025 Conference of the North American Chapter of the Association for Computational Linguistics",
+    month =      apr,
+    year =       "2025",
+    address =    "Albuquerque, New Mexico",
+    publisher =  "Association for Computational Linguistics",
+    url =        "https://arxiv.org/abs/2502.06487",
+}
+```
+## Note on published models
+Unfortunately, we did delete the original finetuning baseline models, for which we reported the scores in the paper. We do, however, still have the prediction results of these models.
+We did retrain the models on the same splits, same seeds, same python version, and same library versions. The new models and also the new (and old) prediction results are uploaded in this repository.

models/deberta-v3-large-finetune_20240925121914_semeval-seed1337/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20240925121914_semeval-seed23/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20240925121914_semeval-seed271/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20240925121914_semeval-seed314/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20240925121914_semeval-seed42/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20241009160411_esnli-seed1337/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20241009160411_esnli-seed1337/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b3b96443850afa527e69d2bc814e377538eef6c49a88e1ae70b12526079ccbf8
+size 1740304440

models/deberta-v3-large-finetune_20241009160411_esnli-seed1337/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b3d3c6dc6b08f42451f4af2748072c718a7bbe7e06d7a8585d20cf63b1399aaf
+size 6072

models/deberta-v3-large-finetune_20241009160411_esnli-seed23/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20241009160411_esnli-seed23/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:880a39cd98dbed57ed8c54a3b415259b0f3773c7c971fce51e2c7ab1544781e6
+size 1740304440

models/deberta-v3-large-finetune_20241009160411_esnli-seed23/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d3d0312e742244e6b187ab1a75eb7f9011ad0f57826dffb664e9c6c2863c1f2a
+size 6072

models/deberta-v3-large-finetune_20241009160411_esnli-seed271/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20241009160411_esnli-seed271/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7bfb4f8e42ab15fa504b7860e9e5676783019d3ec195c88c1960b3cfe4e2c71f
+size 1740304440

models/deberta-v3-large-finetune_20241009160411_esnli-seed271/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:50d82d1f396cd78cb35ae30460e34f8770dd0979ca10652d46f375b654068d27
+size 6072

models/deberta-v3-large-finetune_20241009160411_esnli-seed314/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20241009160411_esnli-seed314/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ef6d7a605720c8cb6830a2d2427cfc05032dcd1e78ebb587d8a9d0dab381a529
+size 1740304440

models/deberta-v3-large-finetune_20241009160411_esnli-seed314/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a35addca141002394ba9ac66d0ede8415b67f024d5d2f1799b5ecb1cbdae5309
+size 6072

models/deberta-v3-large-finetune_20241009160411_esnli-seed42/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20241009160411_esnli-seed42/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bbf1d1639831005acb2a23bc6704cc71ea49db79e3bc455c679f0e1b07abe212
+size 1740304440

models/deberta-v3-large-finetune_20241009160411_esnli-seed42/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:824899bd4313acc5bdcd6d0cb281df8b29c7547a98d0bea3fcc51ce0589cb2cb
+size 6072

models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed1337/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed1337/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2c2affdca45e2eb1b7f14be129b2c27bb37e2e8a72e96b511b620debaddeb035
+size 1740304440

models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed1337/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c43633a5ea4a28d23a941d3539e3df85c5cc79b2ff9ca1517ecf1f392c411ee0
+size 6072

models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed23/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed23/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5983eff123cef2a32c05225aa05d5f5d39d8284b3d819cd0a60b643f96aef236
+size 1740304440

models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed23/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fdf9a544c509b36825e469bde665ac9a99a6babc742b847b88a21bf634102500
+size 6072

models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed271/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed271/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e3b50a5a03861516069ed3be49175dfae3437edfe3a38f6b8e933d4ec41da692
+size 1740304440

models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed271/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e9518c63f6f9fc7bcaf61d3393b86e354004d793abdc88dbca0f2d7cae3afdb5
+size 6072

models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed314/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed314/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c2f5efae4c03751e907a1310563c329e694c9ee48a14128950633f940d712300
+size 1740304440

models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed314/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:25b867a285c5db9e07b4135195c05a0bd583569a1256abbcdb06ab4547dcbbcf
+size 6072

models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed42/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed42/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:20b7d3be248b531f9978f4dda1c81d73e53913ffc1dc5598374012493625cf36
+size 1740304440

models/deberta-v3-large-finetune_20241010181021_commonsense_qa-seed42/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fcfe62ccc65106ddc2fbe5f3d5dddb7c18c1a447cfb16d37b6f0ecd4dfb04072
+size 6072

models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed1337/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed1337/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0d472ce400e2b9d04a2350a7043db28785df1ae75c2b5bd97791ac8e85f48505
+size 1740304440

models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed1337/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7b8766d38f9c382b29bc1685213c546503e5ee8574c732ff000639ef0b6f0f07
+size 6072

models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed23/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed23/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1352e061ef285f133cc47281a650d6aad039d54f0bded321b3edd3b240e93462
+size 1740304440

models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed23/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:14ce35c28b6a23ae925682382eaff4b3319741918791f2f44bf0f42d9a70232e
+size 6072

models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed271/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed271/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:83e2a48f2ca62c0a3391b2ab2cce5b266ffe136575b76889343e3d25a69797e8
+size 1740304440

models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed271/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5f078f427406cfb7a10fe75aa5e45d3a2d3853dae7fc501461609f9cc1aa7c4e
+size 6072

models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed314/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed314/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a47aadda7bc6816623f8d504fb9bb7c3450dae3c49310045fe0639e06c99e5ed
+size 1740304440

models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed314/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7ab4751faf1c6139b730f1329489b578509255c9f9c1af4cb6382e897709a64d
+size 6072

models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed42/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "./models/deberta-v3-large",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 1024,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
+  "type_vocab_size": 0,
+  "vocab_size": 128100
+}

models/deberta-v3-large-finetune_20250305185342_cobra_frames-seed42/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9208cdee1ff9dd49a80a3bc30090fe852b00e11ce0532219b5e4fd79ebfbc2f1
+size 1740304440