added r1 evaluation logic

2026-04-19 12:58:07 +00:00 · 2025-02-11 03:46:56 +00:00 · 2025-02-11 03:46:56 +00:00 · a3ea4449d1
commit a3ea4449d1
parent 03f87dbc07
6 changed files with 208 additions and 0 deletions
--- a/eval/r1/yaml/algorithmic.yaml
+++ b/eval/r1/yaml/algorithmic.yaml
@ -0,0 +1,25 @@
+model: deepseek/deepseek-r1
+category: algorithmic
+datasets:
+  - base_conversion
+  - binary_matrix
+  - caesar _cipher
+  - group_anagrams
+  - isomorphic_strings
+  - letter_counting
+  - letter_jumble
+  - number_filtering
+  - number_sorting
+  - palindrome
+  - ransom_note
+  - rotate_matrix
+  - sentence_reordering
+  - spell_backward
+  - spiral_matrix
+  - word_ladder
+  - word_sequence_reversal
+  - word_sorting
+eval_dir: eval/r1
+dataset_size: 50
+dataset_seed: 42
+developer_role: system