mirror of
https://github.com/InternLM/InternBootcamp.git
synced 2026-04-19 12:58:04 +00:00
refactor(data_pipeline): optimize data generation pipeline; add multiple preset configurations for data generation
This commit is contained in:
parent
1a8477c8d8
commit
8d493b35a0
2160 changed files with 69199 additions and 154 deletions
82
examples/pipelines/all_configs/korPuzzleWordBrainTeasers_test.json
Executable file
82
examples/pipelines/all_configs/korPuzzleWordBrainTeasers_test.json
Executable file
|
|
@ -0,0 +1,82 @@
|
|||
[
|
||||
{
|
||||
"num_words": 5,
|
||||
"nouns": [
|
||||
"sun",
|
||||
"flower",
|
||||
"pine",
|
||||
"apple",
|
||||
"butter",
|
||||
"fly",
|
||||
"news",
|
||||
"paper",
|
||||
"cat",
|
||||
"fish",
|
||||
"history",
|
||||
"building",
|
||||
"ball",
|
||||
"room",
|
||||
"fire",
|
||||
"place",
|
||||
"water",
|
||||
"fall",
|
||||
"door",
|
||||
"knob",
|
||||
"light",
|
||||
"house",
|
||||
"tooth",
|
||||
"paste",
|
||||
"book",
|
||||
"case",
|
||||
"cup",
|
||||
"board",
|
||||
"air",
|
||||
"port",
|
||||
"rail",
|
||||
"road",
|
||||
"sea",
|
||||
"shell",
|
||||
"snow",
|
||||
"ball"
|
||||
]
|
||||
},
|
||||
{
|
||||
"num_words": 4,
|
||||
"nouns": [
|
||||
"tree",
|
||||
"leaf",
|
||||
"bud",
|
||||
"branch",
|
||||
"bark",
|
||||
"root",
|
||||
"seeds",
|
||||
"fruit",
|
||||
"bloom",
|
||||
"sapling",
|
||||
"forest",
|
||||
"grove",
|
||||
"orchard",
|
||||
"jungle"
|
||||
]
|
||||
},
|
||||
{
|
||||
"num_words": 5,
|
||||
"nouns": [
|
||||
"rain",
|
||||
"storm",
|
||||
"wind",
|
||||
"cloud",
|
||||
"lightning",
|
||||
"thunder",
|
||||
"fog",
|
||||
"hail",
|
||||
"sleet",
|
||||
"snow",
|
||||
"sunshine",
|
||||
"dawn",
|
||||
"dusk",
|
||||
"twilight",
|
||||
"moonlight"
|
||||
]
|
||||
}
|
||||
]
|
||||
Loading…
Add table
Add a link
Reference in a new issue