rghosh8/gsm8k-deepseek-llm-7b-chat-rajat-seed-42-G-16_merged

Go to file

ModelHub XC cc7fa7a606 初始化项目，由ModelHub XC社区提供模型

Model: rghosh8/gsm8k-deepseek-llm-7b-chat-rajat-seed-42-G-16_merged
Source: Original Platform

2026-04-22 16:34:06 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-04-22 16:34:06 +08:00

chat_template.jinja

初始化项目，由ModelHub XC社区提供模型

2026-04-22 16:34:06 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-04-22 16:34:06 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-04-22 16:34:06 +08:00

model-00001-of-00006.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-22 16:34:06 +08:00

model-00002-of-00006.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-22 16:34:06 +08:00

model-00003-of-00006.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-22 16:34:06 +08:00

model-00004-of-00006.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-22 16:34:06 +08:00

model-00005-of-00006.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-22 16:34:06 +08:00

model-00006-of-00006.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-22 16:34:06 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-04-22 16:34:06 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-04-22 16:34:06 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-04-22 16:34:06 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-04-22 16:34:06 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-04-22 16:34:06 +08:00

README.md

language, library_name, pipeline_tag, tags, base_model

language

library_name

pipeline_tag

gsm8k-deepseek-llm-7b-chat-rajat-seed-42-G-16_merged

Merged model fine-tuned from deepseek-ai/deepseek-llm-7b-chat on GSM8K using GRPO.

Usage

from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("rghosh8/gsm8k-deepseek-llm-7b-chat-rajat-seed-42-G-16_merged", torch_dtype="auto", device_map="auto")
tokenizer = AutoTokenizer.from_pretrained("rghosh8/gsm8k-deepseek-llm-7b-chat-rajat-seed-42-G-16_merged")