MedMistralInstruct-CPT-SFT-7B

Go to file

ModelHub XC 377ec9f47a 初始化项目，由ModelHub XC社区提供模型

Model: ik-ram28/MedMistralInstruct-CPT-SFT-7B
Source: Original Platform

2026-05-09 23:52:59 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-09 23:52:59 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-09 23:52:59 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-09 23:52:59 +08:00

model-00001-of-00006.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-09 23:52:59 +08:00

model-00002-of-00006.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-09 23:52:59 +08:00

model-00003-of-00006.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-09 23:52:59 +08:00

model-00004-of-00006.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-09 23:52:59 +08:00

model-00005-of-00006.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-09 23:52:59 +08:00

model-00006-of-00006.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-09 23:52:59 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-05-09 23:52:59 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-09 23:52:59 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-05-09 23:52:59 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-09 23:52:59 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-09 23:52:59 +08:00

tokenizer.model

初始化项目，由ModelHub XC社区提供模型

2026-05-09 23:52:59 +08:00

README.md

library_name, tags, license, language, base_model

library_name

MedMistralInstruct-CPT-SFT-7B

Model Description

MedMistralInstruct-CPT-SFT-7B is a French medical language model based on Mistral-7B-Instruct-v0.1, adapted through Continual Pre-Training followed by Supervised Fine-Tuning.

Model Details

Model Type: Causal Language Model
Base Model: Mistral-7B-Instruct-v0.1
Language: French
Domain: Medical/Healthcare
Parameters: 7 billion
License: Apache 2.0

Training Details

Continual Pre-Training (CPT)

Dataset: NACHOS corpus (7.4 GB French medical texts)
Training Duration: 2.8 epochs
Hardware: 32 NVIDIA A100 80GB GPUs
Training Time: ~40 hours

Supervised Fine-Tuning (SFT)

Dataset: 30K French medical question-answer pairs
Method: DoRA (Weight-Decomposed Low-Rank Adaptation)
Training Duration: 10 epochs
Hardware: 1 NVIDIA H100 80GB GPU
Training Time: ~42 hours

Computational Requirements

Carbon Emissions: 33.96 kgCO2e (CPT+SFT)
Training Time: 82 hours total (CPT+SFT)

Ethical Considerations

Medical Accuracy: For research and educational purposes only
Professional Oversight: Requires verification by qualified medical professionals
Bias Awareness: May contain biases from training data
Privacy: Do not input private health information

Citation

Contact

For questions about these models, please contact: ikram.belmadani@lis-lab.fr