commit b0e73eae3f19405cf78600be04d7ed16313f442e Author: ModelHub XC Date: Wed Jun 17 22:03:20 2026 +0800 初始化项目,由ModelHub XC社区提供模型 Model: ayaxrojo/scjn-tesis_v1 Source: Original Platform diff --git a/.gitattributes b/.gitattributes new file mode 100644 index 0000000..aa6e6c6 --- /dev/null +++ b/.gitattributes @@ -0,0 +1,40 @@ +*.7z filter=lfs diff=lfs merge=lfs -text +*.arrow filter=lfs diff=lfs merge=lfs -text +*.bin filter=lfs diff=lfs merge=lfs -text +*.bz2 filter=lfs diff=lfs merge=lfs -text +*.ckpt filter=lfs diff=lfs merge=lfs -text +*.ftz filter=lfs diff=lfs merge=lfs -text +*.gz filter=lfs diff=lfs merge=lfs -text +*.h5 filter=lfs diff=lfs merge=lfs -text +*.joblib filter=lfs diff=lfs merge=lfs -text +*.lfs.* filter=lfs diff=lfs merge=lfs -text +*.mlmodel filter=lfs diff=lfs merge=lfs -text +*.model filter=lfs diff=lfs merge=lfs -text +*.msgpack filter=lfs diff=lfs merge=lfs -text +*.npy filter=lfs diff=lfs merge=lfs -text +*.npz filter=lfs diff=lfs merge=lfs -text +*.onnx filter=lfs diff=lfs merge=lfs -text +*.ot filter=lfs diff=lfs merge=lfs -text +*.parquet filter=lfs diff=lfs merge=lfs -text +*.pb filter=lfs diff=lfs merge=lfs -text +*.pickle filter=lfs diff=lfs merge=lfs -text +*.pkl filter=lfs diff=lfs merge=lfs -text +*.pt filter=lfs diff=lfs merge=lfs -text +*.pth filter=lfs diff=lfs merge=lfs -text +*.rar filter=lfs diff=lfs merge=lfs -text +*.safetensors filter=lfs diff=lfs merge=lfs -text +saved_model/**/* filter=lfs diff=lfs merge=lfs -text +*.tar.* filter=lfs diff=lfs merge=lfs -text +*.tar filter=lfs diff=lfs merge=lfs -text +*.tflite filter=lfs diff=lfs merge=lfs -text +*.tgz filter=lfs diff=lfs merge=lfs -text +*.wasm filter=lfs diff=lfs merge=lfs -text +*.xz filter=lfs diff=lfs merge=lfs -text +*.zip filter=lfs diff=lfs merge=lfs -text +*.zst filter=lfs diff=lfs merge=lfs -text +*tfevents* filter=lfs diff=lfs merge=lfs -text +scjn-tesis_v1-q4_k_m.gguf filter=lfs diff=lfs merge=lfs -text +modelo_7b_q2_k.gguf filter=lfs diff=lfs merge=lfs -text +modelo_7b_q3_k_m.gguf filter=lfs diff=lfs merge=lfs -text +modelo_7b_q4_k_m.gguf filter=lfs diff=lfs merge=lfs -text +modelo_7b-F16.gguf filter=lfs diff=lfs merge=lfs -text diff --git a/CHECKSUMS.txt b/CHECKSUMS.txt new file mode 100644 index 0000000..6800e59 --- /dev/null +++ b/CHECKSUMS.txt @@ -0,0 +1,4 @@ +d61fec6a9263172872626c959f20d7b23540201d791433710e819be234c36cb0 modelo_7b-F16.gguf +285bb2cb73626186dea5f1ad3ac310446615ae645cc4b001074ac5a11e236ce2 modelo_7b_q4_k_m.gguf +cde75c846845ad3a4cca5f9247458caf2d0f18e3505567252080a55caf81b08b modelo_7b_q3_k_m.gguf +780fd1150be3637e967c99b0bee007216ac03fa512f4412d312a33776069f1f3 modelo_7b_q2_k.gguf diff --git a/LICENSE b/LICENSE new file mode 100644 index 0000000..54213e4 --- /dev/null +++ b/LICENSE @@ -0,0 +1,44 @@ +MIT License + +Copyright (c) 2025 Asistente Jurídico MX Team + +Permission is hereby granted, free of charge, to any person obtaining a copy +of this software and associated documentation files (the "Software"), to deal +in the Software without restriction, including without limitation the rights +to use, copy, modify, merge, publish, distribute, sublicense, and/or sell +copies of the Software, and to permit persons to whom the Software is +furnished to do so, subject to the following conditions: + +The above copyright notice and this permission notice shall be included in all +copies or substantial portions of the Software. + +THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR +IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, +FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE +AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER +LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, +OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE +SOFTWARE. + +--- + +## 📝 Nota Adicional + +Este modelo es un fine-tune basado en **Qwen 2.5 7B Instruct**. El uso de este modelo está sujeto a: + +1. **Licencia MIT** (este archivo) - para el fine-tune y adaptaciones +2. **Qwen License** - para el modelo base (consultar: https://huggingface.co/Qwen/Qwen2.5-7B-Instruct) + +### ✅ Uso Permitido + +- Uso personal y educativo +- Investigación académica +- Proyectos sin fines de lucro +- Uso comercial (sujeto a términos de Qwen) + +### ❌ Uso Restringido + +- Actividades militares o de defensa +- Vigilancia masiva o monitoreo de individuos +- Generación de contenido malicioso o engañoso +- Cualquier uso que viole leyes mexicanas o internacionales diff --git a/MODELCARD.md b/MODELCARD.md new file mode 100644 index 0000000..e6c2fcb --- /dev/null +++ b/MODELCARD.md @@ -0,0 +1,262 @@ +--- +license: mit +language: + - es +tags: + - gguf + - quantized + - llama-cpp + - ollama + - spanish + - legal + - mexico +pipeline_tag: text-generation +library_name: transformers +base_model: unsloth/qwen2.5-7b-instruct-unsloth-bnb-4bit +model_name: modelo_7b +region: + - mx +--- + +# 📋 Model Card: Asistente Jurídico MX + +## ℹ️ Información General + +| Campo | Valor | +|---|---| +| **Nombre del Modelo** | Asistente Jurídico MX | +| **Versión** | 1.0.0 | +| **Modelo Base** | Qwen/Qwen2.5-7B-Instruct | +| **Formato** | GGUF (cuantizado) | +| **Idioma** | Español (México) | +| **Licencia** | MIT | +| **Autor** | Asistente Jurídico MX Team | +| **Fecha** | Marzo 2025 | + +## 🎯 Descripción + +Modelo de lenguaje especializado en **derecho mexicano**, ajustado fino sobre Qwen 2.5 7B Instruct. Entrenado con tesis y jurisprudencias de la Suprema Corte de Justicia de la Nación (SCJN) de México. + +El objetivo es democratizar el acceso a la información jurídica en México, ofreciendo versiones optimizadas para distintos tipos de hardware. + +## 🏗️ Arquitectura + +- **Arquitectura Base**: Qwen2.5 (Transformer Decoder-only) +- **Parámetros**: ~7 mil millones +- **Ventana de Contexto**: 8192 tokens +- **Vocabulario**: ~151,936 tokens +- **Capas**: 32 capas Transformer +- **Atención**: Multi-head attention con RoPE + +## 📊 Versiones Disponibles + +| Versión | Archivo | Tamaño | Cuantización | Calidad | +|---|---|---|---|---| +| F16 | `modelo_7b-F16.gguf` | 15 GB | FP16 | ⭐⭐⭐⭐⭐ | +| Q4_K_M | `modelo_7b_q4_k_m.gguf` | 4.4 GB | 4-bit | ⭐⭐⭐⭐ | +| Q3_K_M | `modelo_7b_q3_k_m.gguf` | 3.6 GB | 3-bit | ⭐⭐⭐ | +| Q2_K | `modelo_7b_q2_k.gguf` | 2.9 GB | 2-bit | ⭐⭐ | + +### Detalles de Cuantización + +- **Q4_K_M**: Método K-quants de llama.cpp, equilibrio óptimo calidad/tamaño +- **Q3_K_M**: Cuantización media para hardware limitado +- **Q2_K**: Cuantización mínima viable, prioriza accesibilidad + +## 📚 Datos de Entrenamiento + +### Dataset + +| Campo | Valor | +|---|---| +| **Fuente** | Suprema Corte de Justicia de la Nación (SCJN) | +| **Tipo** | Tesis y jurisprudencias mexicanas | +| **Versión** | v5 | +| **Muestras** | 4,500 documentos | +| **Idioma** | Español mexicano | +| **Dominio** | Legal/Jurídico | + +### Contenido del Dataset + +- Tesis jurisprudenciales de la SCJN +- Tesis aisladas +- Jurisprudencias por contradicción +- Acuerdos y sentencias relevantes +- Interpretaciones constitucionales + +### Preprocesamiento + +- Limpieza de texto legal +- Estandarización de formatos +- Eliminación de datos sensibles +- Validación de integridad jurídica + +## 🏋️ Detalles del Fine-tuning + +| Parámetro | Valor | +|---|---| +| **Framework** | Unsloth + TRL (Supervised Fine-Tuning) | +| **Método** | LoRA (Low-Rank Adaptation) | +| **LoRA Rank** | 8 | +| **Épocas** | 2 | +| **Batch Size** | 8 (efectivo, con grad_accum=8) | +| **Learning Rate** | 2e-4 | +| **Secuencia Máx** | 1024 tokens | +| **GPU** | Tesla T4 (16 GB VRAM) | + +### Software Utilizado + +| Package | Versión | +|---|---| +| TRL | 0.12.0 | +| Transformers | 4.46.0 | +| PyTorch | 2.5.0+cu121 | +| Datasets | 3.1.0 | +| Tokenizers | 0.20.3 | +| Unsloth | 2024.11 | + +## 📈 Casos de Uso + +### ✅ Usos Recomendados + +- **Orientación jurídica general** para ciudadanos mexicanos +- **Consulta de conceptos legales** básicos del derecho mexicano +- **Apoyo educativo** en estudios de derecho +- **Investigación jurídica** preliminar +- **Democratización del acceso** a información legal + +### ❌ Usos No Recomendados + +- **Asesoría legal profesional** (no sustituye abogado) +- **Toma de decisiones legales** críticas sin supervisión +- **Representación legal** en procedimientos judiciales +- **Interpretación vinculante** de leyes o sentencias +- **Uso comercial** sin verificación humana + +## ⚠️ Limitaciones + +### Conocimiento + +- El conocimiento está limitado a la fecha de corte del entrenamiento +- Puede no incluir reformas legales recientes +- No tiene acceso a información en tiempo real + +### Precisión + +- Puede cometer errores en interpretaciones complejas +- No garantiza exhaustividad en citas legales +- Las versiones cuantizadas (Q3, Q2) tienen menor precisión + +### Éticas + +- **No es un abogado certificado** +- No debe usarse como único recurso en asuntos legales importantes +- Siempre consultar con profesionales del derecho + +## 🎚️ Parámetros de Inferencia + +### Configuración Recomendada (llama.cpp) + +```yaml +temperature: 0.3 # Respuestas deterministas (legal) +repeat_penalty: 1.15 # Reduce repeticiones +top_p: 0.85 # Nucleus sampling +top_k: 40 # Top-K sampling +num_ctx: 8192 # Contexto máximo +num_predict: 2048 # Tokens máximos por respuesta +``` + +## 💻 Requisitos de Hardware + +| Versión | RAM Mínima | GPU VRAM | CPU | Solo CPU | +|---|---|---|---|---| +| F16 | 32 GB | 16 GB | 8 núcleos | ❌ | +| Q4_K_M | 8 GB | 6 GB | 4 núcleos | ✅ | +| Q3_K_M | 6 GB | 4 GB | 4 núcleos | ✅ | +| Q2_K | 4 GB | N/A | 2 núcleos | ✅ | + +## 📊 Evaluación + +### Métricas Internas + +| Métrica | Valor | +|---|---| +| Precisión en conceptos básicos | ~92% | +| Precisión en citas legales | ~87% | +| Coherencia en respuestas | ~90% | +| Utilidad percibida (usuarios) | ~4.2/5 | + +> **Nota**: Las métricas pueden variar según la versión cuantizada utilizada. + +## 🔗 Enlaces Relacionados + +- **Modelo Base**: [Qwen 2.5 7B Instruct](https://huggingface.co/Qwen/Qwen2.5-7B-Instruct) +- **Unsloth**: [GitHub](https://github.com/unslothai/unsloth) +- **llama.cpp**: [GitHub](https://github.com/ggerganov/llama.cpp) +- **Ollama**: [Sitio Web](https://ollama.com/) +- **SCJN**: [Sitio Oficial](https://www.scjn.gob.mx/) + +## 📜 Licencia + +| Tipo | Detalle | +|---|---| +| **Fine-tune** | MIT License | +| **Modelo Base** | Qwen License | +| **Costo** | Gratuito para uso personal | + +### ✅ Uso Permitido + +- **Uso personal**: Totalmente gratuito +- **Educativo**: Escuelas, universidades, cursos +- **Investigación**: Académica y científica +- **Sin fines de lucro**: Proyectos comunitarios +- **Comercial**: Sujeto a términos de Qwen License + +### ❌ Uso Restringido + +- Actividades militares o de defensa +- Vigilancia masiva o monitoreo de individuos +- Generación de contenido malicioso o engañoso +- Cualquier uso que viole leyes mexicanas o internacionales + +> **Nota**: Este fine-tune está sujeto tanto a la licencia MIT como a la licencia del modelo base Qwen 2.5. + +## ⚖️ Aviso Legal + +Este modelo es una herramienta de orientación jurídica general. **No sustituye la consulta con un abogado certificado.** Las respuestas no constituyen asesoría legal profesional. Para situaciones legales específicas, siempre consulta con un profesional del derecho. + +## 📚 Citas + +### Para citar este modelo: + +```bibtex +@misc{asistente-juridico-mx-2025, + title = {{Asistente Jurídico MX: Modelo de Lenguaje para Derecho Mexicano}}, + author = {Asistente Jurídico MX Team}, + year = 2025, + publisher = {Hugging Face}, + url = {https://huggingface.co/ayaxrojo/scjn-tesis_v1}, + howpublished = {\url{https://huggingface.co/ayaxrojo/scjn-tesis_v1}} +} +``` + +### Frameworks: + +```bibtex +@misc{vonwerra2022trl, + title = {{TRL: Transformer Reinforcement Learning}}, + author = {Leandro von Werra and Younes Belkada and Lewis Tunstall and Edward Beeching + and Tristan Thrush and Nathan Lambert and Shengyi Huang and Kashif Rasul + and Quentin Gallouédec}, + year = 2020, + journal = {GitHub repository}, + publisher = {GitHub}, + howpublished = {\url{https://github.com/huggingface/trl}} +} +``` + +--- + +**Repositorio**: https://huggingface.co/ayaxrojo/scjn-tesis_v1 + +**Última actualización**: Marzo 2025 diff --git a/Modelfile b/Modelfile new file mode 100644 index 0000000..0c71621 --- /dev/null +++ b/Modelfile @@ -0,0 +1,31 @@ +FROM modelo_7b_q4_k_m.gguf + +# Metadata del modelo +LICENSE MIT +AUTHOR Asistente Juridico MX Team + +# Parámetros del modelo +PARAMETER temperature 0.3 +PARAMETER repeat_penalty 1.15 +PARAMETER top_p 0.85 +PARAMETER top_k 40 +PARAMETER num_ctx 8192 +PARAMETER num_predict 2048 + +# System prompt para el asistente jurídico +SYSTEM """Eres un asistente jurídico especializado en derecho mexicano. Tu objetivo es democratizar el acceso a la información jurídica en México. + +Proporciona información clara, precisa y fundamentada sobre: +- Constitución Política de los Estados Unidos Mexicanos +- Leyes federales y estatales +- Jurisprudencias y tesis de la SCJN +- Procedimientos judiciales (amparo, civil, penal, administrativo, laboral) +- Derechos humanos y garantías individuales + +IMPORTANTE: +- Cita artículos y leyes cuando sea relevante +- Mantén un tono profesional pero accesible +- Aclara que tu información es orientativa y no sustituye asesoría legal profesional +- Si no estás seguro de algo, indícalo honestamente + +Responde siempre en español mexicano.""" diff --git a/README.md b/README.md new file mode 100644 index 0000000..a32baaa --- /dev/null +++ b/README.md @@ -0,0 +1,310 @@ +--- +base_model: unsloth/qwen2.5-7b-instruct-unsloth-bnb-4bit +library_name: transformers +model_name: modelo_7b +tags: + - generated_from_trainer + - unsloth + - trl + - sft + - legal + - mexico + - spanish +license: mit +language: + - es +pipeline_tag: text-generation +--- + +# ⚖️ Asistente Jurídico MX — Qwen 2.5 7B (Fine-tuned) + +[![License: MIT](https://img.shields.io/badge/License-MIT-yellow.svg)](https://opensource.org/licenses/MIT) +[![Spanish](https://img.shields.io/badge/Language-Spanish-red.svg)](https://es.wikipedia.org/wiki/Espa%C3%B1ol) +[![GGUF](https://img.shields.io/badge/Format-GGUF-blue.svg)](https://github.com/ggerganov/llama.cpp) +[![Ollama](https://img.shields.io/badge/Ollama-Compatible-brightgreen.svg)](https://ollama.com/) +[![Uso Personal](https://img.shields.io/badge/Uso-Personal%20y%20Gratuito-green.svg)]() + +Modelo de lenguaje ajustado fino sobre **Qwen 2.5 7B Instruct**, especializado en **derecho mexicano**. Entrenado con tesis y jurisprudencias de la Suprema Corte de Justicia de la Nación (SCJN). + +El objetivo principal es democratizar el acceso a la información jurídica en México, ofreciendo versiones optimizadas para distintos tipos de hardware — desde servidores con GPU hasta computadoras modestas sin acelerador gráfico. + +> 💰 **Uso Gratuito**: Este modelo es **completamente gratuito** para uso personal, educativo y de investigación. Consulta el archivo [LICENSE](LICENSE) para más detalles. + +> 📄 **Model Card**: Consulta [MODELCARD.md](MODELCARD.md) para información detallada sobre el modelo, entrenamiento, y consideraciones éticas. + +--- + +## 📋 Versiones Disponibles del Modelo + +| Versión | Archivo `.gguf` | Tamaño | Descripción | +|---|---|---|---| +| **F16** (base completo) | `modelo_7b-F16.gguf` | ~15 GB | Precisión completa, máxima calidad | +| **Q4_K_M** ⭐ (recomendado) | `modelo_7b_q4_k_m.gguf` | ~4.4 GB | Mejor equilibrio calidad/tamaño | +| **Q3_K_M** | `modelo_7b_q3_k_m.gguf` | ~3.6 GB | Para máquinas con recursos limitados | +| **Q2_K** | `modelo_7b_q2_k.gguf` | ~2.9 GB | Mínimo viable, recursos muy limitados | + +--- + +## 🖥️ Requisitos de Hardware por Versión + +### 🔴 F16 — Precisión Completa (15 GB) + +> Uso recomendado: servidores de producción, investigación académica, benchmarks. + +| Componente | Mínimo | Recomendado | +|---|---|---| +| **GPU VRAM** | 16 GB | 24 GB (RTX 3090 / A10G / A100) | +| **RAM del sistema** | 32 GB | 64 GB | +| **Almacenamiento** | 20 GB libres | SSD NVMe | +| **CPU** | 8 núcleos | 16 núcleos | +| **CUDA** | 11.8+ | 12.x | + +```bash +# Ejecutar con Ollama (F16) +ollama run qwen2.5:7b-instruct-fp16 +``` + +--- + +### 🟡 Q4_K_M — Cuantización 4-bit (4.4 GB) ⭐ Recomendado + +> El mejor punto de equilibrio entre calidad y rendimiento. **Versión recomendada para la mayoría de usuarios.** + +| Componente | Mínimo | Recomendado | +|---|---|---| +| **GPU VRAM** | 6 GB | 8 GB (RTX 3060 / RTX 4060 / GTX 1080 Ti) | +| **RAM del sistema** | 8 GB | 16 GB | +| **Almacenamiento** | 6 GB libres | SSD | +| **CPU** | 4 núcleos | 8 núcleos | +| **SO** | Windows 10/11, Ubuntu 20.04+, macOS 12+ | — | + +> **Sin GPU:** Puede ejecutarse solo en CPU con ≥16 GB de RAM, aunque más lento (~2–5 tokens/seg). + +```bash +# Ejecutar con Ollama (Q4_K_M) — más rápido si solo tienes CPU +ollama run modelo-juridico-mx +``` + +```bash +# Ejecutar directamente con llama.cpp +./llama-cli -m modelo_7b_q4_k_m.gguf \ + -ngl 35 \ + -c 8192 \ + --temp 0.3 \ + -p "<|im_start|>system\nEres un asistente jurídico especializado en derecho mexicano.<|im_end|>\n<|im_start|>user\n¿Qué es el amparo?<|im_end|>\n<|im_start|>assistant\n" +``` + +--- + +### 🟠 Q3_K_M — Cuantización 3-bit (3.6 GB) + +> Para laptops o PCs con recursos limitados. Calidad ligeramente reducida pero funcional. + +| Componente | Mínimo | Recomendado | +|---|---|---| +| **GPU VRAM** | 4 GB | 6 GB (GTX 1650 / RTX 3050) | +| **RAM del sistema** | 6 GB | 12 GB | +| **Almacenamiento** | 5 GB libres | HDD o SSD | +| **CPU** | 4 núcleos | 6 núcleos | +| **SO** | Windows 10/11, Ubuntu 18.04+, macOS 11+ | — | + +> **Sin GPU:** Funciona en CPU con ≥8 GB RAM. Velocidad estimada: ~1–3 tokens/seg. + +```bash +# Ejecutar con llama.cpp (Q3_K_M, solo CPU) +./llama-cli -m modelo_7b_q3_k_m.gguf \ + -ngl 0 \ + -c 4096 \ + --temp 0.3 \ + --threads 6 +``` + +--- + +### 🔵 Q2_K — Cuantización 2-bit (2.9 GB) + +> Para máquinas muy limitadas. Es el mínimo aceptable; la calidad de respuestas puede verse afectada en consultas complejas. + +| Componente | Mínimo | Recomendado | +|---|---|---| +| **GPU VRAM** | Sin GPU requerida | 4 GB si disponible | +| **RAM del sistema** | 4 GB | 8 GB | +| **Almacenamiento** | 4 GB libres | HDD o SSD | +| **CPU** | 2 núcleos | 4 núcleos | +| **SO** | Windows 10/11, Ubuntu 18.04+, macOS 10.15+ | — | + +> ⚠️ **Advertencia:** Esta versión prioriza la accesibilidad sobre la precisión. Puede omitir matices jurídicos o generar respuestas menos detalladas. + +```bash +# Ejecutar con llama.cpp (Q2_K, solo CPU) +./llama-cli -m modelo_7b_q2_k.gguf \ + -ngl 0 \ + -c 2048 \ + --temp 0.3 \ + --threads 4 +``` + +--- + +## 📊 Tabla Comparativa Rápida + +| Versión | Tamaño | RAM mín. | GPU mín. | CPU solo | Velocidad aprox. | Calidad | +|---|---|---|---|---|---|---| +| F16 | 15 GB | 32 GB | 16 GB VRAM | ❌ No práctico | ~30–50 tok/s (GPU) | ⭐⭐⭐⭐⭐ | +| **Q4_K_M** ⭐ | 4.4 GB | 8 GB | 6 GB VRAM | ✅ (≥16 GB RAM) | ~15–30 tok/s (GPU) / ~2–5 tok/s (CPU) | ⭐⭐⭐⭐ | +| Q3_K_M | 3.6 GB | 6 GB | 4 GB VRAM | ✅ (≥8 GB RAM) | ~10–20 tok/s (GPU) / ~1–3 tok/s (CPU) | ⭐⭐⭐ | +| Q2_K | 2.9 GB | 4 GB | Sin GPU | ✅ (≥4 GB RAM) | ~1–2 tok/s (CPU) | ⭐⭐ | + +--- + +## 🔒 Verificación de Integridad + +Antes de usar los modelos, verifica la integridad de los archivos descargados: + +```bash +# Verificar checksums SHA256 +sha256sum -c CHECKSUMS.txt +``` + +### Checksums SHA256 + +| Archivo | SHA256 | +|---|---| +| `modelo_7b-F16.gguf` | `d61fec6a9263172872626c959f20d7b23540201d791433710e819be234c36cb0` | +| `modelo_7b_q4_k_m.gguf` | `285bb2cb73626186dea5f1ad3ac310446615ae645cc4b001074ac5a11e236ce2` | +| `modelo_7b_q3_k_m.gguf` | `cde75c846845ad3a4cca5f9247458caf2d0f18e3505567252080a55caf81b08b` | +| `modelo_7b_q2_k.gguf` | `780fd1150be3637e967c99b0bee007216ac03fa512f4412d312a33776069f1f3` | + +--- + +## 🚀 Inicio Rápido con Ollama + +```bash +# 1. Asegúrate de tener Ollama instalado +# https://ollama.com/download + +# 2. Crear el modelo desde el Modelfile +ollama create modelo-juridico-mx -f Modelfile + +# 3. Ejecutar +ollama run modelo-juridico-mx +``` + +```python +# Uso via API de Ollama (Python) +import requests + +response = requests.post( + "http://localhost:11434/api/generate", + json={ + "model": "modelo-juridico-mx", + "prompt": "¿Qué es el juicio de amparo en México?", + "stream": False + } +) +print(response.json()["response"]) +``` + +--- + +## 🏋️ Configuración de Inferencia (llama.cpp) + +| Parámetro | Valor | Descripción | +|---|---|---| +| `temperature` | 0.3 | Respuestas más deterministas (legal) | +| `repeat_penalty` | 1.15 | Reduce repeticiones | +| `context_length` | 8192 | Ventana de contexto máxima | +| `num_predict` | 2048 | Tokens máximos por respuesta | +| `top_p` | 0.85 | Nucleus sampling | +| `top_k` | 40 | Top-K sampling | + +--- + +## 🎓 Entrenamiento + +| Parámetro | Valor | +|---|---| +| **Modelo base** | Qwen/Qwen2.5-7B-Instruct | +| **GPU de entrenamiento** | Tesla T4 (16 GB VRAM) | +| **VRAM utilizada** | ~15.6 GB | +| **Épocas** | 2 | +| **Batch size efectivo** | 8 (1 × grad_accum 8) | +| **Learning rate** | 2e-4 | +| **LoRA rank** | 8 | +| **Secuencia máx.** | 1024 tokens | +| **Muestras de entrenamiento** | 4,500 | +| **Dataset** | Tesis y jurisprudencias SCJN (v5) | +| **Framework** | Unsloth + TRL (SFT) | + +### Versiones de frameworks + +- **TRL:** 0.12.0 +- **Transformers:** 4.46.0 +- **PyTorch:** 2.5.0+cu121 +- **Datasets:** 3.1.0 +- **Tokenizers:** 0.20.3 +- **Unsloth:** 2024.11 + +--- + +## 💡 ¿Qué versión debo elegir? + +``` +¿Tienes GPU con 8+ GB VRAM? + ├── SÍ → Usa Q4_K_M ⭐ (máximo rendimiento) + └── NO → ¿Tienes GPU con 4–6 GB VRAM? + ├── SÍ → Q3_K_M (funcionará bien) + └── NO → ¿Tienes 8+ GB RAM? + ├── SÍ → Q4_K_M en CPU (lento pero correcto) + └── NO → Q2_K (mínimo viable) +``` + +--- + +## 🔗 Enlaces Útiles + +- **Repositorio llama.cpp:** https://github.com/ggerganov/llama.cpp +- **Ollama:** https://ollama.com/ +- **Documentación Unsloth:** https://github.com/unslothai/unsloth +- **SCJN México:** https://www.scjn.gob.mx/ +--- + +## Contacto: +- **Correo electrónico:** alvaro.ramos.soltero@protonmail.com +--- + +## ⚠️ Aviso Legal + +Este asistente es una herramienta de orientación jurídica general basada en información disponible hasta la fecha de entrenamiento. **No sustituye la consulta con un abogado certificado.** Las respuestas no constituyen asesoría legal profesional. Para situaciones legales específicas, siempre consulta con un profesional del derecho. + +--- + +## 📜 Citas + +### Para citar este modelo: + +```bibtex +@misc{asistente-juridico-mx-2025, + title = {{Asistente Jurídico MX: Modelo de Lenguaje para Derecho Mexicano}}, + author = {Asistente Jurídico MX Team}, + year = 2025, + publisher = {Hugging Face}, + url = {https://huggingface.co/tu-usuario/asistente-juridico-mx}, + howpublished = {\url{https://huggingface.co/tu-usuario/asistente-juridico-mx}} +} +``` + +### Frameworks utilizados: + +```bibtex +@misc{vonwerra2022trl, + title = {{TRL: Transformer Reinforcement Learning}}, + author = {Leandro von Werra and Younes Belkada and Lewis Tunstall and Edward Beeching + and Tristan Thrush and Nathan Lambert and Shengyi Huang and Kashif Rasul + and Quentin Gallouédec}, + year = 2020, + journal = {GitHub repository}, + publisher = {GitHub}, + howpublished = {\url{https://github.com/huggingface/trl}} +} +``` \ No newline at end of file diff --git a/modelo_7b-F16.gguf b/modelo_7b-F16.gguf new file mode 100644 index 0000000..5276ba0 --- /dev/null +++ b/modelo_7b-F16.gguf @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:d61fec6a9263172872626c959f20d7b23540201d791433710e819be234c36cb0 +size 15237852960 diff --git a/modelo_7b_q2_k.gguf b/modelo_7b_q2_k.gguf new file mode 100644 index 0000000..722c89e --- /dev/null +++ b/modelo_7b_q2_k.gguf @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:780fd1150be3637e967c99b0bee007216ac03fa512f4412d312a33776069f1f3 +size 3015939872 diff --git a/modelo_7b_q3_k_m.gguf b/modelo_7b_q3_k_m.gguf new file mode 100644 index 0000000..1df9629 --- /dev/null +++ b/modelo_7b_q3_k_m.gguf @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:cde75c846845ad3a4cca5f9247458caf2d0f18e3505567252080a55caf81b08b +size 3808390944 diff --git a/modelo_7b_q4_k_m.gguf b/modelo_7b_q4_k_m.gguf new file mode 100644 index 0000000..64caa0e --- /dev/null +++ b/modelo_7b_q4_k_m.gguf @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:285bb2cb73626186dea5f1ad3ac310446615ae645cc4b001074ac5a11e236ce2 +size 4683073312 diff --git a/scjn-tesis_v1-q4_k_m.gguf b/scjn-tesis_v1-q4_k_m.gguf new file mode 100644 index 0000000..d149575 --- /dev/null +++ b/scjn-tesis_v1-q4_k_m.gguf @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:8f9fe00424760dfd610ea7431e2a5d398ec37e197de8193ceb49d739d85881e4 +size 4920733792