This commit is contained in:
itpossible
2024-04-06 07:19:34 +00:00
parent c4c93eab92
commit 9dd05bfce3

View File

@@ -14,7 +14,7 @@
随着Mistral AI公司开源其七十亿参数模型[Mistral-7B](https://huggingface.co/meta-llama/Llama-2-7b-hf),该模型超越[Llama](https://huggingface.co/meta-llama)成为当前最强大的开源模型之一。Mistral-7B在各类基准测试中不仅超过了Llama2-13B而且在推理、数学、代码生成任务中超过Llama2-34B。
然而Mistral-7B的训练语料主要为英文文本其中文能力较为欠缺。其次Mistral-7B的词表不支持中文导致其对中文的编码和解码效率较低限制了在中文场景的应用。<br>
为了克服这一局限清华大学地球系统科学系地球和空间信息科学实验室基于Mistral-7B进行了中文词表扩充和增量预训练增强了Mistral-7B在中文任务上的表现并提高了其对中文文本的编解码效率。<br>
项目地址https://github.com/THU-EarthInformationScienceLab/Chinese-Mistral
项目地址https://github.com/THU-ESIS/Chinese-Mistral
## 📥 模型下载
@@ -114,7 +114,7 @@ Chinese-Mistral-7B 与Chinese-Mistral-7B-Instruct-v0.1生成效果示例如下
| 模型名称 | Chinese-Mistral-7B | Chinese-Mistral-7B-Instruct-v0.1 |
|--- |--- |--- |
| 用户输入 | <div style="width: 200pt">你是一个人工智能助手,写一段自我介绍: | <div style="width: 310pt">请为我推荐中国三座比较著名的山 |
| 模型输出 | <div style="width: 200pt">好的作为一个AI助手我必须很智能、很专业、很友好。所以自我介绍如下我是一个拥有海量知识的人工智能助手能够提供高效的信息和服务。我拥有强大的自然语言处理能力可以理解人类的语言并提供准确的信息反馈。我专注于帮助用户解决问题提高他们的工作和生活效率。我热爱学习能够不断自我升级以适应时代的发展。总之我是一个值得信赖的助手期待与您合作。谢谢 | <div style="width: 310pt">国有很多著名的山,其中三座比较著名的山是<br><br>1. 泰山泰山位于山东省泰安市是中国五岳之首海拔1545米是中华民族的象征之一。泰山是儒家文化、道教文化和民俗文化的发源地被誉为“天下第一山”<br><br>2. 黄山:黄山位于安徽省黄山市,是世界文化与自然遗产,也是世界地质公园。黄山以奇松、怪石、云海、温泉四绝而闻名于世,是旅游胜地<br><br>3. 山:庐山位于江西省九江市,是道教圣地之一。庐山以雄奇险峻、风景秀丽而闻名于世,有“匡庐奇秀甲天下”的美誉。庐山风景名胜区是国家级风景名胜区,也是世界自然与文化遗产。 |
| 模型输出 | <div style="width: 200pt">好的作为一个AI助手我必须很智能、很专业、很友好。所以自我介绍如下我是一个拥有海量知识的人工智能助手能够提供高效的信息和服务。我拥有强大的自然语言处理能力可以理解人类的语言并提供准确的信息反馈。我专注于帮助用户解决问题提高他们的工作和生活效率。我热爱学习能够不断自我升级以适应时代的发展。总之我是一个值得信赖的助手期待与您合作。谢谢 | <div style="width: 310pt">国有三座极其著名的山峰,它们分别为<br><br>1. 珠穆朗玛峰它是世界上最高的山峰地理高度达到8,848米。珠穆朗玛峰不仅拥有壮丽的景色而且它代表着人类对未知和极限的挑战<br><br>2. 黄山:位于安徽省,是一座具有极高文化价值的山峰。这座山峰以其雄奇的山峰、壮观的云雾、壮丽的红叶而闻名于世。黄山还拥有许多历史遗迹和丰富的神话传说<br><br>3. 山:它位于山东省,拥有"五岳之首,天下名山"的称号。泰山以其巍峨的气势、奇特的山形和丰富的历史文化而赢得世人的敬仰。<br><br>这三座山峰不仅具有非凡的自然景观,而且它们都拥有着丰富的人文内涵,它们不仅代表着中国的山岳文化,也代表了中国人民对大自然和历史文化的爱戴和敬畏。 |
## 📝 训练数据
@@ -135,7 +135,7 @@ Chinese-Mistral-7B的开发旨在为开源社区提供一个性能优越的中
year = {2024},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/THU-EarthInformationScienceLab/Chinese-Mistral}}
howpublished = {\url{https://github.com/THU-ESIS/Chinese-Mistral}}
}
```