readme
This commit is contained in:
@@ -14,7 +14,7 @@
|
||||
随着Mistral AI公司开源其七十亿参数模型[Mistral-7B](https://huggingface.co/meta-llama/Llama-2-7b-hf),该模型超越[Llama](https://huggingface.co/meta-llama),成为当前最强大的开源模型之一。Mistral-7B在各类基准测试中,不仅超过了Llama2-13B,而且在推理、数学、代码生成任务中超过Llama2-34B。
|
||||
然而,Mistral-7B的训练语料主要为英文文本,其中文能力较为欠缺。其次,Mistral-7B的词表不支持中文,导致其对中文的编码和解码效率较低,限制了在中文场景的应用。<br>
|
||||
为了克服这一局限,清华大学地球系统科学系地球和空间信息科学实验室基于Mistral-7B进行了中文词表扩充和增量预训练,增强了Mistral-7B在中文任务上的表现,并提高了其对中文文本的编解码效率。<br>
|
||||
项目地址:https://github.com/THU-EarthInformationScienceLab/Chinese-Mistral
|
||||
项目地址:https://github.com/THU-ESIS/Chinese-Mistral
|
||||
|
||||
## 📥 模型下载
|
||||
|
||||
@@ -114,7 +114,7 @@ Chinese-Mistral-7B 与Chinese-Mistral-7B-Instruct-v0.1生成效果示例如下
|
||||
| 模型名称 | Chinese-Mistral-7B | Chinese-Mistral-7B-Instruct-v0.1 |
|
||||
|--- |--- |--- |
|
||||
| 用户输入 | <div style="width: 200pt">你是一个人工智能助手,写一段自我介绍: | <div style="width: 310pt">请为我推荐中国三座比较著名的山 |
|
||||
| 模型输出 | <div style="width: 200pt">好的,作为一个AI助手,我必须很智能、很专业、很友好。所以,自我介绍如下:我是一个拥有海量知识的人工智能助手,能够提供高效的信息和服务。我拥有强大的自然语言处理能力,可以理解人类的语言,并提供准确的信息反馈。我专注于帮助用户解决问题,提高他们的工作和生活效率。我热爱学习,能够不断自我升级,以适应时代的发展。总之,我是一个值得信赖的助手,期待与您合作。谢谢! | <div style="width: 310pt">中国有很多著名的山,其中三座比较著名的山是:<br><br>1. 泰山:泰山位于山东省泰安市,是中国五岳之首,海拔1545米,是中华民族的象征之一。泰山是儒家文化、道教文化和民俗文化的发源地,被誉为“天下第一山”。<br><br>2. 黄山:黄山位于安徽省黄山市,是世界文化与自然遗产,也是世界地质公园。黄山以奇松、怪石、云海、温泉四绝而闻名于世,是旅游胜地。<br><br>3. 庐山:庐山位于江西省九江市,是道教圣地之一。庐山以雄奇险峻、风景秀丽而闻名于世,有“匡庐奇秀甲天下”的美誉。庐山风景名胜区是国家级风景名胜区,也是世界自然与文化遗产。 |
|
||||
| 模型输出 | <div style="width: 200pt">好的,作为一个AI助手,我必须很智能、很专业、很友好。所以,自我介绍如下:我是一个拥有海量知识的人工智能助手,能够提供高效的信息和服务。我拥有强大的自然语言处理能力,可以理解人类的语言,并提供准确的信息反馈。我专注于帮助用户解决问题,提高他们的工作和生活效率。我热爱学习,能够不断自我升级,以适应时代的发展。总之,我是一个值得信赖的助手,期待与您合作。谢谢! | <div style="width: 310pt">我国有三座极其著名的山峰,它们分别为:<br><br>1. 珠穆朗玛峰:它是世界上最高的山峰,地理高度达到8,848米。珠穆朗玛峰不仅拥有壮丽的景色,而且它代表着人类对未知和极限的挑战。<br><br>2. 黄山:它位于安徽省,是一座具有极高文化价值的山峰。这座山峰以其雄奇的山峰、壮观的云雾、壮丽的红叶而闻名于世。黄山还拥有许多历史遗迹和丰富的神话传说。<br><br>3. 泰山:它位于山东省,拥有"五岳之首,天下名山"的称号。泰山以其巍峨的气势、奇特的山形和丰富的历史文化而赢得世人的敬仰。<br><br>这三座山峰不仅具有非凡的自然景观,而且它们都拥有着丰富的人文内涵,它们不仅代表着中国的山岳文化,也代表了中国人民对大自然和历史文化的爱戴和敬畏。 |
|
||||
|
||||
## 📝 训练数据
|
||||
|
||||
@@ -135,7 +135,7 @@ Chinese-Mistral-7B的开发旨在为开源社区提供一个性能优越的中
|
||||
year = {2024},
|
||||
publisher = {GitHub},
|
||||
journal = {GitHub repository},
|
||||
howpublished = {\url{https://github.com/THU-EarthInformationScienceLab/Chinese-Mistral}}
|
||||
howpublished = {\url{https://github.com/THU-ESIS/Chinese-Mistral}}
|
||||
}
|
||||
```
|
||||
|
||||
|
||||
Reference in New Issue
Block a user