Go to file

ModelHub XC 76d3bebabb 初始化项目，由ModelHub XC社区提供模型

Model: cross-encoder/quora-roberta-large
Source: Original Platform

2026-05-13 17:04:38 +08:00

onnx

初始化项目，由ModelHub XC社区提供模型

2026-05-13 17:04:38 +08:00

openvino

初始化项目，由ModelHub XC社区提供模型

2026-05-13 17:04:38 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-13 17:04:38 +08:00

CEBinaryClassificationEvaluator_Quora-dev_results.csv

初始化项目，由ModelHub XC社区提供模型

2026-05-13 17:04:38 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 17:04:38 +08:00

flax_model.msgpack

初始化项目，由ModelHub XC社区提供模型

2026-05-13 17:04:38 +08:00

merges.txt

初始化项目，由ModelHub XC社区提供模型

2026-05-13 17:04:38 +08:00

model.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-13 17:04:38 +08:00

pytorch_model.bin

初始化项目，由ModelHub XC社区提供模型

2026-05-13 17:04:38 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-13 17:04:38 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 17:04:38 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 17:04:38 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 17:04:38 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 17:04:38 +08:00

README.md

license, datasets, language, base_model, pipeline_tag, library_name, tags

license

datasets

language

base_model

pipeline_tag

library_name

Cross-Encoder for Quora Duplicate Questions Detection

This model was trained using SentenceTransformers Cross-Encoder class.

Training Data

This model was trained on the Quora Duplicate Questions dataset. The model will predict a score between 0 and 1 how likely the two given questions are duplicates.

Note: The model is not suitable to estimate the similarity of questions, e.g. the two questions "How to learn Java" and "How to learn Python" will result in a rather low score, as these are not duplicates.

Usage and Performance

Pre-trained models can be used like this:

from sentence_transformers import CrossEncoder

model = CrossEncoder('cross-encoder/quora-roberta-large')
scores = model.predict([('Question 1', 'Question 2'), ('Question 3', 'Question 4')])

You can use this model also without sentence_transformers and by just using Transformers AutoModel class