Files
2025-10-09 16:47:16 +08:00

1.7 KiB

토크나이저를 위한 유틸리티 utilities-for-tokenizers

이 페이지는 토크나이저에서 사용되는 모든 유틸리티 함수들을 나열하며, 주로 [PreTrainedTokenizer]와 [PreTrainedTokenizerFast] 사이의 공통 메소드를 구현하는 [~tokenization_utils_base.PreTrainedTokenizerBase] 클래스와 [~tokenization_utils_base.SpecialTokensMixin]을 다룹니다.

이 함수들 대부분은 라이브러리의 토크나이저 코드를 연구할 때만 유용합니다.

PreTrainedTokenizerBase transformers.PreTrainedTokenizerBase

autodoc tokenization_utils_base.PreTrainedTokenizerBase

  • call
  • all

SpecialTokensMixin transformers.SpecialTokensMixin

autodoc tokenization_utils_base.SpecialTokensMixin

Enums 및 namedtuples transformers.tokenization_utils_base.TruncationStrategy

autodoc tokenization_utils_base.TruncationStrategy

autodoc tokenization_utils_base.CharSpan

autodoc tokenization_utils_base.TokenSpan