Transformers documentation

Trainer

Transformers

You are viewing main version, which requires installation from source. If you'd like regular pip install, checkout the latest stable version (v5.0.0).

Join the Hugging Face community

and get access to the augmented documentation experience

Collaborate on models, datasets and Spaces

Faster examples with accelerated inference

Switch between documentation themes

to get started

Trainer

Trainer 클래스는 PyTorch에서 완전한 기능(feature-complete)의 훈련을 위한 API를 제공하며, 다중 GPU/TPU에서의 분산 훈련, NVIDIA GPU, AMD GPU를 위한 혼합 정밀도, 그리고 PyTorch의 torch.amp를 지원합니다. Trainer는 모델의 훈련 방식을 커스터마이즈할 수 있는 다양한 옵션을 제공하는 TrainingArguments 클래스와 함께 사용됩니다. 이 두 클래스는 함께 완전한 훈련 API를 제공합니다.

Seq2SeqTrainer와 Seq2SeqTrainingArguments는 Trainer와 TrainingArguments 클래스를 상속하며, 요약이나 번역과 같은 시퀀스-투-시퀀스 작업을 위한 모델 훈련에 적합하게 조정되어 있습니다.

Trainer 클래스는 🤗 Transformers 모델에 최적화되어 있으며, 다른 모델과 함께 사용될 때 예상치 못한 동작을 하게 될 수 있습니다. 자신만의 모델을 사용할 때는 다음을 확인하세요:

모델은 항상 튜플이나 ModelOutput의 서브클래스를 반환해야 합니다.

모델은 labels 인자가 제공되면 손실을 계산할 수 있고, 모델이 튜플을 반환하는 경우 그 손실이 튜플의 첫 번째 요소로 반환되어야 합니다.

모델은 여러 개의 레이블 인자를 수용할 수 있어야 하며, Trainer에게 이름을 알리기 위해 TrainingArguments에서 label_names를 사용하지만, 그 중 어느 것도 "label"로 명명되어서는 안 됩니다.

Transformers

Trainer

Trainer

class transformers.Trainer

add_callback

autocast_smart_context_manager

compute_loss

compute_loss_context_manager

create_model_card

create_optimizer

create_optimizer_and_scheduler

create_scheduler

evaluate

evaluation_loop

floating_point_ops

get_batch_samples

get_cp_size

get_decay_parameter_names

get_eval_dataloader

get_learning_rates

get_num_trainable_parameters

get_optimizer_cls_and_kwargs

get_optimizer_group

get_sp_size

get_test_dataloader

get_total_train_batch_size

get_tp_size

get_train_dataloader

hyperparameter_search

init_hf_repo

is_local_process_zero

is_world_process_zero

log

log_metrics

metrics_format

num_examples

num_tokens

pop_callback

predict

prediction_step

propagate_args_to_deepspeed

push_to_hub

remove_callback

save_metrics

save_model

save_state

set_initial_training_values

train

training_step

Seq2SeqTrainer

class transformers.Seq2SeqTrainer

evaluate

predict

TrainingArguments

class transformers.TrainingArguments

get_process_log_level

get_warmup_steps

main_process_first

set_dataloader

set_evaluate

set_logging

set_lr_scheduler

set_optimizer

set_push_to_hub

set_save

set_testing

set_training

to_dict

to_json_string

to_sanitized_dict

Seq2SeqTrainingArguments

class transformers.Seq2SeqTrainingArguments

to_dict