Add `loss_agg_mode` for kl and entropy_loss #388

pan-x-c · 2025-11-17T05:35:33Z

Description

Align with verl 0.5.0

Add loss_agg_mode for kl and entropy_loss
Update PPOPolicyLoss
Add 'low_var_kl'
Update masked_sum

Checklist

Please check the following items before code is ready to be reviewed.

Code has passed all tests
Docstrings have been added/updated in Google Style
Documentation has been updated
Code is ready for review

gemini-code-assist · 2025-11-17T05:35:59Z

Summary of Changes

Hello @pan-x-c, I'm Gemini Code Assist¹! I'm currently reviewing this pull request and will post my feedback shortly. In the meantime, here's a summary to help you and other reviewers quickly get up to speed!

This pull request significantly improves the robustness and configurability of loss calculations within the trinity framework. By introducing a flexible loss aggregation mode for KL and entropy losses, adding a new low-variance KL divergence function, and refining the PPO policy loss with additional clipping controls, the changes enable more stable and adaptable training of reinforcement learning algorithms. The refactoring of the masked_loss utility to aggregate_loss also promotes code consistency and maintainability.

Highlights

Configurable Loss Aggregation Mode: Introduced a loss_agg_mode parameter for KL and entropy loss calculations, allowing users to specify different aggregation strategies such as 'token-mean', 'seq-mean-token-sum', 'seq-mean-token-mean', or 'seq-mean-token-sum-norm'. This enhances flexibility in how losses are computed across various policy functions.
New Low Variance KL Function: Added a new KL divergence function, LowVarKLFn, which includes clamping for KL values to improve numerical stability and prevent extreme values during training.
Refactoring Loss Utility Function: The masked_loss utility function has been renamed to aggregate_loss and is now consistently used across all relevant policy loss functions (e.g., Chord, CISPO, GSPO, Mix, OPMD, PPO, SFT, SPPO, TOPR) for unified loss aggregation.
PPO Loss Function Enhancements: The PPO policy loss function (PPOPolicyLossFn) now incorporates a clip_ratio_c parameter and calculates an additional pg_clipfrac_lower metric, providing more granular control and insight into the clipping behavior during policy optimization.
Centralized Loss Aggregation Configuration: Updated the AlgorithmConfig to include a global loss_agg_mode setting, which can be overridden by specific policy loss function arguments, streamlining configuration management for loss aggregation.

Using Gemini Code Assist

The full guide for Gemini Code Assist can be found on our documentation page, here are some quick tips.

Invoking Gemini

You can request assistance from Gemini at any point by creating a comment using either /gemini <command> or @gemini-code-assist <command>. Below is a summary of the supported commands on the current page.

Feature	Command	Description
Code Review	`/gemini review`	Performs a code review for the current pull request in its current state.
Pull Request Summary	`/gemini summary`	Provides a summary of the current pull request in its current state.
Comment	@gemini-code-assist	Responds in comments when explicitly tagged, both in pull request comments and review comments.
Help	`/gemini help`	Displays a list of available commands.

Customization

To customize Gemini Code Assist for GitHub experience, repository maintainers can create a configuration file and/or provide a custom code review style guide (such as PEP-8 for Python) by creating and adding files to a .gemini/ folder in the base of the repository. Detailed instructions can be found here.

Limitations & Feedback

Gemini Code Assist may make mistakes. Please leave feedback on any instances where its feedback is incorrect or counter productive. You can react with 👍 and 👎 on @gemini-code-assist comments. If you're interested in giving your feedback about your experience with Gemini Code Assist for Github and other Google products, sign up here.

You can also get AI-powered code generation, chat, as well as code reviews directly in the IDE at no cost with the Gemini Code Assist IDE Extension.

Review the Privacy Notices, Generative AI Prohibited Use Policy, Terms of Service, and learn how to configure Gemini Code Assist in GitHub here. Gemini can make mistakes, so double check it and use code with caution. ↩

gemini-code-assist

Code Review

This pull request introduces a configurable loss_agg_mode for KL and entropy losses, allowing for more flexible loss aggregation strategies. It also adds a new low_var_kl KL-divergence calculation method for improved stability. The PPO loss function is enhanced with an additional clipping mechanism for negative advantages, a technique known to improve performance.

The changes are well-implemented across the codebase, with corresponding updates to configurations and tests. I've made a couple of minor suggestions to improve code clarity and maintainability, such as removing a redundant .contiguous() call and improving type safety in the configuration checking logic. Overall, this is a solid contribution that enhances the flexibility and robustness of the training algorithms.

trinity/algorithm/kl_fn/kl_fn.py

trinity/common/config.py

pan-x-c · 2025-11-17T06:13:47Z

/unittest-module-algorithm

github-actions · 2025-11-17T06:15:29Z

Summary

Tests 📝	Passed ✅	Failed ❌	Skipped ⏭️	Other ❓	Flaky 🍂	Duration ⏱️
14	14	0	0	0	0	11.1s

Tests

Test Name	Status	Duration
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_batch_level_std_grpo	✅	41ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_batch_level_step_wise_grpo_advantage	✅	2ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_duplicate_grpo	✅	5ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_grpo_advantage	✅	3ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_grpo_correct_bias	✅	2ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_grpo_reward_std	✅	1ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_step_wise_grpo_advantage	✅	2ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_step_wise_grpo_with_std_threshold	✅	2ms
tests/algorithm/policy_loss_test.py::VerlPolicyLossTest::test_dpo_policy_loss	✅	2ms
tests/algorithm/policy_loss_test.py::VerlPolicyLossTest::test_gspo_policy_loss	✅	1ms
tests/algorithm/policy_loss_test.py::VerlPolicyLossTest::test_mix_policy_loss	✅	1ms
tests/algorithm/policy_loss_test.py::VerlPolicyLossTest::test_opmd_policy_loss	✅	1ms
tests/algorithm/policy_loss_test.py::VerlPolicyLossTest::test_ppo_policy_loss	✅	1ms
tests/algorithm/policy_loss_test.py::VerlPolicyLossTest::test_sft_policy_loss	✅	1ms

Github Test Reporter by CTRF 💚

trinity/trainer/verl/dp_actor.py

hiyuchang · 2025-11-18T07:03:13Z

/unittest-all

github-actions · 2025-11-18T08:10:50Z

Summary

Tests 📝	Passed ✅	Failed ❌	Skipped ⏭️	Other ❓	Flaky 🍂	Duration ⏱️
176	169	4	3	0	0	1h 5m

Failed Tests

Failed Tests ❌	Fail Message
❌ tests/trainer/trainer_test.py::TestTrainerCountdown_1_megatron::test_trainer	The test failed in the call phase due to an assertion error
❌ tests/trainer/trainer_test.py::TestFullyAsyncMode_2_megatron::test_fully_async_mode	The test failed in the call phase
❌ tests/trainer/trainer_test.py::TestTrainerCheckpointSave_1_megatron::test_trainer	The test failed in the call phase due to an assertion error
❌ tests/trainer/trainer_test.py::TestTrainerMIX::test_trainer	The test failed in the call phase due to an assertion error

Skipped

Tests	Status
tests/explorer/workflow_test.py::TestAgentScopeWorkflowAdapter::test_adapter	skipped ⏭️
tests/trainer/trainer_test.py::TestMultiModalGRPO::test_trainer	skipped ⏭️
tests/trainer/trainer_test.py::TestMultiModalSFT::test_trainer	skipped ⏭️

Tests

Test Name	Status	Duration
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_batch_level_std_grpo	✅	41ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_batch_level_step_wise_grpo_advantage	✅	2ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_duplicate_grpo	✅	5ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_grpo_advantage	✅	3ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_grpo_correct_bias	✅	2ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_grpo_reward_std	✅	1ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_step_wise_grpo_advantage	✅	2ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_step_wise_grpo_with_std_threshold	✅	2ms
tests/algorithm/policy_loss_test.py::VerlPolicyLossTest::test_dpo_policy_loss	✅	2ms
tests/algorithm/policy_loss_test.py::VerlPolicyLossTest::test_gspo_policy_loss	✅	1ms
tests/algorithm/policy_loss_test.py::VerlPolicyLossTest::test_mix_policy_loss	✅	1ms
tests/algorithm/policy_loss_test.py::VerlPolicyLossTest::test_opmd_policy_loss	✅	1ms
tests/algorithm/policy_loss_test.py::VerlPolicyLossTest::test_ppo_policy_loss	✅	1ms
tests/algorithm/policy_loss_test.py::VerlPolicyLossTest::test_sft_policy_loss	✅	1ms
tests/buffer/experience_pipeline_test.py::TestExperiencePipeline::test_experience_pipeline	✅	19.8s
tests/buffer/experience_pipeline_test.py::TestExperiencePipeline::test_pass_rate_calculation	✅	15.4s
tests/buffer/experience_storage_test.py::ExperienceStorageTest::test_sql_experience_buffer	✅	3.9s
tests/buffer/experience_storage_test.py::ExperienceStorageTest::test_sql_storage_0_sft	✅	6.1s
tests/buffer/experience_storage_test.py::ExperienceStorageTest::test_sql_storage_1_dpo	✅	6.7s
tests/buffer/file_test.py::TestFileBuffer::test_file_reader	✅	157ms
tests/buffer/file_test.py::TestFileBuffer::test_file_writer	✅	4.2s
tests/buffer/formatter_test.py::TestFormatter::test_dpo_messages_formatter	✅	531ms
tests/buffer/formatter_test.py::TestFormatter::test_dpo_plaintext_formatter	✅	479ms
tests/buffer/formatter_test.py::TestFormatter::test_multi_modal_sft_formatter	✅	805ms
tests/buffer/formatter_test.py::TestFormatter::test_sft_messages_formatter	✅	982ms
tests/buffer/formatter_test.py::TestFormatter::test_sft_plaintext_formatter	✅	725ms
tests/buffer/formatter_test.py::TestFormatter::test_task_formatter	✅	223ms
tests/buffer/queue_test.py::TestQueueBuffer::test_priority_queue_buffer_reuse	✅	8.9s
tests/buffer/queue_test.py::TestQueueBuffer::test_priority_queue_capacity	✅	4.9s
tests/buffer/queue_test.py::TestQueueBuffer::test_priority_queue_reuse_count_control	✅	6.9s
tests/buffer/queue_test.py::TestQueueBuffer::test_queue_buffer_0_queue	✅	5.8s
tests/buffer/queue_test.py::TestQueueBuffer::test_queue_buffer_1_priority_queue	✅	5.6s
tests/buffer/queue_test.py::TestQueueBuffer::test_queue_buffer_capacity	✅	6.6s
tests/buffer/reward_shaping_mapper_test.py::TestRewardShapingMapper::test_basic_usage	✅	6ms
tests/buffer/sql_test.py::TestSQLBuffer::test_sql_buffer_read_write	✅	4.5s
tests/buffer/task_scheduler_test.py::TestTaskScheduler::test_task_scheduler_0	✅	87ms
tests/buffer/task_scheduler_test.py::TestTaskScheduler::test_task_scheduler_1	✅	67ms
tests/buffer/task_scheduler_test.py::TestTaskScheduler::test_task_scheduler_2	✅	105ms
tests/buffer/task_scheduler_test.py::TestTaskScheduler::test_task_scheduler_3	✅	106ms
tests/buffer/task_scheduler_test.py::TestTaskScheduler::test_task_scheduler_4	✅	107ms
tests/buffer/task_scheduler_test.py::TestTaskScheduler::test_task_scheduler_5	✅	111ms
tests/buffer/task_scheduler_test.py::TestTaskScheduler::test_task_scheduler_6	✅	128ms
tests/buffer/task_storage_test.py::TaskStorageTest::test_read_task_0	✅	67ms
tests/buffer/task_storage_test.py::TaskStorageTest::test_read_task_1	✅	4.0s
tests/buffer/task_storage_test.py::TaskStorageTest::test_read_task_2	✅	48ms
tests/buffer/task_storage_test.py::TaskStorageTest::test_read_task_3	✅	3.8s
tests/buffer/task_storage_test.py::TaskStorageTest::test_read_task_4	✅	48ms
tests/buffer/task_storage_test.py::TaskStorageTest::test_read_task_5	✅	4.4s
tests/cli/launcher_test.py::TestLauncherMain::test_debug_mode	✅	46.0s
tests/cli/launcher_test.py::TestLauncherMain::test_main_run_command	✅	7.4s
tests/cli/launcher_test.py::TestLauncherMain::test_main_run_in_dlc	✅	1.4s
tests/cli/launcher_test.py::TestLauncherMain::test_main_studio_command	✅	313ms
tests/cli/launcher_test.py::TestLauncherMain::test_multi_stage_run	✅	1.7s
tests/common/config_test.py::TestConfig::test_all_examples_are_valid	✅	33.0s
tests/common/config_test.py::TestConfig::test_config_flatten	✅	39ms
tests/common/config_test.py::TestConfig::test_continue_from_checkpoint_is_valid	✅	188ms
tests/common/config_test.py::TestConfig::test_default_workflow	✅	88ms
tests/common/config_test.py::TestConfig::test_load_default_config	✅	3.3s
tests/common/config_test.py::TestConfig::test_max_token_len_per_gpu_set_correctly	✅	90ms
tests/common/config_test.py::TestConfig::test_optimizer_config_propagation	✅	90ms
tests/common/config_test.py::TestConfig::test_update_config_from_ray_cluster	✅	155ms
tests/common/experience_test.py::TestEID::test_eid_properties	✅	1ms
tests/common/experience_test.py::TestExperience::test_action_mask_and_logprobs_type	✅	1ms
tests/common/experience_test.py::TestExperience::test_assertions	✅	1ms
tests/common/experience_test.py::TestExperience::test_dpo_experience	✅	1ms
tests/common/experience_test.py::TestExperience::test_gather	✅	1ms
tests/common/experience_test.py::TestExperience::test_hf_datasets_conversion	✅	15ms
tests/common/experience_test.py::TestExperience::test_multi_turn_experience	✅	1ms
tests/common/experience_test.py::TestExperience::test_serialize_deserialize	✅	1ms
tests/common/experience_test.py::TestExperience::test_single_turn_experience	✅	1ms
tests/common/experience_test.py::TestExperience::test_to_dict	✅	1ms
tests/common/experience_test.py::TestExperienceConversion::test_batch_conversion	✅	1ms
tests/common/experience_test.py::TestExperienceConversion::test_dpo_experience_batch_conversion	✅	1ms
tests/common/experience_test.py::TestExperienceConversion::test_experience_model_experience_conversion	✅	1ms
tests/common/experience_test.py::TestExperienceConversion::test_gather_experiences_with_custom_fields	✅	1ms
tests/common/experience_test.py::TestExperienceConversion::test_multiturn_experience_batch_converstion	✅	1ms
tests/common/vllm_test.py::ModelWrapperTest_0::test_generate	✅	51.1s
tests/common/vllm_test.py::ModelWrapperTest_1::test_generate	✅	32.0s
tests/common/vllm_test.py::ModelWrapperTest_2::test_generate	✅	43.0s
tests/common/vllm_test.py::TestModelLen_0::test_model_len	✅	17.5s
tests/common/vllm_test.py::TestModelLen_1::test_model_len	✅	17.2s
tests/common/vllm_test.py::TestAPIServer::test_api	✅	22.8s
tests/common/vllm_test.py::TestLogprobs::test_logprobs	✅	19.2s
tests/common/vllm_test.py::TestAsyncAPIServer::test_api_async	✅	22.8s
tests/common/vllm_test.py::TestTokenizer::test_action_mask	✅	255ms
tests/common/vllm_test.py::TestTokenizer::test_action_mask_with_tools	✅	234ms
tests/common/vllm_test.py::TestAPIServerToolCall_0_deepseek_r1::test_api_tool_calls	✅	19.8s
tests/common/vllm_test.py::TestAPIServerToolCall_1::test_api_tool_calls	✅	17.8s
tests/explorer/explorer_test.py::TestExplorerCountdownEval::test_explorer	✅	1m 13s
tests/explorer/explorer_test.py::TestExplorerGSM8KRULERNoEval::test_explorer	✅	1m 43s
tests/explorer/explorer_test.py::TestExplorerGSM8k::test_explorer	✅	3m 38s
tests/explorer/explorer_test.py::ServeTest::test_serve	✅	1m 21s
tests/explorer/scheduler_test.py::SchedulerTest::test_async_workflow	✅	12.5s
tests/explorer/scheduler_test.py::SchedulerTest::test_concurrent_operations	✅	12.3s
tests/explorer/scheduler_test.py::SchedulerTest::test_get_results	✅	30.7s
tests/explorer/scheduler_test.py::SchedulerTest::test_multi_step_execution	✅	12.7s
tests/explorer/scheduler_test.py::SchedulerTest::test_non_repeatable_workflow	✅	12.7s
tests/explorer/scheduler_test.py::SchedulerTest::test_scheduler_all_methods	✅	22.8s
tests/explorer/scheduler_test.py::SchedulerTest::test_scheduler_restart_after_stop	✅	23.9s
tests/explorer/scheduler_test.py::SchedulerTest::test_split_tasks	✅	15.5s
tests/explorer/scheduler_test.py::SchedulerTest::test_stepwise_experience_eid	✅	12.8s
tests/explorer/scheduler_test.py::SchedulerTest::test_wait_all	✅	15.5s
tests/explorer/scheduler_test.py::SchedulerTest::test_wait_all_timeout_with_multi_batch	✅	21.2s
tests/explorer/step_wise_workflow_test.py::WorkflowTest::test_reward_propagation_workflow_0	✅	2ms
tests/explorer/step_wise_workflow_test.py::WorkflowTest::test_reward_propagation_workflow_1	✅	602ms
tests/explorer/step_wise_workflow_test.py::WorkflowTest::test_step_wise_reward_workflow_0	✅	1ms
tests/explorer/step_wise_workflow_test.py::WorkflowTest::test_step_wise_reward_workflow_1	✅	1.0s
tests/explorer/step_wise_workflow_test.py::WorkflowTest::test_workflows_raise_error	✅	1ms
tests/explorer/step_wise_workflow_test.py::WorkflowTest::test_workflows_stop_at_max_env_steps	✅	1.0s
tests/explorer/workflow_test.py::WorkflowTest::test_gsm8k_workflow	✅	16ms
tests/explorer/workflow_test.py::WorkflowTest::test_math_boxed_workflow	✅	32ms
tests/explorer/workflow_test.py::WorkflowTest::test_math_complex_workflow	✅	276ms
tests/explorer/workflow_test.py::WorkflowTest::test_math_eval_workflow	✅	4ms
tests/explorer/workflow_test.py::WorkflowTest::test_math_fraction_workflow	✅	17ms
tests/explorer/workflow_test.py::WorkflowTest::test_math_workflow	✅	10ms
tests/explorer/workflow_test.py::WorkflowTest::test_rm_gallery_workflow	✅	78ms
tests/explorer/workflow_test.py::WorkflowTest::test_workflow_repeatable_0	✅	1ms
tests/explorer/workflow_test.py::WorkflowTest::test_workflow_repeatable_1	✅	101ms
tests/explorer/workflow_test.py::WorkflowTest::test_workflow_resettable_0	✅	1ms
tests/explorer/workflow_test.py::WorkflowTest::test_workflow_resettable_1	✅	201ms
tests/explorer/workflow_test.py::MultiTurnWorkflowTest_0::test_multi_turn_workflow	✅	14.5s
tests/explorer/workflow_test.py::MultiTurnWorkflowTest_1::test_multi_turn_workflow	✅	14.6s
tests/explorer/workflow_test.py::TestAgentScopeWorkflowAdapter::test_adapter	⏭️	1ms
tests/explorer/workflow_test.py::TestWorkflowRunner::test_workflow_runner	✅	297ms
tests/manager/synchronizer_test.py::TestSynchronizerExit::test_synchronizer	✅	59.8s
tests/manager/synchronizer_test.py::TestStateDictBasedSynchronizer_0::test_synchronizer	✅	1m 45s
tests/manager/synchronizer_test.py::TestStateDictBasedSynchronizer_1::test_synchronizer	✅	1m 45s
tests/manager/synchronizer_test.py::TestStateDictBasedSynchronizer_2::test_synchronizer	✅	2m 30s
tests/manager/synchronizer_test.py::TestStateDictBasedSynchronizer_3::test_synchronizer	✅	2m 26s
tests/manager/synchronizer_test.py::TestNCCLBasedSynchronizer_0::test_synchronizer	✅	1m 45s
tests/manager/synchronizer_test.py::TestNCCLBasedSynchronizer_1::test_synchronizer	✅	1m 45s
tests/service/data_juicer_test.py::TestDataJuicer::test_config	✅	824ms
tests/service/data_juicer_test.py::TestDataJuicer::test_server_start	✅	21.6s
tests/service/data_juicer_test.py::TestDataJuicerExperiencePipeline::test_data_juicer_operators	✅	31.0s
tests/service/data_juicer_test.py::TestDataJuicerTaskPipeline::test_data_juicer_task_pipeline	✅	14.4s
tests/trainer/trainer_test.py::TestTrainerCountdown_0_fsdp::test_trainer	✅	3m 3s
tests/trainer/trainer_test.py::TestTrainerCountdown_1_megatron::test_trainer	❌	2m
tests/trainer/trainer_test.py::TestStepAheadAsyncRL::test_trainer	✅	1m 21s
tests/trainer/trainer_test.py::TestTrainerGSM8K_0_fsdp::test_trainer	✅	1m 21s
tests/trainer/trainer_test.py::TestTrainerGSM8K_1_fsdp2::test_trainer	✅	1m 20s
tests/trainer/trainer_test.py::TestTrainerGSM8K_2_fsdp::test_trainer	✅	1m 20s
tests/trainer/trainer_test.py::TestTrainerGSM8K_3_fsdp2::test_trainer	✅	1m 31s
tests/trainer/trainer_test.py::TestTrainerSFTWarmupGSM8K::test_trainer	✅	2m 26s
tests/trainer/trainer_test.py::TestTrainerDPO::test_trainer	✅	1m 2s
tests/trainer/trainer_test.py::TestTrainerSFT::test_trainer	✅	57.3s
tests/trainer/trainer_test.py::TestTrainerToolsSFT::test_trainer_tools	✅	57.5s
tests/trainer/trainer_test.py::TestFullyAsyncMode_0_fsdp::test_fully_async_mode	✅	1m 51s
tests/trainer/trainer_test.py::TestFullyAsyncMode_1_fsdp::test_fully_async_mode	✅	1m 53s
tests/trainer/trainer_test.py::TestFullyAsyncMode_2_megatron::test_fully_async_mode	❌	2m 13s
tests/trainer/trainer_test.py::TestTrainerCheckpointSave_0_fsdp::test_trainer	✅	2m 19s
tests/trainer/trainer_test.py::TestTrainerCheckpointSave_1_megatron::test_trainer	❌	2m
tests/trainer/trainer_test.py::TestTrainerMIX::test_trainer	❌	1.2s
tests/trainer/trainer_test.py::TestMultiModalGRPO::test_trainer	⏭️	811ms
tests/trainer/trainer_test.py::TestMultiModalSFT::test_trainer	⏭️	810ms
tests/trainer/trainer_test.py::TestTrainerLoRA::test_trainer	✅	2m 57s
tests/utils/eval_utils_test.py::TestComputeScore::test_both_boxed_and_equivalent	✅	15ms
tests/utils/eval_utils_test.py::TestComputeScore::test_both_boxed_and_not_equivalent	✅	1ms
tests/utils/eval_utils_test.py::TestComputeScore::test_empty_ground_truth	✅	2ms
tests/utils/eval_utils_test.py::TestComputeScore::test_empty_solution_string	✅	1ms
tests/utils/eval_utils_test.py::TestComputeScore::test_multiple_boxed_answers_in_solution	✅	2ms
tests/utils/eval_utils_test.py::TestComputeScore::test_solution_boxed_truth_raw_and_equivalent	✅	1ms
tests/utils/eval_utils_test.py::TestComputeScore::test_solution_boxed_truth_raw_and_not_equivalent	✅	1ms
tests/utils/eval_utils_test.py::TestComputeScore::test_solution_not_boxed	✅	1ms
tests/utils/eval_utils_test.py::TestComputeScore::test_solution_raw_and_ground_truth_boxed_equivalent	✅	1ms
tests/utils/eval_utils_test.py::TestMathEvalUtils::test_extract_answer	✅	4ms
tests/utils/eval_utils_test.py::TestMathEvalUtils::test_verify_math_answer	✅	74ms
tests/utils/eval_utils_test.py::TestEvalUtils::test_is_equiv	✅	6ms
tests/utils/log_test.py::LogTest::test_actor_log	✅	5.1s
tests/utils/log_test.py::LogTest::test_group_by_node	✅	4.9s
tests/utils/log_test.py::LogTest::test_no_actor_log	✅	903ms
tests/utils/plugin_test.py::TestPluginLoader::test_load_plugins_local_0__workspace_tests_utils_plugins	✅	94ms
tests/utils/plugin_test.py::TestPluginLoader::test_load_plugins_local_1_tests_utils_plugins	✅	92ms
tests/utils/plugin_test.py::TestPluginLoader::test_load_plugins_remote_0__workspace_tests_utils_plugins	✅	22.2s
tests/utils/plugin_test.py::TestPluginLoader::test_load_plugins_remote_1_tests_utils_plugins	✅	21.9s
tests/utils/plugin_test.py::TestPluginLoader::test_passing_custom_class_0__workspace_tests_utils_plugins	✅	12.0s
tests/utils/plugin_test.py::TestPluginLoader::test_passing_custom_class_1_tests_utils_plugins	✅	11.6s

Github Test Reporter by CTRF 💚

pan-x-c · 2025-11-18T13:26:28Z

/unittest-all

github-actions · 2025-11-18T14:42:31Z

Summary

Tests 📝	Passed ✅	Failed ❌	Skipped ⏭️	Other ❓	Flaky 🍂	Duration ⏱️
176	173	0	3	0	0	1h 14m

Skipped

Tests	Status
tests/explorer/workflow_test.py::TestAgentScopeWorkflowAdapter::test_adapter	skipped ⏭️
tests/trainer/trainer_test.py::TestMultiModalGRPO::test_trainer	skipped ⏭️
tests/trainer/trainer_test.py::TestMultiModalSFT::test_trainer	skipped ⏭️

Tests

Test Name	Status	Duration
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_batch_level_std_grpo	✅	41ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_batch_level_step_wise_grpo_advantage	✅	2ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_duplicate_grpo	✅	5ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_grpo_advantage	✅	3ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_grpo_correct_bias	✅	2ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_grpo_reward_std	✅	1ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_step_wise_grpo_advantage	✅	2ms
tests/algorithm/advantage_fn_test.py::TestGroupedAdvantageFn::test_step_wise_grpo_with_std_threshold	✅	2ms
tests/algorithm/policy_loss_test.py::VerlPolicyLossTest::test_dpo_policy_loss	✅	2ms
tests/algorithm/policy_loss_test.py::VerlPolicyLossTest::test_gspo_policy_loss	✅	1ms
tests/algorithm/policy_loss_test.py::VerlPolicyLossTest::test_mix_policy_loss	✅	1ms
tests/algorithm/policy_loss_test.py::VerlPolicyLossTest::test_opmd_policy_loss	✅	1ms
tests/algorithm/policy_loss_test.py::VerlPolicyLossTest::test_ppo_policy_loss	✅	1ms
tests/algorithm/policy_loss_test.py::VerlPolicyLossTest::test_sft_policy_loss	✅	1ms
tests/buffer/experience_pipeline_test.py::TestExperiencePipeline::test_experience_pipeline	✅	19.3s
tests/buffer/experience_pipeline_test.py::TestExperiencePipeline::test_pass_rate_calculation	✅	15.3s
tests/buffer/experience_storage_test.py::ExperienceStorageTest::test_sql_experience_buffer	✅	4.2s
tests/buffer/experience_storage_test.py::ExperienceStorageTest::test_sql_storage_0_sft	✅	6.0s
tests/buffer/experience_storage_test.py::ExperienceStorageTest::test_sql_storage_1_dpo	✅	6.4s
tests/buffer/file_test.py::TestFileBuffer::test_file_reader	✅	154ms
tests/buffer/file_test.py::TestFileBuffer::test_file_writer	✅	4.2s
tests/buffer/formatter_test.py::TestFormatter::test_dpo_messages_formatter	✅	524ms
tests/buffer/formatter_test.py::TestFormatter::test_dpo_plaintext_formatter	✅	477ms
tests/buffer/formatter_test.py::TestFormatter::test_multi_modal_sft_formatter	✅	796ms
tests/buffer/formatter_test.py::TestFormatter::test_sft_messages_formatter	✅	972ms
tests/buffer/formatter_test.py::TestFormatter::test_sft_plaintext_formatter	✅	713ms
tests/buffer/formatter_test.py::TestFormatter::test_task_formatter	✅	219ms
tests/buffer/queue_test.py::TestQueueBuffer::test_priority_queue_buffer_reuse	✅	8.7s
tests/buffer/queue_test.py::TestQueueBuffer::test_priority_queue_capacity	✅	4.7s
tests/buffer/queue_test.py::TestQueueBuffer::test_priority_queue_reuse_count_control	✅	6.7s
tests/buffer/queue_test.py::TestQueueBuffer::test_queue_buffer_0_queue	✅	5.6s
tests/buffer/queue_test.py::TestQueueBuffer::test_queue_buffer_1_priority_queue	✅	5.8s
tests/buffer/queue_test.py::TestQueueBuffer::test_queue_buffer_capacity	✅	6.3s
tests/buffer/reward_shaping_mapper_test.py::TestRewardShapingMapper::test_basic_usage	✅	6ms
tests/buffer/sql_test.py::TestSQLBuffer::test_sql_buffer_read_write	✅	4.5s
tests/buffer/task_scheduler_test.py::TestTaskScheduler::test_task_scheduler_0	✅	86ms
tests/buffer/task_scheduler_test.py::TestTaskScheduler::test_task_scheduler_1	✅	70ms
tests/buffer/task_scheduler_test.py::TestTaskScheduler::test_task_scheduler_2	✅	105ms
tests/buffer/task_scheduler_test.py::TestTaskScheduler::test_task_scheduler_3	✅	106ms
tests/buffer/task_scheduler_test.py::TestTaskScheduler::test_task_scheduler_4	✅	106ms
tests/buffer/task_scheduler_test.py::TestTaskScheduler::test_task_scheduler_5	✅	111ms
tests/buffer/task_scheduler_test.py::TestTaskScheduler::test_task_scheduler_6	✅	127ms
tests/buffer/task_storage_test.py::TaskStorageTest::test_read_task_0	✅	67ms
tests/buffer/task_storage_test.py::TaskStorageTest::test_read_task_1	✅	4.1s
tests/buffer/task_storage_test.py::TaskStorageTest::test_read_task_2	✅	48ms
tests/buffer/task_storage_test.py::TaskStorageTest::test_read_task_3	✅	4.0s
tests/buffer/task_storage_test.py::TaskStorageTest::test_read_task_4	✅	48ms
tests/buffer/task_storage_test.py::TaskStorageTest::test_read_task_5	✅	4.4s
tests/cli/launcher_test.py::TestLauncherMain::test_debug_mode	✅	46.2s
tests/cli/launcher_test.py::TestLauncherMain::test_main_run_command	✅	7.1s
tests/cli/launcher_test.py::TestLauncherMain::test_main_run_in_dlc	✅	1.4s
tests/cli/launcher_test.py::TestLauncherMain::test_main_studio_command	✅	310ms
tests/cli/launcher_test.py::TestLauncherMain::test_multi_stage_run	✅	1.7s
tests/common/config_test.py::TestConfig::test_all_examples_are_valid	✅	33.0s
tests/common/config_test.py::TestConfig::test_config_flatten	✅	39ms
tests/common/config_test.py::TestConfig::test_continue_from_checkpoint_is_valid	✅	185ms
tests/common/config_test.py::TestConfig::test_default_workflow	✅	87ms
tests/common/config_test.py::TestConfig::test_load_default_config	✅	3.7s
tests/common/config_test.py::TestConfig::test_max_token_len_per_gpu_set_correctly	✅	91ms
tests/common/config_test.py::TestConfig::test_optimizer_config_propagation	✅	88ms
tests/common/config_test.py::TestConfig::test_update_config_from_ray_cluster	✅	354ms
tests/common/experience_test.py::TestEID::test_eid_properties	✅	1ms
tests/common/experience_test.py::TestExperience::test_action_mask_and_logprobs_type	✅	1ms
tests/common/experience_test.py::TestExperience::test_assertions	✅	1ms
tests/common/experience_test.py::TestExperience::test_dpo_experience	✅	1ms
tests/common/experience_test.py::TestExperience::test_gather	✅	1ms
tests/common/experience_test.py::TestExperience::test_hf_datasets_conversion	✅	15ms
tests/common/experience_test.py::TestExperience::test_multi_turn_experience	✅	1ms
tests/common/experience_test.py::TestExperience::test_serialize_deserialize	✅	1ms
tests/common/experience_test.py::TestExperience::test_single_turn_experience	✅	1ms
tests/common/experience_test.py::TestExperience::test_to_dict	✅	1ms
tests/common/experience_test.py::TestExperienceConversion::test_batch_conversion	✅	1ms
tests/common/experience_test.py::TestExperienceConversion::test_dpo_experience_batch_conversion	✅	1ms
tests/common/experience_test.py::TestExperienceConversion::test_experience_model_experience_conversion	✅	1ms
tests/common/experience_test.py::TestExperienceConversion::test_gather_experiences_with_custom_fields	✅	2ms
tests/common/experience_test.py::TestExperienceConversion::test_multiturn_experience_batch_converstion	✅	1ms
tests/common/vllm_test.py::ModelWrapperTest_0::test_generate	✅	51.4s
tests/common/vllm_test.py::ModelWrapperTest_1::test_generate	✅	31.7s
tests/common/vllm_test.py::ModelWrapperTest_2::test_generate	✅	43.4s
tests/common/vllm_test.py::TestModelLen_0::test_model_len	✅	17.0s
tests/common/vllm_test.py::TestModelLen_1::test_model_len	✅	17.6s
tests/common/vllm_test.py::TestAPIServer::test_api	✅	22.6s
tests/common/vllm_test.py::TestLogprobs::test_logprobs	✅	18.9s
tests/common/vllm_test.py::TestAsyncAPIServer::test_api_async	✅	22.6s
tests/common/vllm_test.py::TestTokenizer::test_action_mask	✅	258ms
tests/common/vllm_test.py::TestTokenizer::test_action_mask_with_tools	✅	228ms
tests/common/vllm_test.py::TestAPIServerToolCall_0_deepseek_r1::test_api_tool_calls	✅	19.5s
tests/common/vllm_test.py::TestAPIServerToolCall_1::test_api_tool_calls	✅	17.5s
tests/explorer/explorer_test.py::TestExplorerCountdownEval::test_explorer	✅	1m 15s
tests/explorer/explorer_test.py::TestExplorerGSM8KRULERNoEval::test_explorer	✅	1m 41s
tests/explorer/explorer_test.py::TestExplorerGSM8k::test_explorer	✅	3m 37s
tests/explorer/explorer_test.py::ServeTest::test_serve	✅	1m 22s
tests/explorer/scheduler_test.py::SchedulerTest::test_async_workflow	✅	12.5s
tests/explorer/scheduler_test.py::SchedulerTest::test_concurrent_operations	✅	12.3s
tests/explorer/scheduler_test.py::SchedulerTest::test_get_results	✅	30.4s
tests/explorer/scheduler_test.py::SchedulerTest::test_multi_step_execution	✅	12.5s
tests/explorer/scheduler_test.py::SchedulerTest::test_non_repeatable_workflow	✅	12.3s
tests/explorer/scheduler_test.py::SchedulerTest::test_scheduler_all_methods	✅	22.5s
tests/explorer/scheduler_test.py::SchedulerTest::test_scheduler_restart_after_stop	✅	23.9s
tests/explorer/scheduler_test.py::SchedulerTest::test_split_tasks	✅	15.8s
tests/explorer/scheduler_test.py::SchedulerTest::test_stepwise_experience_eid	✅	12.5s
tests/explorer/scheduler_test.py::SchedulerTest::test_wait_all	✅	15.3s
tests/explorer/scheduler_test.py::SchedulerTest::test_wait_all_timeout_with_multi_batch	✅	21.1s
tests/explorer/step_wise_workflow_test.py::WorkflowTest::test_reward_propagation_workflow_0	✅	2ms
tests/explorer/step_wise_workflow_test.py::WorkflowTest::test_reward_propagation_workflow_1	✅	602ms
tests/explorer/step_wise_workflow_test.py::WorkflowTest::test_step_wise_reward_workflow_0	✅	1ms
tests/explorer/step_wise_workflow_test.py::WorkflowTest::test_step_wise_reward_workflow_1	✅	1.0s
tests/explorer/step_wise_workflow_test.py::WorkflowTest::test_workflows_raise_error	✅	1ms
tests/explorer/step_wise_workflow_test.py::WorkflowTest::test_workflows_stop_at_max_env_steps	✅	1.0s
tests/explorer/workflow_test.py::WorkflowTest::test_gsm8k_workflow	✅	15ms
tests/explorer/workflow_test.py::WorkflowTest::test_math_boxed_workflow	✅	24ms
tests/explorer/workflow_test.py::WorkflowTest::test_math_complex_workflow	✅	269ms
tests/explorer/workflow_test.py::WorkflowTest::test_math_eval_workflow	✅	4ms
tests/explorer/workflow_test.py::WorkflowTest::test_math_fraction_workflow	✅	17ms
tests/explorer/workflow_test.py::WorkflowTest::test_math_workflow	✅	10ms
tests/explorer/workflow_test.py::WorkflowTest::test_rm_gallery_workflow	✅	79ms
tests/explorer/workflow_test.py::WorkflowTest::test_workflow_repeatable_0	✅	1ms
tests/explorer/workflow_test.py::WorkflowTest::test_workflow_repeatable_1	✅	101ms
tests/explorer/workflow_test.py::WorkflowTest::test_workflow_resettable_0	✅	1ms
tests/explorer/workflow_test.py::WorkflowTest::test_workflow_resettable_1	✅	201ms
tests/explorer/workflow_test.py::MultiTurnWorkflowTest_0::test_multi_turn_workflow	✅	14.5s
tests/explorer/workflow_test.py::MultiTurnWorkflowTest_1::test_multi_turn_workflow	✅	15.0s
tests/explorer/workflow_test.py::TestAgentScopeWorkflowAdapter::test_adapter	⏭️	1ms
tests/explorer/workflow_test.py::TestWorkflowRunner::test_workflow_runner	✅	296ms
tests/manager/synchronizer_test.py::TestSynchronizerExit::test_synchronizer	✅	58.7s
tests/manager/synchronizer_test.py::TestStateDictBasedSynchronizer_0::test_synchronizer	✅	1m 44s
tests/manager/synchronizer_test.py::TestStateDictBasedSynchronizer_1::test_synchronizer	✅	1m 46s
tests/manager/synchronizer_test.py::TestStateDictBasedSynchronizer_2::test_synchronizer	✅	2m 28s
tests/manager/synchronizer_test.py::TestStateDictBasedSynchronizer_3::test_synchronizer	✅	2m 31s
tests/manager/synchronizer_test.py::TestNCCLBasedSynchronizer_0::test_synchronizer	✅	1m 44s
tests/manager/synchronizer_test.py::TestNCCLBasedSynchronizer_1::test_synchronizer	✅	1m 44s
tests/service/data_juicer_test.py::TestDataJuicer::test_config	✅	811ms
tests/service/data_juicer_test.py::TestDataJuicer::test_server_start	✅	21.6s
tests/service/data_juicer_test.py::TestDataJuicerExperiencePipeline::test_data_juicer_operators	✅	30.7s
tests/service/data_juicer_test.py::TestDataJuicerTaskPipeline::test_data_juicer_task_pipeline	✅	14.5s
tests/trainer/trainer_test.py::TestTrainerCountdown_0_fsdp::test_trainer	✅	2m 58s
tests/trainer/trainer_test.py::TestTrainerCountdown_1_megatron::test_trainer	✅	5m 2s
tests/trainer/trainer_test.py::TestStepAheadAsyncRL::test_trainer	✅	1m 30s
tests/trainer/trainer_test.py::TestTrainerGSM8K_0_fsdp::test_trainer	✅	1m 18s
tests/trainer/trainer_test.py::TestTrainerGSM8K_1_fsdp2::test_trainer	✅	1m 20s
tests/trainer/trainer_test.py::TestTrainerGSM8K_2_fsdp::test_trainer	✅	1m 19s
tests/trainer/trainer_test.py::TestTrainerGSM8K_3_fsdp2::test_trainer	✅	1m 30s
tests/trainer/trainer_test.py::TestTrainerSFTWarmupGSM8K::test_trainer	✅	2m 30s
tests/trainer/trainer_test.py::TestTrainerDPO::test_trainer	✅	1m
tests/trainer/trainer_test.py::TestTrainerSFT::test_trainer	✅	58.0s
tests/trainer/trainer_test.py::TestTrainerToolsSFT::test_trainer_tools	✅	57.9s
tests/trainer/trainer_test.py::TestFullyAsyncMode_0_fsdp::test_fully_async_mode	✅	1m 50s
tests/trainer/trainer_test.py::TestFullyAsyncMode_1_fsdp::test_fully_async_mode	✅	1m 53s
tests/trainer/trainer_test.py::TestFullyAsyncMode_2_megatron::test_fully_async_mode	✅	2m 55s
tests/trainer/trainer_test.py::TestTrainerCheckpointSave_0_fsdp::test_trainer	✅	2m 6s
tests/trainer/trainer_test.py::TestTrainerCheckpointSave_1_megatron::test_trainer	✅	5m 27s
tests/trainer/trainer_test.py::TestTrainerMIX::test_trainer	✅	1m 24s
tests/trainer/trainer_test.py::TestMultiModalGRPO::test_trainer	⏭️	812ms
tests/trainer/trainer_test.py::TestMultiModalSFT::test_trainer	⏭️	809ms
tests/trainer/trainer_test.py::TestTrainerLoRA::test_trainer	✅	3m 8s
tests/utils/eval_utils_test.py::TestComputeScore::test_both_boxed_and_equivalent	✅	17ms
tests/utils/eval_utils_test.py::TestComputeScore::test_both_boxed_and_not_equivalent	✅	1ms
tests/utils/eval_utils_test.py::TestComputeScore::test_empty_ground_truth	✅	2ms
tests/utils/eval_utils_test.py::TestComputeScore::test_empty_solution_string	✅	1ms
tests/utils/eval_utils_test.py::TestComputeScore::test_multiple_boxed_answers_in_solution	✅	2ms
tests/utils/eval_utils_test.py::TestComputeScore::test_solution_boxed_truth_raw_and_equivalent	✅	1ms
tests/utils/eval_utils_test.py::TestComputeScore::test_solution_boxed_truth_raw_and_not_equivalent	✅	1ms
tests/utils/eval_utils_test.py::TestComputeScore::test_solution_not_boxed	✅	1ms
tests/utils/eval_utils_test.py::TestComputeScore::test_solution_raw_and_ground_truth_boxed_equivalent	✅	1ms
tests/utils/eval_utils_test.py::TestMathEvalUtils::test_extract_answer	✅	4ms
tests/utils/eval_utils_test.py::TestMathEvalUtils::test_verify_math_answer	✅	83ms
tests/utils/eval_utils_test.py::TestEvalUtils::test_is_equiv	✅	6ms
tests/utils/log_test.py::LogTest::test_actor_log	✅	5.0s
tests/utils/log_test.py::LogTest::test_group_by_node	✅	4.8s
tests/utils/log_test.py::LogTest::test_no_actor_log	✅	901ms
tests/utils/plugin_test.py::TestPluginLoader::test_load_plugins_local_0__workspace_tests_utils_plugins	✅	93ms
tests/utils/plugin_test.py::TestPluginLoader::test_load_plugins_local_1_tests_utils_plugins	✅	89ms
tests/utils/plugin_test.py::TestPluginLoader::test_load_plugins_remote_0__workspace_tests_utils_plugins	✅	22.4s
tests/utils/plugin_test.py::TestPluginLoader::test_load_plugins_remote_1_tests_utils_plugins	✅	22.2s
tests/utils/plugin_test.py::TestPluginLoader::test_passing_custom_class_0__workspace_tests_utils_plugins	✅	12.0s
tests/utils/plugin_test.py::TestPluginLoader::test_passing_custom_class_1_tests_utils_plugins	✅	11.6s

Github Test Reporter by CTRF 💚

fix loss agg mode

edb802e

gemini-code-assist bot reviewed Nov 17, 2025

View reviewed changes

trinity/algorithm/kl_fn/kl_fn.py Show resolved Hide resolved

trinity/common/config.py Show resolved Hide resolved

fix masked sum

142d7dc

hiyuchang reviewed Nov 17, 2025

View reviewed changes

trinity/trainer/verl/dp_actor.py Show resolved Hide resolved

fix comments

3e4a067

pan-x-c added 2 commits November 18, 2025 21:05

clean up space for doc

cad63a1

update megatron actor

016e66f

hiyuchang approved these changes Nov 19, 2025

View reviewed changes

hiyuchang merged commit d9d2135 into modelscope:main Nov 19, 2025
1 check passed

This was referenced Nov 27, 2025

[Feature]Add tis fall back for ppo_policy_loss #334

Closed

[Feature] Truncate based on the sign of advantage after clipping #340

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Add `loss_agg_mode` for kl and entropy_loss #388

Add `loss_agg_mode` for kl and entropy_loss #388

Uh oh!

pan-x-c commented Nov 17, 2025 •

edited

Loading

Uh oh!

gemini-code-assist bot commented Nov 17, 2025

Uh oh!

gemini-code-assist bot left a comment

Uh oh!

Uh oh!

Uh oh!

pan-x-c commented Nov 17, 2025

Uh oh!

github-actions bot commented Nov 17, 2025

Uh oh!

Uh oh!

hiyuchang commented Nov 18, 2025

Uh oh!

github-actions bot commented Nov 18, 2025

Uh oh!

pan-x-c commented Nov 18, 2025

Uh oh!

github-actions bot commented Nov 18, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Add loss_agg_mode for kl and entropy_loss #388

Add loss_agg_mode for kl and entropy_loss #388

Uh oh!

Conversation

pan-x-c commented Nov 17, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Description

Checklist

Uh oh!

gemini-code-assist bot commented Nov 17, 2025

Summary of Changes

Highlights

Footnotes

Uh oh!

gemini-code-assist bot left a comment

Choose a reason for hiding this comment

Code Review

Uh oh!

Uh oh!

Uh oh!

pan-x-c commented Nov 17, 2025

Uh oh!

github-actions bot commented Nov 17, 2025

Summary

Tests

Uh oh!

Uh oh!

hiyuchang commented Nov 18, 2025

Uh oh!

github-actions bot commented Nov 18, 2025

Summary

Failed Tests

Skipped

Tests

Uh oh!

pan-x-c commented Nov 18, 2025

Uh oh!

github-actions bot commented Nov 18, 2025

Summary

Skipped

Tests

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Add `loss_agg_mode` for kl and entropy_loss #388

Add `loss_agg_mode` for kl and entropy_loss #388

pan-x-c commented Nov 17, 2025 •

edited

Loading