dual lottery ticket hypothesis

parameter-efficient masking networks

boosting large language models with mask fine-tuning

rethinking fine-tuning: unlocking hidden capabilities in vision-language models